- 年份
- 2024(8887)
- 2023(12879)
- 2022(11390)
- 2021(10769)
- 2020(8944)
- 2019(20857)
- 2018(20682)
- 2017(40316)
- 2016(21588)
- 2015(24384)
- 2014(24204)
- 2013(23541)
- 2012(21182)
- 2011(18818)
- 2010(18375)
- 2009(16363)
- 2008(15490)
- 2007(13042)
- 2006(10950)
- 2005(8963)
- 学科
- 济(83277)
- 经济(83186)
- 管理(62427)
- 业(58542)
- 企(49761)
- 企业(49761)
- 方法(44196)
- 数学(38786)
- 数学方法(38158)
- 财(21196)
- 农(21095)
- 中国(19649)
- 业经(18211)
- 学(18049)
- 地方(15654)
- 理论(14998)
- 务(14272)
- 财务(14202)
- 农业(14201)
- 财务管理(14170)
- 贸(14100)
- 贸易(14094)
- 技术(13967)
- 易(13682)
- 和(13637)
- 企业财务(13410)
- 环境(13148)
- 制(12691)
- 划(11788)
- 教育(10946)
- 机构
- 大学(297954)
- 学院(295279)
- 管理(123584)
- 济(113339)
- 经济(110879)
- 理学(109052)
- 理学院(107900)
- 管理学(105766)
- 管理学院(105252)
- 研究(91573)
- 中国(65689)
- 京(62180)
- 科学(58505)
- 财(49980)
- 业大(45531)
- 农(44122)
- 所(43650)
- 中心(42633)
- 财经(41777)
- 研究所(40391)
- 江(39917)
- 范(39317)
- 师范(38961)
- 北京(38342)
- 经(38212)
- 农业(34651)
- 院(34217)
- 经济学(33569)
- 州(32851)
- 师范大学(31795)
- 基金
- 项目(216389)
- 科学(171076)
- 基金(158090)
- 研究(157752)
- 家(137341)
- 国家(136238)
- 科学基金(118602)
- 社会(98404)
- 社会科(93269)
- 社会科学(93245)
- 基金项目(84617)
- 省(84144)
- 自然(78914)
- 自然科(77114)
- 自然科学(77097)
- 自然科学基金(75670)
- 教育(73555)
- 划(71223)
- 资助(65170)
- 编号(64706)
- 成果(50534)
- 重点(47969)
- 部(47801)
- 创(45173)
- 发(44917)
- 课题(43507)
- 创新(42099)
- 科研(41999)
- 教育部(41309)
- 大学(40866)
- 期刊
- 济(112050)
- 经济(112050)
- 研究(80718)
- 中国(48993)
- 学报(46256)
- 管理(43165)
- 科学(42634)
- 农(38440)
- 财(37435)
- 大学(35709)
- 教育(34238)
- 学学(33563)
- 技术(27505)
- 农业(27417)
- 业经(19191)
- 融(19101)
- 金融(19101)
- 财经(19092)
- 经济研究(17857)
- 图书(16609)
- 经(16186)
- 科技(14833)
- 问题(14664)
- 理论(14519)
- 技术经济(14394)
- 实践(13577)
- 践(13577)
- 版(13500)
- 统计(13442)
- 业(13427)
共检索到400836条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
包翔 刘桂锋 杨国立
[目的/意义]为了满足对海量专利数据进行自动分类的需求,提出了一种基于多示例学习框架的专利文本分类方法。[方法/过程]将专利文本当作包,专利文本的标题和摘要分别作为两个示例,通过数学建模将专利文本映射成无向图,构建基于无向图的高斯核函数,运用SVM方法训练分类器,完成对无标记专利文本的预测。[结果/结论]实验结果表明,该方法相较于传统的SVM、KNN方法能更加有效准确地预测未标记专利文本的分类,为文本挖掘领域相关方向的研究提供新的视角。[局限]实验样本数量有待进一步丰富。
[期刊] 清华大学学报(自然科学版)
[作者]
任俊飞 朱桐 陈文亮
多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。
关键词:
多标签文本分类 不完全标注 自训练
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
[期刊] 情报理论与实践
[作者]
高影繁 徐红姣 于薇 王惠临
文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系统奠定了基础。
关键词:
文本分类 翻译词典 信息资源 算法
[期刊] 情报理论与实践
[作者]
缪建明 贾广威 张运良
随着我国专利申请数量的迅猛发展,对受理专利实现快速分类的需求也越来越迫切。作为专业性知识极强的科技文献,专利自动分类的正确率远高于普通文本的分类效果。基于专利摘要进行快速自动分类的方法,充分考虑专利类别的层次结构特性,建立不同层次的类别特征中心向量,采用经典的类中心向量分类算法实现专利的快速自动分类。实验结果表明:该方法在专利不同层次上的分类效果明显,时效性大大提高,能够满足专利快速分类的实际需求。
关键词:
文本分类 专利分类 自动分类
[期刊] 图书情报工作
[作者]
罗新 王兆礼 路永和
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要意义。文本分类的发展与模式识别的发展密切相关。文本分类具有的类目多、样本数目多、噪音多、各类别样本数目不均衡等特点,使各模式识别算法在应用于文本分类时存在许多缺点。近年来逐步发展起来的群集智能(Swarm Intelligence)理论和方法为文本分类提供一种新的智能化手段。将蚁群智能算法尝试性引入文本分类领域,构建基于蚁群智能的文本分类模型,并在文本数据集上进行测试和比较,结果表明该模型可以较好地应用于文本分类。
关键词:
文本分类 群集智能 蚁群智能算法
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 现代情报
[作者]
廖列法 勒孚刚 朱亚兰
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。
[期刊] 清华大学教育研究
[作者]
朱志勇 崔雪娟
近些年来录用研究生的用人单位对这些毕业生的能力提出诸多质疑,这引起了大学的反思。本研究从对中国研究生培养的政策文本入手,分析官方文件中规定的研究生需要培养的能力,基于对这些能力的编码分析以及研究者个人的反思和经验研究,建构出一个关于学术组织培养研究生的学术能力的理论框架,认为学术能力涉及与学科、研究以及实践三个维度相关的能力。本文也指出,在开放的学术组织的环境中,诸如学术文化、学术职业、学术理念等许多因素会对研究生产生影响,进而影响三个维度的学术能力的形成与发展。
关键词:
研究生 学术能力 学术组织
[期刊] 情报理论与实践
[作者]
伊惠芳 刘细文 龙艺璇
[目的/意义]关键技术问题研究对于辅助各创新主体把握创新突破方向、攻克关键核心技术、推进技术创新具有重要意义。[方法/过程]针对目前技术关键问题挖掘领域识别样本、流程、方法上的不足,提出多文本分析的领域关键技术问题挖掘框架,以专利说明书技术背景为主,综述性论文结束语和技术需求文档为辅,从数据获取及转化、技术问题提取、技术问题主题识别、关键技术问题发现4个环节展开分析。[结果/结论]对石墨烯领域案例研究证明了多文本分析的领域关键技术问题识别框架的有效性;专利说明书技术背景、综述论文结束语与技术需求文档在挖掘技术问题上的表现、描述极性、结果上具有不同的解释力度,可互相佐证补充。
[期刊] 情报理论与实践
[作者]
是沁 李阳 裴雷 韩旭
[目的/意义]针对专题数据库文本资源主题相近、语义相似度高、知识聚敛度高等特点,提出一种基于预训练模型与Blending集成学习策略的专题数据库文本分类模型。[方法/过程]选择BERT、ERNIE、RoBERTa、ALBERT、XLNet预训练模型提取专题文本的多层次特征,基于Blending集成学习方法组合预训练模型,爬取“新华丝路”专题数据库相关文本资源对集成学习模型的有效性与优越性进行验证。[结果/结论]结果显示,与单模型、传统集成学习方法相比,在专题数据库服务场景下,基于Blending集成学习的文本分类模型具有较高的分类性能。
[期刊] 图书情报工作
[作者]
张倩 刘怀亮
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能。通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器。经对比实验证明,这种方法能够获得较好的分类效果。
关键词:
半监督学习 短文本 图结构 自训练
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 当代经济科学
[作者]
李双燕 蒋丽华 卞舒晨
随着文本大数据分析的发展,非结构化数据的分析成为研究热点,这为理解公司违规行为提供了新的研究视角。以2009—2019年深沪A股非金融类上市公司为样本,通过机器学习的文本分析方法对11 040份上市公司年度财务报告中的“管理层讨论与分析”(MD&A)的文本情绪进行测度,研究文本情绪与公司违规行为的关系。研究发现:整体而言,MD&A文本情绪与公司的违规行为负相关。对MD&A细分后发现,展望部分文本情绪与上市公司违规行为的负相关性弱于经营情况概述部分。进一步研究发现,较高的信息透明度增强了文本情绪与上市公司违规的负相关关系。在控制内生性和调整了MD&A文本情绪值之后,主要结论仍然稳健。此外,研究MD&A文本情绪与不同违规类型的关系发现,与领导人违规相比,MD&A文本情绪与信息披露和经营类违规的相关性更显著。因此,上市公司和投资者都应该重视MD&A文本情绪的信息价值,监管部门应加强对上市公司信息披露的管控。
[期刊] 图书情报工作
[作者]
王文娟 马建霞 陈春 张凌波
[目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。
关键词:
引文文本分类 引文内容分析 引文分析
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除