- 年份
- 2024(7527)
- 2023(10877)
- 2022(9668)
- 2021(9145)
- 2020(7574)
- 2019(17497)
- 2018(17495)
- 2017(33879)
- 2016(18478)
- 2015(20671)
- 2014(20653)
- 2013(20466)
- 2012(18586)
- 2011(16849)
- 2010(16570)
- 2009(14734)
- 2008(14229)
- 2007(12267)
- 2006(10595)
- 2005(9210)
- 学科
- 济(75375)
- 经济(75298)
- 管理(51605)
- 业(47279)
- 企(39551)
- 企业(39551)
- 方法(35065)
- 数学(30405)
- 数学方法(30050)
- 中国(18937)
- 地方(18737)
- 农(18426)
- 财(17068)
- 学(16895)
- 业经(15973)
- 理论(12690)
- 农业(12626)
- 和(12563)
- 环境(12164)
- 贸(12147)
- 贸易(12141)
- 易(11720)
- 制(11534)
- 技术(11234)
- 务(10667)
- 地方经济(10662)
- 财务(10608)
- 财务管理(10590)
- 教育(10372)
- 划(10186)
- 机构
- 大学(258230)
- 学院(254809)
- 管理(104651)
- 济(98316)
- 经济(96066)
- 理学(91491)
- 理学院(90444)
- 管理学(88853)
- 管理学院(88388)
- 研究(85359)
- 中国(61550)
- 京(55431)
- 科学(54946)
- 财(43015)
- 所(42480)
- 研究所(39104)
- 农(38826)
- 业大(38590)
- 中心(38183)
- 江(35753)
- 范(35416)
- 师范(35124)
- 财经(35103)
- 北京(35066)
- 经(31996)
- 院(31593)
- 农业(30325)
- 州(29400)
- 师范大学(28759)
- 经济学(28517)
- 基金
- 项目(182535)
- 科学(143581)
- 研究(133770)
- 基金(132057)
- 家(115011)
- 国家(114061)
- 科学基金(98179)
- 社会(82855)
- 社会科(78490)
- 社会科学(78469)
- 省(71295)
- 基金项目(71089)
- 自然(64787)
- 自然科(63242)
- 自然科学(63229)
- 自然科学基金(62050)
- 教育(61025)
- 划(60404)
- 编号(55049)
- 资助(53946)
- 成果(44018)
- 重点(40784)
- 部(39933)
- 发(39228)
- 创(37772)
- 课题(37338)
- 创新(35181)
- 科研(35005)
- 项目编号(34124)
- 教育部(34077)
- 期刊
- 济(104932)
- 经济(104932)
- 研究(74370)
- 中国(45405)
- 学报(40973)
- 科学(37887)
- 管理(37184)
- 农(34316)
- 大学(30763)
- 教育(30625)
- 财(30458)
- 学学(28535)
- 农业(24510)
- 技术(22434)
- 融(18339)
- 金融(18339)
- 业经(17132)
- 图书(16448)
- 经济研究(16260)
- 财经(15885)
- 问题(13477)
- 经(13391)
- 理论(13270)
- 科技(13181)
- 资源(12547)
- 实践(12323)
- 践(12323)
- 技术经济(12246)
- 业(12156)
- 情报(11658)
共检索到362323条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
[期刊] 图书情报工作
[作者]
季培培 鄢小燕 岑咏华
领域中文术语识别与抽取是领域中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。在对领域术语的内涵和特征的阐述基础上,重点对领域中文术语识别与抽取的研究现状、主要的方法以及典型的应用进行综述,最后指出其未来的发展趋势。
关键词:
术语抽取 术语识别 领域中文信息处理
[期刊] 图书情报工作
[作者]
王文娟 马建霞 陈春 张凌波
[目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。
关键词:
引文文本分类 引文内容分析 引文分析
[期刊] 图书情报工作
[作者]
陈晓美 毕强
根据本体构成的要素———概念、概念间关系、公理,结合文本的非结构化特点,总结梳理当前从文本中自动获取领域本体概念及概念间关系的主要方法的思路、特征和适用范围,并运用两个实例解析面向文本的领域本体学习的具体步骤和实现过程。最后讨论存在的主要问题和进一步的研究方向。
关键词:
领域本体 本体学习 文本 概念 关系
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 马志辉 孙蕾
本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。
关键词:
支持向量机 文本分类 实证研究
[期刊] 情报理论与实践
[作者]
范少萍 李迎迎 郑春厚
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
关键词:
流形学习 文本分类 算法
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的 /意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法 /过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果 /结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的/意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
奉国和 郑伟
特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每种方法的优势与不足,总结出相应改进算法。
关键词:
文本分类 特征降维 特征选择 特征抽取
[期刊] 图书情报工作
[作者]
胡泽文 王效岳 白如江
运用文献计量分析方法、计算机统计分析技术、社会网络分析软件对文本分类领域的历史文献进行计量分析及可视化,通过绘制文献数量分布图、核心关键词的共现网络,挖掘文本分类领域的发展趋势、目前研究概况、热点及未来研究趋势等信息,并对文本分类领域研究热点和未来研究趋势进行综述。
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除