标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(4575)
2023(6617)
2022(5664)
2021(5460)
2020(4576)
2019(10504)
2018(10311)
2017(20364)
2016(10506)
2015(11552)
2014(11141)
2013(10600)
2012(9288)
2011(8008)
2010(7284)
2009(6262)
2008(5517)
2007(4121)
2006(3026)
2005(2136)
作者
(24992)
(21111)
(20813)
(19891)
(13289)
(9987)
(9541)
(8359)
(8060)
(7200)
(7067)
(6888)
(6596)
(6332)
(6324)
(6205)
(6192)
(6072)
(6039)
(5908)
(4916)
(4892)
(4849)
(4811)
(4735)
(4692)
(4369)
(4270)
(4176)
(4145)
学科
(41291)
经济(41255)
管理(30636)
(29033)
方法(24642)
(24571)
企业(24571)
数学(22593)
数学方法(22235)
(11223)
(9869)
中国(9112)
业经(8332)
(7751)
财务(7718)
财务管理(7702)
企业财务(7336)
(7016)
贸易(7015)
(6859)
技术(6854)
农业(6613)
地方(6386)
理论(6240)
环境(6214)
(6116)
(5972)
(5499)
(5485)
(4675)
机构
大学(133410)
学院(132902)
管理(59045)
(56536)
经济(55677)
理学(52914)
理学院(52451)
管理学(51533)
管理学院(51273)
研究(36034)
中国(26431)
(25294)
(24311)
财经(20853)
科学(20724)
(19326)
业大(19096)
中心(18762)
经济学(18046)
(16886)
(16595)
经济学院(16561)
财经大学(16091)
经济管理(15953)
(15903)
师范(15744)
商学(15602)
商学院(15471)
(14609)
北京(14529)
基金
项目(103715)
科学(84544)
基金(78967)
研究(76096)
(67872)
国家(67358)
科学基金(60623)
社会(50903)
社会科(48511)
社会科学(48500)
基金项目(42385)
(39667)
自然(39641)
自然科(38818)
自然科学(38810)
自然科学基金(38104)
教育(36066)
(33446)
资助(31285)
编号(30013)
(23913)
重点(22948)
(22745)
国家社会(21984)
成果(21793)
(21609)
教育部(21427)
创新(21243)
人文(21103)
科研(20639)
期刊
(48732)
经济(48732)
研究(32195)
管理(20731)
(19460)
中国(18139)
学报(17295)
科学(16982)
大学(14640)
学学(13884)
技术(13437)
(13288)
教育(11383)
财经(9851)
农业(9409)
业经(8462)
(8429)
(8366)
金融(8366)
经济研究(8006)
问题(6926)
理论(6595)
财会(6559)
技术经济(6511)
统计(6430)
实践(6109)
(6109)
(5899)
科技(5849)
(5784)
共检索到167566条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 马甲林  刘金岭  金春霞  
针对传统文本分类算法在向量空间模型表示下存在向量高维、稀疏以及忽略特征语义相关性等缺陷所导致的分类效率低和精度不高的问题,以知网(HowNet)为知识库,构建语义概念向量模型SCVM(Semantic Concept Vector Model)表示文本,根据概念语义及上下文背景对同义词进行归并,对多义词进行排歧,提出基于概念簇的文本分类算法TCABCC(Text Classification Algorithm Based on the Concept of Clusters),通过改进传统KNN,用概念簇表示各个类别训练样本,使相似度的计算基于文本概念向量和类别概念簇。实验结果表明,该算法构...
[期刊] 图书情报工作  [作者] 罗新  王兆礼  路永和  
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要意义。文本分类的发展与模式识别的发展密切相关。文本分类具有的类目多、样本数目多、噪音多、各类别样本数目不均衡等特点,使各模式识别算法在应用于文本分类时存在许多缺点。近年来逐步发展起来的群集智能(Swarm Intelligence)理论和方法为文本分类提供一种新的智能化手段。将蚁群智能算法尝试性引入文本分类领域,构建基于蚁群智能的文本分类模型,并在文本数据集上进行测试和比较,结果表明该模型可以较好地应用于文本分类。
[期刊] 中南林业科技大学学报  [作者] 陈宇  许莉薇  
为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
[期刊] 情报理论与实践  [作者] 赵辉  刘怀亮  范云杰  左晓飞  
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 统计与决策  [作者] 刘苗  谢邦昌  
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
[期刊] 情报理论与实践  [作者] 范少萍  李迎迎  郑春厚  
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
[期刊] 情报理论与实践  [作者] 周瑛  刘政怡  
本文利用前向神经网络的交叉覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。应用该算法对语料库中的文本进行实验,从实验结果来看,该算法在运行时间和精度上都取得了令人满意的结果。
[期刊] 图书情报工作  [作者] 赵辉  刘怀亮  
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
[期刊] 中南林业科技大学学报  [作者] 陈宇  许莉薇  
为解决不均衡林业信息文本分类中少数类分类正确率低问题,提出了一种基于优化LM模糊神经网络的不均衡林业信息文本分类算法。在阐述优化LM模糊神经网络算法原理的基础上,提取不均衡林业信息文本特征矩阵训练分类器的各项参数,实现对不均衡林业信息文本的精准与快速分类。实验结果表明该算法对少数类辨识准确率高,优于神经网络分类法以及SVM算法、模糊神经网络算法,为不均衡林业信息文本的分类提供了新思路。
[期刊] 统计与决策  [作者] 姜爱克  赵峰  张杰  
数据流具有连续、实时、有序及无限等特点,使用传统的数据挖掘技术来处理数据流的分类面临着严重的挑战,很难处理数据流中的概念漂移问题。文章结合现有的决策树分类挖掘算法,提出了自适应集成分类器方法,构建了数据流概念漂移的自适应集成分类模型,通过不断更新训练样例的权重与属性类别,将训练样例从现有的数据集中分离出来,并被确定为新类别属性的训练样例,以达到对数据流中概念漂移现象的有效检测,仿真结果也证明该方法的适应性和可靠性。
[期刊] 情报理论与实践  [作者] 刘秀松  
SVM是一种新的分类工具,可是其核函数在数学上必须满足Mercer条件,使得具有良好全局分类性能的Sigmoid函数在SVM中应用受到限制。本文将Sigmoid核函数与云模型相结合,提出一种简单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时间。
[期刊] 情报理论与实践  [作者] 姚兴山  
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
[期刊] 教育发展研究  [作者] 胡惠闵  王小平  
本文采用文本分析的方法,通过对国内500篇代表性文献的分析,发现学术界对课业负担概念的外延和边界、对课业负担的词性及对课业负担是主观感受还是客观存在的理解,都存在着明显的争议和矛盾,限制了对该问题的进一步研究。基于文本分析,本文提出,应选择一个视角对课业负担概念进行界定;以广义理解为基础界定课业负担内涵;不对课业负担进行价值判断;寻找一个合理的指标来表达课业负担。
[期刊] 中国农业大学学报  [作者] 陶兰  申军霞  
设计并实现了文本信息自动分类系统ITC98的核心模块──基于BP网络的文本分类子系统。介绍系统的分类策略及根据分类问题需求确定BP网络结构和参数的方法。实例测试表明,系统分类精度和效率均达到要求。
[期刊] 数据分析与知识发现  [作者] 路永和  陈景煌  
【目的】由于文本数据存在许多与分类不相关的冗余词项,引入混合蛙跳算法进行特征选择优化,提高分类准确率。【方法】分别使用CHI和IG预选出不同维度的特征集合,再引入改进后的混合蛙跳算法对预选特征集合进行二次优选,每只青蛙的位置代表一种特征选择规则,将分类准确率作为算法的适应度函数。SVM和KNN分类器用于实验中分类准确率的计算。【结果】引入改进后的蛙跳算法比CHI和IG能得到更好的分类效果,最大提升幅度达到12%。【局限】在少部分特征维度下出现过拟合现象。【结论】采用特征词预选和改进后的蛙跳算法相结合的特征
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除