标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(11096)
2023(16182)
2022(14173)
2021(13209)
2020(11376)
2019(26431)
2018(26322)
2017(50866)
2016(27814)
2015(31748)
2014(31947)
2013(31601)
2012(29158)
2011(26264)
2010(25953)
2009(23868)
2008(23446)
2007(20822)
2006(17804)
2005(15418)
作者
(83335)
(69617)
(69137)
(65830)
(44104)
(33579)
(31586)
(27515)
(26374)
(24825)
(23619)
(23346)
(22071)
(21909)
(21758)
(21562)
(21490)
(20813)
(20013)
(19950)
(17504)
(17087)
(16913)
(15922)
(15661)
(15560)
(15433)
(15374)
(14170)
(13869)
学科
(112153)
经济(112029)
管理(80841)
(78042)
(64919)
企业(64919)
方法(56750)
数学(49874)
数学方法(49192)
(29918)
(28416)
中国(27137)
(26203)
业经(23865)
地方(21527)
技术(20614)
(20485)
贸易(20479)
农业(20127)
(19869)
理论(18811)
(18649)
(18497)
财务(18411)
财务管理(18367)
(17575)
企业财务(17365)
环境(17041)
(15338)
银行(15264)
机构
大学(402909)
学院(401266)
管理(158601)
(155584)
经济(152092)
理学(138174)
理学院(136642)
管理学(133928)
管理学院(133239)
研究(132728)
中国(96267)
科学(87049)
(85719)
(72157)
(68503)
(68184)
业大(65842)
研究所(62731)
中心(60874)
(58166)
农业(57301)
财经(55874)
北京(53707)
(52196)
师范(51566)
(50733)
(48236)
(47186)
经济学(46187)
技术(45210)
基金
项目(279857)
科学(217820)
基金(201533)
研究(198338)
(177695)
国家(176261)
科学基金(149989)
社会(121820)
社会科(115351)
社会科学(115316)
(110867)
基金项目(107225)
自然(101148)
自然科(98769)
自然科学(98736)
自然科学基金(96931)
(93499)
教育(92162)
资助(84456)
编号(81043)
成果(64543)
重点(63028)
(61054)
(59109)
(57887)
课题(55805)
科研(54537)
创新(54100)
计划(52820)
大学(51681)
期刊
(162791)
经济(162791)
研究(110041)
中国(71402)
学报(70329)
(63980)
科学(62676)
管理(55562)
(52771)
大学(52115)
学学(49213)
农业(44483)
教育(42775)
技术(37776)
(28697)
金融(28697)
业经(27256)
财经(26501)
经济研究(26036)
(23343)
(22555)
问题(21450)
图书(21227)
技术经济(20952)
科技(20400)
(20104)
理论(18944)
统计(18615)
业大(18240)
资源(17665)
共检索到566345条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 统计与决策  [作者] 刘苗  谢邦昌  
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
[期刊] 图书情报工作  [作者] 张玉峰  何超  
为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
[期刊] 情报理论与实践  [作者] 张玉峰  何超  
为了提高文本分类的准确性和效率,提出了一种基于潜在语义分析和超球支持向量机的文本分类模型。针对SVM对大规模文本分类时收敛速度较慢这一缺点,本文将超球支持向量机应用于文本分类,采用基于增量学习的超球支持向量机分类学习算法进行训练和分类。实验结果表明,超球支持向量机是一种解决SVM问题的有效方法,在文本分类应用中具有与SVM相当的精度,但是明显降低了模型复杂度和训练时间。
[期刊] 情报理论与实践  [作者] 高影繁  王惠临  徐红姣  
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重要的多语信息组织手段,跨语言文本分类技术发展前景广阔。
[期刊] 情报理论与实践  [作者] 赵辉  刘怀亮  范云杰  左晓飞  
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 图书情报工作  [作者] 罗新  王兆礼  路永和  
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要意义。文本分类的发展与模式识别的发展密切相关。文本分类具有的类目多、样本数目多、噪音多、各类别样本数目不均衡等特点,使各模式识别算法在应用于文本分类时存在许多缺点。近年来逐步发展起来的群集智能(Swarm Intelligence)理论和方法为文本分类提供一种新的智能化手段。将蚁群智能算法尝试性引入文本分类领域,构建基于蚁群智能的文本分类模型,并在文本数据集上进行测试和比较,结果表明该模型可以较好地应用于文本分类。
[期刊] 情报理论与实践  [作者] 程彩虹  王惠临  解国栋  
潜在语义索引方法是一种无监督的学习方法,能够自动地从未经加工的文本中学习词法分析处理的数据。通过计算单词之间的语义相关性,提高学习的效果。本文首先对词法分析和词法学习的概念和早期出现过的词法学习的方法进行简单阐述,然后描述了基于这一理论进行词法学习的方法,接着是对这一方法的一些改进和测评,最后是结论和展望。
[期刊] 图书情报知识  [作者] 高淑琴  
本文在分析国内外Web文本分类方法研究现状的基础上,对新近出现的基于群的分类方法、基于模糊—粗糙集的文本分类模型、多分类器融合的方法、基于RBF网络的文本分类模型、潜在语义分类模型等新方法,以及K—近邻算法和支持向量机的新发展等进行了深入探讨;并对Web文本分类过程的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法进行了分析;最后总结了Web文本分类技术存在着新分类方法不断涌现、传统分类方法的进一步发展、文本、语音和图像分类技术的融合等几种发展趋势,以及存在着分词问题、目前还没有发现"最佳"的特征选择等研究的不足之处。
[期刊] 图书情报工作  [作者] 尹丽英  赵捧未  
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
[期刊] 图书情报工作  [作者] 唐晓波  王洪艳  
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 情报理论与实践  [作者] 许海云  王振蒙  胡正银  王超  朱礼军  
[目的/意义]针对利用文本分析识别技术主题的关键技术:技术主题表示模型及相似度计算的研究现状进行系统的综述。[方法/过程]总结了当前技术特征项识别的不断深入、文本表示模型的多样化及技术主题知识单元的关联强度分析的主要方法,以及当前利用专利文本分析识别技术主题的关键技术的不足之处。[结果/结论]提出了基于专利文本分析的技术识别关键技术的发展趋势,主要包括技术主题表示模型不断拓展且结合运用、主题知识单元关联的多层次分析、专利文本内容分析与引用分析的结合和主题聚类及聚类融合方法的改进及应用。
[期刊] 数据分析与知识发现  [作者] 田世海  吕德丽  
【目的】针对现有预警体系多以企业自身和监管部门为主体、忽视网络舆情,导致预警力度不强、缺乏透明度及敏感性、使突发性安全问题时有发生且无法得到及时处理的现状,提出一种新的舆情预警模型。【方法】通过元搜索技术挖掘舆情信息,增加基准偏移值优化情感特征项倾向性权重,添加修正因子以改进潜在语义分析和支持向量机(LSA+SVM)算法,构建舆情分类预警模型。【结果】以多组突发性安全事件为例,应用Matlab进行仿真实验。结果证明该舆情预警模型切实可行,反应迅速,在语义维度为10时准确率可达85.75%。【局限】此方法对
[期刊] 图书情报工作  [作者] 马甲林  刘金岭  金春霞  
针对传统文本分类算法在向量空间模型表示下存在向量高维、稀疏以及忽略特征语义相关性等缺陷所导致的分类效率低和精度不高的问题,以知网(HowNet)为知识库,构建语义概念向量模型SCVM(Semantic Concept Vector Model)表示文本,根据概念语义及上下文背景对同义词进行归并,对多义词进行排歧,提出基于概念簇的文本分类算法TCABCC(Text Classification Algorithm Based on the Concept of Clusters),通过改进传统KNN,用概念簇表示各个类别训练样本,使相似度的计算基于文本概念向量和类别概念簇。实验结果表明,该算法构...
[期刊] 情报理论与实践  [作者] 范少萍  李迎迎  郑春厚  
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
[期刊] 图书情报工作  [作者] 张玉洁  白如江  刘明月  于纯良  
[目的/意义]针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程]以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论]在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除