- 年份
- 2024(6928)
- 2023(10199)
- 2022(9138)
- 2021(8625)
- 2020(7237)
- 2019(16748)
- 2018(16805)
- 2017(32368)
- 2016(17716)
- 2015(19883)
- 2014(19791)
- 2013(19642)
- 2012(17775)
- 2011(16014)
- 2010(15768)
- 2009(14052)
- 2008(13586)
- 2007(11562)
- 2006(9960)
- 2005(8592)
- 学科
- 济(66077)
- 经济(66000)
- 管理(48769)
- 业(45950)
- 企(38939)
- 企业(38939)
- 方法(32374)
- 数学(27803)
- 数学方法(27421)
- 学(17425)
- 农(17081)
- 中国(16618)
- 财(16179)
- 业经(14782)
- 地方(13641)
- 理论(12298)
- 和(11747)
- 农业(11527)
- 贸(11148)
- 贸易(11143)
- 环境(10837)
- 易(10778)
- 制(10724)
- 务(10637)
- 技术(10585)
- 财务(10571)
- 财务管理(10556)
- 企业财务(10006)
- 教育(9730)
- 划(9442)
- 机构
- 大学(247007)
- 学院(243371)
- 管理(99546)
- 济(90313)
- 经济(88159)
- 理学(87066)
- 理学院(86072)
- 管理学(84462)
- 管理学院(84039)
- 研究(81704)
- 中国(58829)
- 科学(53920)
- 京(53087)
- 所(41192)
- 财(40504)
- 农(39073)
- 业大(38389)
- 研究所(38083)
- 中心(36744)
- 江(34040)
- 范(33700)
- 北京(33613)
- 师范(33389)
- 财经(33224)
- 农业(30649)
- 经(30279)
- 院(30218)
- 州(27927)
- 师范大学(27402)
- 技术(25912)
- 基金
- 项目(175451)
- 科学(137315)
- 基金(126913)
- 研究(126500)
- 家(111361)
- 国家(110450)
- 科学基金(94624)
- 社会(76940)
- 社会科(72777)
- 社会科学(72756)
- 基金项目(68607)
- 省(68296)
- 自然(64012)
- 自然科(62488)
- 自然科学(62476)
- 自然科学基金(61319)
- 划(58207)
- 教育(57761)
- 编号(52035)
- 资助(51949)
- 成果(41758)
- 重点(39398)
- 部(38009)
- 发(36790)
- 创(36218)
- 课题(35334)
- 科研(34142)
- 创新(33706)
- 大学(32468)
- 项目编号(32354)
共检索到342405条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
奉国和 郑伟
特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每种方法的优势与不足,总结出相应改进算法。
关键词:
文本分类 特征降维 特征选择 特征抽取
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
[期刊] 图书情报工作
[作者]
胡泽文 王效岳 白如江
运用文献计量分析方法、计算机统计分析技术、社会网络分析软件对文本分类领域的历史文献进行计量分析及可视化,通过绘制文献数量分布图、核心关键词的共现网络,挖掘文本分类领域的发展趋势、目前研究概况、热点及未来研究趋势等信息,并对文本分类领域研究热点和未来研究趋势进行综述。
[期刊] 图书情报工作
[作者]
王文娟 马建霞 陈春 张凌波
[目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。
关键词:
引文文本分类 引文内容分析 引文分析
[期刊] 情报理论与实践
[作者]
庞观松 蒋盛益
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。
关键词:
自动分类 文本分类 文本处理 综述
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 情报理论与实践
[作者]
许海云 王振蒙 胡正银 王超 朱礼军
[目的/意义]针对利用文本分析识别技术主题的关键技术:技术主题表示模型及相似度计算的研究现状进行系统的综述。[方法/过程]总结了当前技术特征项识别的不断深入、文本表示模型的多样化及技术主题知识单元的关联强度分析的主要方法,以及当前利用专利文本分析识别技术主题的关键技术的不足之处。[结果/结论]提出了基于专利文本分析的技术识别关键技术的发展趋势,主要包括技术主题表示模型不断拓展且结合运用、主题知识单元关联的多层次分析、专利文本内容分析与引用分析的结合和主题聚类及聚类融合方法的改进及应用。
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 会计之友
[作者]
张家胜 晋丽婷
文章采用文献研究法对费用粘性特征的相关研究成果进行了回顾和述评,包括费用粘性的不同构成、业务量不同变动幅度下的费用粘性、不同时间跨度下的费用粘性、费用粘性的周期性及费用粘性的公司特征等微观特征,费用粘性的行业特征、地区差异和实际控制人差异等中观特征和费用粘性的国别差异的宏观特征,并在此基础上提出了费用粘性未来的研究空间。
关键词:
费用粘性 特征 综述
[期刊] 图书情报知识
[作者]
高淑琴
本文在分析国内外Web文本分类方法研究现状的基础上,对新近出现的基于群的分类方法、基于模糊—粗糙集的文本分类模型、多分类器融合的方法、基于RBF网络的文本分类模型、潜在语义分类模型等新方法,以及K—近邻算法和支持向量机的新发展等进行了深入探讨;并对Web文本分类过程的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法进行了分析;最后总结了Web文本分类技术存在着新分类方法不断涌现、传统分类方法的进一步发展、文本、语音和图像分类技术的融合等几种发展趋势,以及存在着分词问题、目前还没有发现"最佳"的特征选择等研究的不足之处。
关键词:
Web文本分类 数据挖掘 机器学习
[期刊] 数据分析与知识发现
[作者]
路永和 陈景煌
【目的】由于文本数据存在许多与分类不相关的冗余词项,引入混合蛙跳算法进行特征选择优化,提高分类准确率。【方法】分别使用CHI和IG预选出不同维度的特征集合,再引入改进后的混合蛙跳算法对预选特征集合进行二次优选,每只青蛙的位置代表一种特征选择规则,将分类准确率作为算法的适应度函数。SVM和KNN分类器用于实验中分类准确率的计算。【结果】引入改进后的蛙跳算法比CHI和IG能得到更好的分类效果,最大提升幅度达到12%。【局限】在少部分特征维度下出现过拟合现象。【结论】采用特征词预选和改进后的蛙跳算法相结合的特征
关键词:
特征选择 文本分类 混合蛙跳算法
[期刊] 图书情报工作
[作者]
祁瑞华 霍跃红 胡润波
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。
[期刊] 图书情报工作
[作者]
祁瑞华 霍跃红 胡润波
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除