- 年份
- 2024(6130)
- 2023(8986)
- 2022(7710)
- 2021(7166)
- 2020(6262)
- 2019(14355)
- 2018(13985)
- 2017(26994)
- 2016(14031)
- 2015(15539)
- 2014(14754)
- 2013(14329)
- 2012(12804)
- 2011(11241)
- 2010(10697)
- 2009(9333)
- 2008(8716)
- 2007(7085)
- 2006(5740)
- 2005(4680)
- 学科
- 济(55660)
- 经济(55604)
- 管理(37324)
- 业(35677)
- 企(29998)
- 企业(29998)
- 方法(29961)
- 数学(26827)
- 数学方法(26350)
- 财(14128)
- 农(12821)
- 中国(12749)
- 学(12497)
- 业经(10652)
- 地方(9373)
- 务(9347)
- 财务(9303)
- 财务管理(9283)
- 贸(9220)
- 贸易(9215)
- 易(8947)
- 企业财务(8824)
- 理论(8648)
- 农业(8534)
- 技术(8415)
- 和(8090)
- 制(7848)
- 环境(7744)
- 划(7031)
- 融(6777)
- 机构
- 大学(184781)
- 学院(182831)
- 管理(74312)
- 济(73787)
- 经济(72456)
- 理学(65574)
- 理学院(64887)
- 管理学(63433)
- 管理学院(63096)
- 研究(59303)
- 中国(44061)
- 科学(37871)
- 京(37841)
- 财(33026)
- 农(29771)
- 业大(29177)
- 中心(28602)
- 所(28348)
- 财经(27368)
- 研究所(26369)
- 江(25853)
- 经(25163)
- 农业(23401)
- 范(23150)
- 经济学(23131)
- 院(23053)
- 师范(22876)
- 北京(22691)
- 经济学院(21093)
- 财经大学(20800)
- 基金
- 项目(138845)
- 科学(110886)
- 基金(103973)
- 研究(97363)
- 家(92342)
- 国家(91684)
- 科学基金(79740)
- 社会(62948)
- 社会科(59904)
- 社会科学(59888)
- 基金项目(55330)
- 自然(53764)
- 省(53121)
- 自然科(52636)
- 自然科学(52623)
- 自然科学基金(51636)
- 划(45612)
- 教育(45306)
- 资助(42244)
- 编号(37611)
- 重点(31878)
- 部(30929)
- 创(29328)
- 发(28979)
- 成果(28421)
- 科研(27933)
- 创新(27497)
- 国家社会(27174)
- 教育部(26587)
- 计划(26210)
共检索到250988条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 统计与决策
[作者]
孙丽莉 张小刚
传统文本特征词提取方法采用TF-IDF计算文本特征词的权重,但TF-IDF方法只使用了文本中的词频因素,体现不出特征词的位置信息,也忽略了特征词之间的语义相似关系,降低了提取特征词的准确性。针对此问题,文章提出了一种综合的文本特征词权重计算方法,该方法在计算特征词权重时兼顾了特征词的词频、位置和词义信息。实验结果表明,该方法是有效的,且能在一定程度上提高文本相似度结果的区分度和聚类效果。
[期刊] 情报学报
[作者]
薛翠芳 郭炳炎
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。
关键词:
特征词 加权函数 自动文摘
[期刊] 情报学报
[作者]
郭崇慧 曹梦月
文献计量学领域中的共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题,导致了领域主题发现容易存在偏差。本文针对传统共词分析方法存在的缺陷提出了一种新的共词分析方法——GMAP共词分析方法,即将g指数、互信息概念以及AP聚类算法融入共词分析方法中。首先,使用g指数确定高频关键词的个数;其次,使用互信息概念对共现矩阵进行包容化处理;最后,使用AP算法进行聚类得出领域主题。
关键词:
共词分析 g指数 互信息 AP聚类
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 统计与决策
[作者]
杨怀珍 李玲华
在采用聚类方法产生训练集的基础上,运用粗集理论离散化预处理该训练集,可以更好的提高分类精度。文章运用PAM算法聚类原始样本构成训练集,再利用布尔逻辑和粗集理论结合的离散化算法离散化该训练集,并以此离散化的训练集训练分类器。实验结果证明,基于该方法在相同的数据集上分类,比仅基于PAM算法预处理的RDDTE方法产生的分类精度最高提高了15.5%,且选用更少量的训练集。
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 图书情报工作
[作者]
罗毅辉 熊曙初
尽管目前存在许多文本特征选择方法,但是它们都有着一定的局限性。提出一种新的基于群体增量学习(Population Based Incremental Learning)算法的文本特征选择方法,其特点是无需特征集的先验知识和容易实现,并且由于使用了简单分类器性能作为评价准则,计算复杂度很低。对Reuters-21578文本集的分类实验结果表明,该方法平均分类性能要优于卡方统计量、信息增益和简单遗传算法三种常用的特征选择方法。
[期刊] 数据分析与知识发现
[作者]
李伟卿 王伟军
【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文
关键词:
产品评论 特征词典 特征提取 观点挖掘
[期刊] 图书情报工作
[作者]
马晓雷 文秋芳
被引内容指的是被引用文献在引用文献中被引述的具体内容。Small曾经指出被引内容的研究价值,但迄今为止,在文献计量学领域被引内容分析仍然没有广泛展开。针对这一情况,提出一种分析领域知识的新方法———基于文本聚类的被引内容分析法,这种方法可以在一定程度上解决引文分析存在的问题。以第二语言教育为分析领域,研究结果证明该方法的可行性以及被引内容的研究价值。
关键词:
被引内容 知识领域 文本聚类 引文分析
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 图书情报工作
[作者]
赵辉 刘怀亮
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
关键词:
短文本分类 维基百科 词义消歧 特征扩展
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 情报科学
[作者]
刘江华
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
[期刊] 图书情报工作
[作者]
边鹏 赵妍 苏玉召
从嵌入式NSTL文本推荐系统的检索词推荐需求入手,分析原有方法的不足,引入共词分析方法和分化理论,提出一种新的最佳聚类数确定方法,改进最小类间距离和平均类内距离的计算方法,强化聚类结果的推荐效果,同时使推荐效果可以随着样本数据的变化而动态调整。最后,运用实验验证该方法的有效性。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除