- 年份
- 2024(11671)
- 2023(17071)
- 2022(14736)
- 2021(13645)
- 2020(11342)
- 2019(26296)
- 2018(26118)
- 2017(50266)
- 2016(27164)
- 2015(30702)
- 2014(30492)
- 2013(29904)
- 2012(27440)
- 2011(24596)
- 2010(24658)
- 2009(22275)
- 2008(21277)
- 2007(18493)
- 2006(16178)
- 2005(14009)
- 学科
- 济(112016)
- 经济(111903)
- 管理(74726)
- 业(73102)
- 企(59964)
- 企业(59964)
- 方法(51153)
- 数学(44657)
- 数学方法(43880)
- 中国(31032)
- 农(29982)
- 地方(25900)
- 业经(25488)
- 财(25366)
- 学(24551)
- 农业(20371)
- 贸(19336)
- 贸易(19319)
- 理论(19268)
- 易(18688)
- 制(18301)
- 和(17613)
- 环境(17561)
- 技术(17257)
- 银(16616)
- 银行(16576)
- 融(15983)
- 金融(15981)
- 务(15976)
- 财务(15885)
- 机构
- 学院(379522)
- 大学(378145)
- 管理(150735)
- 济(148471)
- 经济(145226)
- 理学(131098)
- 理学院(129634)
- 管理学(126856)
- 研究(126502)
- 管理学院(126182)
- 中国(93547)
- 京(80701)
- 科学(80374)
- 财(66366)
- 所(62854)
- 农(61381)
- 中心(57853)
- 研究所(57648)
- 业大(57629)
- 江(54938)
- 财经(53643)
- 范(51424)
- 师范(50900)
- 北京(50892)
- 经(48847)
- 农业(47857)
- 院(46824)
- 州(44911)
- 经济学(44140)
- 技术(41667)
- 基金
- 项目(265265)
- 科学(209139)
- 研究(192891)
- 基金(191617)
- 家(167598)
- 国家(166217)
- 科学基金(143356)
- 社会(119788)
- 社会科(113469)
- 社会科学(113438)
- 省(104686)
- 基金项目(101569)
- 自然(94879)
- 自然科(92721)
- 自然科学(92697)
- 自然科学基金(90966)
- 教育(89784)
- 划(88301)
- 资助(79486)
- 编号(79477)
- 成果(63163)
- 重点(59897)
- 发(58744)
- 部(57659)
- 创(55179)
- 课题(54868)
- 创新(51379)
- 科研(50988)
- 教育部(49365)
- 大学(49161)
- 期刊
- 济(159933)
- 经济(159933)
- 研究(108854)
- 中国(71431)
- 学报(59614)
- 科学(55788)
- 管理(55392)
- 农(55252)
- 财(48720)
- 教育(46031)
- 大学(45661)
- 学学(42964)
- 农业(38729)
- 技术(35874)
- 融(30485)
- 金融(30485)
- 业经(27924)
- 经济研究(26026)
- 财经(24944)
- 经(21249)
- 问题(20534)
- 业(20097)
- 图书(19824)
- 科技(18444)
- 技术经济(18439)
- 统计(17951)
- 资源(17705)
- 理论(17331)
- 版(17310)
- 商业(17194)
共检索到546334条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报科学
[作者]
邱明涛 马静 张磊 姚兆旭
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
关键词:
LDA模型 微博话题 话题特征 特征抽取
[期刊] 情报科学
[作者]
梁珊 邱明涛 马静
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 情报科学
[作者]
唐晓波 王中勤 钟林霞
【目的/意义】微博话题追踪有利于提高舆情分析系统获取数据的效率和质量,从而为舆情引导等决策提供准确的情报支持。【方法/过程】本文针对微博文本语义稀疏问题和话题漂移问题,构建一个基于维基语义扩展的微博话题追踪模型。该模型首先利用半结构化的维基百科文档构建维基知识库;然后使用维基知识库对微博文本特征向量进行语义扩展,提高微博文本向量的描述能力,降低话题追踪对初始话题数量的敏感度;最后使用支持向量机(Support Vector Machine,SVM)实现语义层次上的微博话题追踪,并且在追踪过程中不断更新SV
[期刊] 情报学报
[作者]
李志义 王冕 赵鹏武
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 情报学报
[作者]
李志义 黄子风 许晓绵
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 情报学报
[作者]
王东波 叶文豪 吴毅 刘伙玉 苏新宁 沈思
为了更深入地挖掘食品安全事件中的特征和规律,本文提出了食品安全事件时间演化序列自动生成方法。首先从食品安全事件的时间构成、时间表达式左右边界特征、时间常用词三方面分析了食品安全事件时间的表达特征。基于时间表达式的多种特征,采用基于条件随机场模型的方法对时间表达式进行识别,F值最高达90%。然后以含有时间表达式的"句"为单位,将一个事件分为多个"时间-事件"的组合,最后采用基于时间戳的逆向匹配法生成事件时间演化序列。该方法可用于分析食品安全事件的发展脉络与特征,以期为政府实施食品安全事件监控提供理论与技术支
[期刊] 情报理论与实践
[作者]
白如江 杨振瑜 王效岳
文章利用KeyGraph算法来对搜索引擎中的长句查询进行处理,抽取其中的关键主题,然后再在KL-divergency、BM25、TFIDF三种不同的检索模型上分别进行实验。研究发现经过KeyGraph关键词抽取技术处理过的长句查询检索效果得到了明显提高,并且在KL-divergency语言模型上的检索效果最好,有效地提高了长句查询的准确率和相关文档的排序。
关键词:
长句查询 检索模型 关键词
[期刊] 图书情报工作
[作者]
陈德鑫 占袁圆 杨兵 谢亚霓
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报理论与实践
[作者]
裴超 肖诗斌 江敏
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
关键词:
微博 主题模型 文本聚类 k均值算法
[期刊] 情报科学
[作者]
崔金栋 郑鹊 孙硕
【目的/意义】研究微博网络中话题式信息的传播模型及规律,对控制舆论和掌握微博信息传播规律具有重要意义。【方法/过程】以微博信息传播中的SEIR模型为出发点,综合考虑微博网络中话题式信息的衍生特性,构建改良式的微博话题式信息传播H-SEIR模型,并运用MATLAB进行模拟仿真,对微博中话题式信息传播影响因素和对应的控制策略进行研究。【结果/结论】验证了所构建的改良微博话题式信息传播H-SEIR模型的可行性和有效性,揭示了移动网络环境下话题式信息传播规律,为现实微博网络的监管控制策略的制定提供了理论依据。
[期刊] 情报学报
[作者]
吴俊 程垚 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
[期刊] 情报理论与实践
[作者]
唐晓波 房小可
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
关键词:
文本聚类 主题检索 微博
[期刊] 统计与决策
[作者]
刘源 尹慧萍 朱建平
文章基于对平稳时间序列数据的随机抽取,选用AR模型研究其模型定阶方法和参数评估准则。根据数据有序性的特点,提出利用交叉验证的方法确定自回归模型阶数,并通过对原数据的无放回抽取实现对系数参数估计的评估。实例分析结果表明,交叉验证的定阶与AIC准则定阶结果保持较高一致性,新的参数评估在一定的模型误差范围内可以得到更为简单有效的系数估计区间。
关键词:
随机抽取 AR模型 模型定阶 参数评估
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除