标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10341)
2023(15099)
2022(13280)
2021(12400)
2020(10438)
2019(24252)
2018(24069)
2017(46300)
2016(25042)
2015(28340)
2014(27975)
2013(27257)
2012(24584)
2011(21729)
2010(21622)
2009(19337)
2008(18476)
2007(15719)
2006(13427)
2005(11111)
作者
(70844)
(58908)
(58695)
(55981)
(37557)
(28417)
(26659)
(23422)
(22448)
(20780)
(20207)
(19714)
(18707)
(18495)
(18312)
(17950)
(17665)
(17630)
(16882)
(16800)
(14645)
(14371)
(14368)
(13575)
(13254)
(12983)
(12973)
(12957)
(11870)
(11722)
学科
(96041)
经济(95937)
管理(70114)
(67153)
(56911)
企业(56911)
方法(49482)
数学(43544)
数学方法(42745)
(24935)
(23467)
中国(23381)
(22731)
业经(21521)
地方(18535)
理论(17878)
农业(16765)
(16244)
贸易(16234)
(15759)
(15636)
技术(15634)
财务(15552)
财务管理(15521)
(15504)
(15473)
环境(14898)
企业财务(14688)
(13356)
(12741)
机构
学院(344782)
大学(344334)
管理(139159)
(129864)
经济(126991)
理学(122458)
理学院(121129)
管理学(118387)
管理学院(117784)
研究(109712)
中国(79482)
科学(72351)
(72017)
(57590)
(56401)
业大(54741)
(54181)
中心(50691)
研究所(50197)
(48213)
财经(47590)
(45467)
师范(44953)
北京(44594)
农业(44408)
(43496)
(40941)
(39387)
经济学(38498)
技术(38438)
基金
项目(250596)
科学(197140)
基金(181884)
研究(179175)
(159881)
国家(158606)
科学基金(136972)
社会(110630)
社会科(104805)
社会科学(104776)
(99045)
基金项目(96980)
自然(92517)
自然科(90418)
自然科学(90394)
自然科学基金(88716)
教育(83937)
(83653)
资助(75481)
编号(73275)
成果(57181)
重点(56520)
(54276)
(52705)
(52412)
课题(50163)
科研(48833)
创新(48829)
大学(46716)
计划(46518)
期刊
(130820)
经济(130820)
研究(92652)
中国(59076)
学报(57495)
科学(52489)
管理(49566)
(49468)
大学(43624)
(42960)
学学(41317)
教育(39311)
农业(34752)
技术(32579)
(22895)
金融(22895)
业经(22615)
财经(21732)
经济研究(21270)
(18433)
(18249)
图书(17610)
科技(17454)
问题(16857)
统计(16608)
(16590)
技术经济(16441)
资源(16025)
理论(15686)
业大(15199)
共检索到472836条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报科学  [作者] 梁珊  邱明涛  马静  
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 情报科学  [作者] 邱明涛  马静  张磊  姚兆旭  
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
[期刊] 情报学报  [作者] 李志义  王冕  赵鹏武  
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 情报学报  [作者] 王东波  叶文豪  吴毅  刘伙玉  苏新宁  沈思  
为了更深入地挖掘食品安全事件中的特征和规律,本文提出了食品安全事件时间演化序列自动生成方法。首先从食品安全事件的时间构成、时间表达式左右边界特征、时间常用词三方面分析了食品安全事件时间的表达特征。基于时间表达式的多种特征,采用基于条件随机场模型的方法对时间表达式进行识别,F值最高达90%。然后以含有时间表达式的"句"为单位,将一个事件分为多个"时间-事件"的组合,最后采用基于时间戳的逆向匹配法生成事件时间演化序列。该方法可用于分析食品安全事件的发展脉络与特征,以期为政府实施食品安全事件监控提供理论与技术支
[期刊] 图书情报工作  [作者] 韩普  顾亮  
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
[期刊] 图书情报工作  [作者] 关鹏  王曰芬  傅柱  
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 情报理论与实践  [作者] 傅柱  王曰芬  关鹏  
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 情报学报  [作者] 李志义  黄子风  许晓绵  
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 图书情报工作  [作者] 冷伏海  白如江  祝清松  
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
[期刊] 情报理论与实践  [作者] 唐晓波  房小可  
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
[期刊] 图书情报工作  [作者] 陈德鑫  占袁圆  杨兵  谢亚霓  
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报理论与实践  [作者] 裴超  肖诗斌  江敏  
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
[期刊] 图书情报工作  [作者] 魏巍  郑杜  
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 情报科学  [作者] 崔金栋  郑鹊  孙硕  
【目的/意义】研究微博网络中话题式信息的传播模型及规律,对控制舆论和掌握微博信息传播规律具有重要意义。【方法/过程】以微博信息传播中的SEIR模型为出发点,综合考虑微博网络中话题式信息的衍生特性,构建改良式的微博话题式信息传播H-SEIR模型,并运用MATLAB进行模拟仿真,对微博中话题式信息传播影响因素和对应的控制策略进行研究。【结果/结论】验证了所构建的改良微博话题式信息传播H-SEIR模型的可行性和有效性,揭示了移动网络环境下话题式信息传播规律,为现实微博网络的监管控制策略的制定提供了理论依据。
[期刊] 情报科学  [作者] 唐晓波  王中勤  钟林霞  
【目的/意义】微博话题追踪有利于提高舆情分析系统获取数据的效率和质量,从而为舆情引导等决策提供准确的情报支持。【方法/过程】本文针对微博文本语义稀疏问题和话题漂移问题,构建一个基于维基语义扩展的微博话题追踪模型。该模型首先利用半结构化的维基百科文档构建维基知识库;然后使用维基知识库对微博文本特征向量进行语义扩展,提高微博文本向量的描述能力,降低话题追踪对初始话题数量的敏感度;最后使用支持向量机(Support Vector Machine,SVM)实现语义层次上的微博话题追踪,并且在追踪过程中不断更新SV
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除