- 年份
- 2024(11143)
- 2023(16270)
- 2022(14195)
- 2021(13458)
- 2020(11212)
- 2019(26060)
- 2018(25961)
- 2017(49671)
- 2016(27296)
- 2015(30804)
- 2014(30416)
- 2013(29830)
- 2012(27014)
- 2011(24115)
- 2010(24094)
- 2009(21496)
- 2008(20674)
- 2007(17715)
- 2006(15094)
- 2005(12793)
- 学科
- 济(101850)
- 经济(101724)
- 管理(74263)
- 业(70418)
- 企(59527)
- 企业(59527)
- 方法(51478)
- 数学(44960)
- 数学方法(44112)
- 农(26480)
- 中国(25605)
- 财(25537)
- 学(24095)
- 业经(22764)
- 理论(19810)
- 地方(19661)
- 农业(17897)
- 贸(17556)
- 贸易(17545)
- 制(17204)
- 易(17035)
- 和(16765)
- 务(16606)
- 技术(16529)
- 财务(16518)
- 财务管理(16482)
- 环境(15775)
- 企业财务(15601)
- 银(14429)
- 银行(14388)
- 机构
- 大学(373691)
- 学院(372063)
- 管理(147369)
- 济(140348)
- 经济(137187)
- 理学(128953)
- 理学院(127479)
- 管理学(124629)
- 管理学院(123987)
- 研究(120846)
- 中国(88396)
- 京(78677)
- 科学(78590)
- 财(63487)
- 农(61175)
- 所(60386)
- 业大(58104)
- 中心(55955)
- 研究所(55618)
- 江(53028)
- 财经(51780)
- 范(50681)
- 师范(50127)
- 北京(49089)
- 农业(48209)
- 经(47233)
- 院(44616)
- 州(43145)
- 技术(42086)
- 经济学(41830)
- 基金
- 项目(264789)
- 科学(208347)
- 基金(191736)
- 研究(190468)
- 家(168244)
- 国家(166884)
- 科学基金(143742)
- 社会(116862)
- 社会科(110650)
- 社会科学(110620)
- 省(104276)
- 基金项目(101756)
- 自然(96745)
- 自然科(94544)
- 自然科学(94524)
- 自然科学基金(92767)
- 教育(90131)
- 划(88704)
- 资助(79532)
- 编号(78363)
- 成果(62399)
- 重点(59713)
- 部(57763)
- 发(55579)
- 创(55357)
- 课题(54138)
- 科研(51571)
- 创新(51562)
- 大学(49832)
- 教育部(49390)
- 期刊
- 济(144060)
- 经济(144060)
- 研究(102919)
- 中国(69220)
- 学报(61701)
- 科学(55917)
- 农(54299)
- 管理(53098)
- 教育(47453)
- 财(47330)
- 大学(46709)
- 学学(43707)
- 农业(38156)
- 技术(35164)
- 融(26685)
- 金融(26685)
- 业经(24137)
- 财经(23394)
- 经济研究(23379)
- 图书(20896)
- 业(20503)
- 经(19897)
- 问题(18303)
- 科技(18265)
- 统计(17996)
- 版(17731)
- 技术经济(17272)
- 理论(16994)
- 资源(16574)
- 策(16306)
共检索到524589条记录
相关度优先
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
李志义 黄子风 许晓绵
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 清华大学学报(自然科学版)
[作者]
周炫余 刘林 卢笑 李璇 张思敏
关键词抽取是指能自动抽取反映文本主题的词或者短语,被广泛应用于文本检索、文本摘要等领域中。目前关键词抽取任务主要依赖于预训练语言模型来获取文本表示,这类语言模型主要基于单一模态的通用文本语料进行训练,存在无法根据下游任务特性进行领域适配和语义表征能力有限的问题。该文提出一种多模态信息增强表示的中文关键词抽取方法MIEnhance-KPE,首先引入Adapter层将偏旁和部首信息集成到预训练语言模型层中,得到领域自适应的文本表示;其次利用卷积神经网络提取汉字的图像特征,同时使用交叉注意力机制融合汉字图像特征和文本特征,实现文本语义表示增强;最后利用CRF(conditional random field)模型进行序列标注任务,并计算词语的位置词频权重对其进行排序获得关键词。与目前十分先进的关键词抽取方法KIEMP相比, MIEnhance-KPE在公开的中文科学文献数据集和自构建的中文教育关键词抽取数据集上的F值分别提升了15.71%和3.40%;消融实验结果表明,所提出的领域自适应模块和视觉语义增强表示模块均能有效提高关键词抽取的准确性。MIEnhance-KPE的提出有助于教育研究者精准了解教育发展趋势,促进教育理论和实践的创新。
[期刊] 情报学报
[作者]
李志义 王冕 赵鹏武
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 数据分析与知识发现
[作者]
张琴 郭红梅 张智雄
【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
关键词:
关系抽取 词嵌入表示 Word2Vec
[期刊] 情报科学
[作者]
邱明涛 马静 张磊 姚兆旭
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
关键词:
LDA模型 微博话题 话题特征 特征抽取
[期刊] 中国图书馆学报
[作者]
周宁 余肖生 刘玮 张芳芳
互联网上检索信息,查准率、查全率不高的主要原因是信息组织的深度仅停留在文献层次。解决的根本方法是将信息组织深入到知识元层次。为此就要解决知识元表示与抽取正确与否的问题。图4。表2。参考文献4。
[期刊] 情报理论与实践
[作者]
赵洁 金培权
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题。本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论。在此基础上讨论了Web时态信息的本体表示问题。最后,预测了Web时态信息抽取与检索的若干未来发展方向。
关键词:
信息抽取 信息检索 网络
[期刊] 情报学报
[作者]
赵洪 王芳
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
[期刊] 情报学报
[作者]
王东波 叶文豪 吴毅 刘伙玉 苏新宁 沈思
为了更深入地挖掘食品安全事件中的特征和规律,本文提出了食品安全事件时间演化序列自动生成方法。首先从食品安全事件的时间构成、时间表达式左右边界特征、时间常用词三方面分析了食品安全事件时间的表达特征。基于时间表达式的多种特征,采用基于条件随机场模型的方法对时间表达式进行识别,F值最高达90%。然后以含有时间表达式的"句"为单位,将一个事件分为多个"时间-事件"的组合,最后采用基于时间戳的逆向匹配法生成事件时间演化序列。该方法可用于分析食品安全事件的发展脉络与特征,以期为政府实施食品安全事件监控提供理论与技术支
[期刊] 情报科学
[作者]
梁珊 邱明涛 马静
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 情报理论与实践
[作者]
高强 游宏梁
作为信息抽取的重要组成部分,事件抽取的研究具有广阔的应用前景和巨大的现实意义。文章阐述事件及事件抽取的基本概念,简单介绍事件抽取的发展历史,并从元事件抽取和主题事件抽取两个方面出发,详细介绍主要的研究方法与研究现状,总结事件抽取发展所面临的挑战,并在此基础上展望事件抽取的研究趋势。
关键词:
事件抽取 信息抽取 信息技术 综述
[期刊] 图书馆论坛
[作者]
高建忠 何绯娟
从分面检索的基本概念与特点出发,对基于集合论、基于轻量级本体、基于形式概念分析的三类分面模型进行分析归纳,对分面分类体系生成、分面排序及搜索结果排序等关键技术的主要研究工作进行综述,并对有代表性分面检索系统进行说明。
关键词:
分面 分面检索 分面模型 分面术语
[期刊] 图书情报工作
[作者]
陈德鑫 占袁圆 杨兵 谢亚霓
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 图书情报工作
[作者]
魏巍 郑杜
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 图书情报工作
[作者]
沈思 苏新宁 谢靖 王东波
基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
0
文献操作(0)
导出元数据
文献计量分析
导出文件格式:WXtxt