- 年份
- 2024(10008)
- 2023(14729)
- 2022(12821)
- 2021(12085)
- 2020(10156)
- 2019(23616)
- 2018(23425)
- 2017(44959)
- 2016(24441)
- 2015(27738)
- 2014(27547)
- 2013(27103)
- 2012(24714)
- 2011(22192)
- 2010(22641)
- 2009(21016)
- 2008(19400)
- 2007(17158)
- 2006(15061)
- 2005(13263)
- 学科
- 济(93363)
- 经济(93257)
- 管理(68115)
- 业(65222)
- 企(55865)
- 企业(55865)
- 方法(45841)
- 数学(39792)
- 数学方法(39023)
- 中国(30320)
- 融(27737)
- 金融(27735)
- 银(26061)
- 银行(26007)
- 行(25057)
- 财(24190)
- 农(23658)
- 学(21732)
- 业经(21366)
- 地方(20383)
- 制(19460)
- 理论(18981)
- 贸(16322)
- 贸易(16306)
- 务(16226)
- 财务(16148)
- 财务管理(16116)
- 农业(16064)
- 易(15870)
- 企业财务(15320)
- 机构
- 大学(339121)
- 学院(338539)
- 管理(132331)
- 济(128179)
- 经济(125162)
- 理学(114824)
- 理学院(113524)
- 研究(112525)
- 管理学(110927)
- 管理学院(110363)
- 中国(88532)
- 科学(73018)
- 京(72758)
- 财(59191)
- 农(57902)
- 所(57328)
- 业大(53211)
- 中心(52912)
- 研究所(52589)
- 江(49305)
- 财经(47633)
- 北京(46080)
- 农业(45681)
- 范(44382)
- 师范(43847)
- 经(43166)
- 院(41046)
- 州(40968)
- 技术(38323)
- 经济学(38073)
- 基金
- 项目(235345)
- 科学(183511)
- 研究(168812)
- 基金(168669)
- 家(148371)
- 国家(147138)
- 科学基金(125748)
- 社会(102847)
- 社会科(97423)
- 社会科学(97390)
- 省(94097)
- 基金项目(88961)
- 自然(84427)
- 自然科(82501)
- 自然科学(82480)
- 自然科学基金(80933)
- 划(79432)
- 教育(79051)
- 资助(71696)
- 编号(69278)
- 成果(56074)
- 重点(53357)
- 部(50561)
- 发(49856)
- 创(49145)
- 课题(48820)
- 创新(45764)
- 科研(45519)
- 计划(43951)
- 大学(43761)
- 期刊
- 济(134283)
- 经济(134283)
- 研究(97876)
- 中国(67029)
- 学报(57286)
- 农(51690)
- 科学(51119)
- 管理(48701)
- 财(43856)
- 大学(42737)
- 教育(42182)
- 学学(40309)
- 融(39697)
- 金融(39697)
- 农业(35455)
- 技术(30885)
- 财经(22267)
- 业经(21942)
- 经济研究(21720)
- 统计(19377)
- 经(18920)
- 业(18708)
- 图书(17956)
- 问题(16802)
- 策(16798)
- 理论(16764)
- 科技(16629)
- 技术经济(15904)
- 版(15676)
- 实践(15505)
共检索到496670条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
魏巍 郑杜
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 实验技术与管理
[作者]
唐贤伦 丁河长 唐瑜泽 谢涛 罗洪平
关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方法:使用异构图将关系信息作为先验知识融入词表示,增强词表示的表示能力,使得模型能有效地处理单词实体重叠问题;使用语义融合模块将不同层次特征融合在一起作为关系分类模型的输入,使得模型能够有效地处理实体对重叠问题。所提方法在NYT和WebNLG数据集上取得了最好的效果,详细的实验也表明所提方法可以处理复杂的场景。
[期刊] 情报学报
[作者]
赵洪 王芳
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
[期刊] 中国科学技术大学学报
[作者]
王根生 潘方正
针对协同过滤推荐算法没有考虑推荐对象间语义关系的问题,提出一种融合推荐对象语义相似度的改进型协同过滤推荐算法。首先利用知识图谱表示学习算法将推荐对象的语义信息嵌入到一个低维语义空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合到协同过滤推荐算法中的相似度计算中,弥补协同过滤推荐算法没有考虑推荐对象自身语义知识的缺陷。实验结果表明,该改进型算法相比于传统协同过滤推荐算法具有更高的准确率、召回率和覆盖率。
[期刊] 统计与决策
[作者]
刘源 尹慧萍 朱建平
文章基于对平稳时间序列数据的随机抽取,选用AR模型研究其模型定阶方法和参数评估准则。根据数据有序性的特点,提出利用交叉验证的方法确定自回归模型阶数,并通过对原数据的无放回抽取实现对系数参数估计的评估。实例分析结果表明,交叉验证的定阶与AIC准则定阶结果保持较高一致性,新的参数评估在一定的模型误差范围内可以得到更为简单有效的系数估计区间。
关键词:
随机抽取 AR模型 模型定阶 参数评估
[期刊] 统计与决策
[作者]
刘源 尹慧萍 朱建平
文章基于对平稳时间序列数据的随机抽取,选用AR模型研究其模型定阶方法和参数评估准则。根据数据有序性的特点,提出利用交叉验证的方法确定自回归模型阶数,并通过对原数据的无放回抽取实现对系数参数估计的评估。实例分析结果表明,交叉验证的定阶与AIC准则定阶结果保持较高一致性,新的参数评估在一定的模型误差范围内可以得到更为简单有效的系数估计区间。
关键词:
随机抽取 AR模型 模型定阶 参数评估
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
[期刊] 情报学报
[作者]
李志义 王冕 赵鹏武
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 图书情报工作
[作者]
陈德鑫 占袁圆 杨兵 谢亚霓
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报学报
[作者]
李志义 黄子风 许晓绵
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 数据分析与知识发现
[作者]
张琴 郭红梅 张智雄
【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
关键词:
关系抽取 词嵌入表示 Word2Vec
[期刊] 情报科学
[作者]
梁珊 邱明涛 马静
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 图书情报工作
[作者]
沈思 苏新宁 谢靖 王东波
基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
[期刊] 情报杂志
[作者]
李航 唐超兰 杨贤 沈婉婷
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模
[期刊] 中国科学技术大学学报
[作者]
曲昭伟 赵燕娇 王晓茹
目前,大部分进行情感分类的模型以单个数据集进行训练并测试,然而对一个数据集训练得到的模型参数不适用于另一个数据集,模型不具备通用性.为此提出一种适用于多个领域的情感分类模型(MDSC),借助样本过滤和迁移学习,使训练得到的模型参数适用于多个领域下的不同数据集,使模型更具适用性和拓展性,即先将文档映射到领域的分布式表示,并以此作为领域分类和情感分类的桥梁,最后进行情感分类.为了使模型更具通用性,需要选择代表性强的数据样本,于是通过构建具有领域独立性的情感字典对属于同一文档的句子进行过滤,获取高质量的训练集.同时为了提高分类准确率并减少训练时间,使用基于参数的迁移学习方法,利用神经网络获得文档向量再进行分类.在包含15个不同领域的数据集上进行实验,与其他情感分类模型相比得到了较好的实验效果.
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除