标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(9945)
2023(14546)
2022(12756)
2021(12115)
2020(10207)
2019(23725)
2018(23543)
2017(45594)
2016(24872)
2015(28210)
2014(27896)
2013(27229)
2012(24610)
2011(21789)
2010(21661)
2009(19383)
2008(18486)
2007(15928)
2006(13510)
2005(11138)
作者
(69889)
(58303)
(57954)
(55101)
(37080)
(27919)
(26319)
(23127)
(22110)
(20690)
(19853)
(19307)
(18422)
(18108)
(18020)
(17731)
(17677)
(17397)
(16670)
(16596)
(14526)
(14095)
(14063)
(13334)
(13016)
(12931)
(12837)
(12797)
(11791)
(11629)
学科
(93350)
经济(93245)
管理(70538)
(66000)
(56024)
企业(56024)
方法(48845)
数学(42877)
数学方法(42100)
(24233)
(23792)
中国(23121)
(21656)
业经(20613)
地方(18038)
理论(17621)
农业(16209)
(15743)
贸易(15734)
(15709)
财务(15620)
财务管理(15582)
技术(15421)
(15378)
(15375)
(15283)
环境(14789)
企业财务(14727)
(13349)
(12618)
机构
学院(339906)
大学(339450)
管理(137267)
(126986)
经济(124168)
理学(120693)
理学院(119367)
管理学(116708)
管理学院(116118)
研究(106599)
中国(77287)
(71011)
科学(70542)
(56662)
(55606)
业大(54496)
(52549)
中心(49559)
研究所(48598)
(47527)
财经(46620)
(44372)
北京(43909)
师范(43886)
农业(43737)
(42550)
(39636)
(38969)
技术(38568)
经济学(37506)
基金
项目(245956)
科学(193379)
基金(178184)
研究(176381)
(156144)
国家(154885)
科学基金(133919)
社会(108321)
社会科(102592)
社会科学(102562)
(97575)
基金项目(94894)
自然(90520)
自然科(88463)
自然科学(88442)
自然科学基金(86797)
教育(82951)
(82010)
资助(73912)
编号(72530)
成果(57108)
重点(54886)
(53119)
(51502)
(51218)
课题(49533)
创新(47961)
科研(47852)
大学(45901)
教育部(45515)
期刊
(127645)
经济(127645)
研究(90556)
中国(59441)
学报(57362)
科学(51475)
(49237)
管理(48726)
大学(43453)
(43388)
学学(40926)
教育(39898)
农业(34454)
技术(32375)
(22935)
金融(22935)
业经(22311)
财经(21379)
经济研究(20613)
图书(18922)
(18140)
(17909)
科技(17230)
(16594)
问题(16459)
统计(16358)
技术经济(16125)
理论(15756)
业大(15217)
资源(14985)
共检索到467637条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 沈思  苏新宁  谢靖  王东波  
基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
[期刊] 统计研究  [作者] 李菁  马彦琳  梁晓群  
本文运用基因表达式编程(GEP)方法,基于武汉市1990年至2005年的相关统计数据,构建了电力消费预测模型。研究显示,GEP法能够较好地克服有限样本数据序列的缺陷,并具有精度高、计算过程较为简化等优势。研究结果表明,武汉市电力消费主要影响因素的影响程度依次排序为:产业结构、能源效率改进、社会消费总额、人口、地区生产总值指数和电力价格指数。基于上述结论我们提出了解决电力短缺应该以加强电力能源效率改进为主导的政策建议。
[期刊] 情报理论与实践  [作者] 赵文娟  刘忠宝  
文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介绍,对流程中使用的技术和方法进行了描述。最后通过"空难"框架下的"德国之翼坠机事件"为例对方法的有效性进行了验证。
[期刊] 情报理论与实践  [作者] 杜思奇  李红莲  吕学强  
[目的/意义]面向电子商务领域的在线评论,通过识别产品特征和评价词之间是否存在修饰关系,抽取出在线评论中的情感标签,从而帮助网购用户迅速了解某一产品的性能。[方法/过程]引入汉语组块分析对评论文本进行初始化处理,对名词性信息以及形容词性信息进行抽取。通过最大熵对初始化集合进行过滤,从而获得最终的情感标签集合。[结果/结论]该方法对评论文本的适应性较好,可以有效抽取出情感标签。[局限]需要对语料进行初始化抽取,经过过滤后才能获得最终的情感标签集合。
[期刊] 情报学报  [作者] 朱惠  王昊  苏新宁  邓三鸿  
本体是知识组织的有效方式,也是构建语义网的重要环节,而概念非分类关系又是本体的重要组成部分。由于术语是概念的外在表达,因此本文在深入分析当前国内外术语非分类关系抽取研究的基础上,引入共现分析、结构分析、模板构建、逻辑推理等方法和技术构建了面向汉语领域非结构化文本的术语非分类关系抽取模型,分别从内容和结构两个不同的角度抽取术语非分类关系。论文提出了模型的主要运行流程以及各功能模块的主要组成部件,对主要组成部件的具体实现进行了探讨,并对相关方法的局限性进行了论述。本文的研究为术语非分类关系抽取提供了新的思路,丰富了知识发现方法,同时也能为实现可行有效的知识组织提供参考。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 统计与决策  [作者] 江涛  雷鸣  
本文研究了具有随机收益率的一类离散风险模型。在净损失额为Pareto分布、随机收益率分别为均匀分布、Pareto分布与Weibull分布的情况下,采取有限部分推导与随机模拟相结合的方法,对此类问题的有限时间破产概率的渐近表达公式进行了探索性研究,提供了获取未知渐近表达式的一个行之有效的实验方法。
[期刊] 情报理论与实践  [作者] 邓擘  郑彦宁  樊孝忠  
事件抽取是信息抽取的基本任务之一,而对文本中的事件准确定位和分类是保证事件抽取质量的前提。使用向量空间模型来表示事件描述片段的特征,并分类计算特征词的重要度,最后对文本中的事件片段进行定位和分类。试验结果表明该方法能够对文本中的事件片段进行较为准确的定位、分类,因此对于事件抽取任务的前期处理具有重要价值。
[期刊] 情报学报  [作者] 李志义  王冕  赵鹏武  
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 图书情报工作  [作者] 陈德鑫  占袁圆  杨兵  谢亚霓  
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报学报  [作者] 王东波  叶文豪  吴毅  刘伙玉  苏新宁  沈思  
为了更深入地挖掘食品安全事件中的特征和规律,本文提出了食品安全事件时间演化序列自动生成方法。首先从食品安全事件的时间构成、时间表达式左右边界特征、时间常用词三方面分析了食品安全事件时间的表达特征。基于时间表达式的多种特征,采用基于条件随机场模型的方法对时间表达式进行识别,F值最高达90%。然后以含有时间表达式的"句"为单位,将一个事件分为多个"时间-事件"的组合,最后采用基于时间戳的逆向匹配法生成事件时间演化序列。该方法可用于分析食品安全事件的发展脉络与特征,以期为政府实施食品安全事件监控提供理论与技术支
[期刊] 情报学报  [作者] 李志义  黄子风  许晓绵  
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 图书情报工作  [作者] 魏巍  郑杜  
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 情报学报  [作者] 吴俊  程垚  郝瀚  艾力亚尔·艾则孜  刘菲雪  苏亦坡  
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
[期刊] 情报科学  [作者] 邱明涛  马静  张磊  姚兆旭  
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除