- 年份
- 2024(5404)
- 2023(7745)
- 2022(6588)
- 2021(6304)
- 2020(5333)
- 2019(12079)
- 2018(12083)
- 2017(23387)
- 2016(12056)
- 2015(13590)
- 2014(13285)
- 2013(12506)
- 2012(11126)
- 2011(9578)
- 2010(8970)
- 2009(7959)
- 2008(7113)
- 2007(5702)
- 2006(4521)
- 2005(3577)
- 学科
- 济(46662)
- 经济(46621)
- 管理(38499)
- 业(35269)
- 企(30413)
- 企业(30413)
- 方法(27309)
- 数学(24479)
- 数学方法(24093)
- 财(13853)
- 农(10964)
- 业经(10465)
- 务(10228)
- 财务(10181)
- 中国(10163)
- 财务管理(10161)
- 企业财务(9736)
- 理论(8495)
- 学(8333)
- 技术(8238)
- 贸(7506)
- 贸易(7502)
- 农业(7435)
- 和(7367)
- 环境(7360)
- 易(7326)
- 地方(7059)
- 制(6731)
- 信息(6606)
- 划(6492)
- 机构
- 大学(161596)
- 学院(160258)
- 管理(70725)
- 济(63495)
- 理学(62414)
- 经济(62336)
- 理学院(61896)
- 管理学(60754)
- 管理学院(60440)
- 研究(43539)
- 中国(32967)
- 京(31862)
- 财(28401)
- 科学(26210)
- 财经(24156)
- 业大(23831)
- 中心(23345)
- 经(22255)
- 江(21065)
- 农(20838)
- 经济学(19596)
- 范(19308)
- 师范(19056)
- 北京(18664)
- 财经大学(18510)
- 所(18412)
- 经济管理(18264)
- 商学(18000)
- 经济学院(17911)
- 商学院(17842)
- 基金
- 项目(121590)
- 科学(97997)
- 基金(91647)
- 研究(88479)
- 家(79258)
- 国家(78672)
- 科学基金(70302)
- 社会(57606)
- 社会科(54842)
- 社会科学(54830)
- 基金项目(49201)
- 自然(46545)
- 省(46539)
- 自然科(45562)
- 自然科学(45551)
- 自然科学基金(44744)
- 教育(41538)
- 划(39280)
- 资助(36621)
- 编号(35840)
- 成果(27209)
- 部(27147)
- 重点(26673)
- 创(26078)
- 国家社会(24801)
- 发(24704)
- 创新(24370)
- 教育部(24088)
- 科研(23967)
- 人文(23698)
共检索到210280条记录
相关度优先
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
刘挺 吴岩 王开铸
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织,生成连贯的段落
关键词:
自动文摘,信息抽取,文本生成
[期刊] 情报学报
[作者]
王晓宇 王芳
鉴于关键词对大规模文献检索和文本内容分析的基础作用,本文提出了一种基于语义文本图的无监督关键词抽取算法,重点对传统基于图(graph-based)方法中的文本图构建和词加权方式进行改进。为了使文本图保留更多的语义和结构信息,算法根据单词在句子中的语义依存关系,生成由概念连接、等价隶属、功能属性和修饰限定四种属性边构成的语义文本图,省去传统图生成方法中所需要的窗口长度参数设定。在此基础上,本文提出融合关键词位置信息、概念层级和连接强度的词权重计算方法,并对词语的重要性排序,最终选择高得分节点构成摘要文本的关键词集合。在四个开放语料上的实验结果显示,本文提出的方法抽词效果优于其他三个同类baseline算法,F1值最高为0.570。
关键词:
文本图 关键词抽取 词加权 句法解析
[期刊] 图书情报工作
[作者]
俞琰 陈磊 姜金德 赵乃瑄
[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。
关键词:
网络招聘文本 技能信息自动抽取 术语抽取
[期刊] 情报理论与实践
[作者]
李广建 乔建忠
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
关键词:
信息抽取 包装器 信息技术 深层网
[期刊] 情报理论与实践
[作者]
王知津 李宇
文本生成模型与文摘编写的理论探讨王知津李宇(南开大学信息资源管理系天津300071AbstractApplyingthemethodofmodelingintextlinguisticsandcomputationallinguistics,them...
[期刊] 清华大学教育研究
[作者]
高小云 程慕胜
自动文摘是通过人工智能技术 ,利用计算机从文章中自动提取内容生成摘要的方法。与传统手工生成文摘的方式相比 ,自动文摘能够从大量文本中快速高效地检索和获取信息 ,节省了时间和人力。本文对目前流行的两类主要的自动文摘方法 ,即机械式文摘和理解式文摘进行了分析比较 ,并介绍了自动文摘的未来发展方向
[期刊] 图书情报工作
[作者]
聂卉 黄贵鹏
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S-DOM树。从S-DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。
关键词:
Web信息抽取 语义标注 包装器
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 图书馆杂志
[作者]
鲍宸洋 任明
实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键。目前深度学习在家谱文本信息抽取方面取得了良好的效果,但是对标注数据的依赖始终是其发展瓶颈之一。本文面向家谱的世系小传,研究基于小规模标注数据进行家谱人物和关系的抽取方法。具体来说:基于Bootstrapping的思想,以少量的标注数据作为初始种子集,使用深度学习BiLSTM-CRF模型为待标注样本自动预测标签序列,并筛选高置信分数的样本加入标注集中,从而迭代地扩展标注集,最后训练得到的模型用于命名实体识别和关系抽取。基于真实数据集的实验表明,使用Bootstrapping改进的BiLSTM-CRF模型能够基于小规模标注数据实现家谱信息抽取,使基于深度学习的家谱信息抽取更加高效。在种子集规模为250条时取得的预测效果与训练集规模为1800条的BiLSTM-CRF模型的预测效果接近。
[期刊] 情报学报
[作者]
杨晓兰 钟义信
本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析,填充预定的文摘框架,最后生成风格一致的文摘。基于上述理论的研究,设计并实现了计算机病毒领域的自动文摘实验系统,其效果较为理想。
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 图书馆建设
[作者]
杜伟 王世慧
摘要抽取是信息素质的高级能力之一,它和信息素质的交际层面——读和写、能力和活动、批判性阅读有着密切的关系;信息素质能力中的信息分析与信息合成能力也是摘要抽取必需的能力,许多信息素质模式中都含有摘要抽取的基本技能。摘要抽取应该引起重视,特别是在科技论文写作教学和图书情报学教育中,摘要抽取能力的培养应该处于非常重要的地位。
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
0
文献操作(0)
导出元数据
文献计量分析
导出文件格式:WXtxt