- 年份
- 2024(9346)
- 2023(13561)
- 2022(11962)
- 2021(11285)
- 2020(9438)
- 2019(21907)
- 2018(21723)
- 2017(42197)
- 2016(22483)
- 2015(25560)
- 2014(25195)
- 2013(24427)
- 2012(22198)
- 2011(19612)
- 2010(19273)
- 2009(17310)
- 2008(16523)
- 2007(13996)
- 2006(11955)
- 2005(9943)
- 学科
- 济(87455)
- 经济(87349)
- 管理(66653)
- 业(63530)
- 企(54043)
- 企业(54043)
- 方法(45399)
- 数学(39518)
- 数学方法(38905)
- 财(23286)
- 农(22514)
- 中国(21173)
- 业经(19717)
- 学(19382)
- 地方(16044)
- 务(15877)
- 财务(15803)
- 财务管理(15766)
- 理论(15615)
- 农业(15133)
- 企业财务(14989)
- 贸(14804)
- 贸易(14797)
- 技术(14593)
- 和(14529)
- 易(14375)
- 环境(13599)
- 制(13427)
- 划(12433)
- 银(11335)
- 机构
- 大学(313853)
- 学院(310570)
- 管理(130350)
- 济(119546)
- 经济(117007)
- 理学(114330)
- 理学院(113124)
- 管理学(110937)
- 管理学院(110368)
- 研究(96965)
- 中国(70167)
- 京(65714)
- 科学(61702)
- 财(53599)
- 业大(47675)
- 农(46922)
- 所(46616)
- 中心(45545)
- 财经(44486)
- 研究所(43016)
- 江(42465)
- 北京(40699)
- 范(40663)
- 经(40649)
- 师范(40289)
- 农业(36813)
- 院(35833)
- 经济学(35292)
- 州(34995)
- 财经大学(33572)
- 基金
- 项目(225290)
- 科学(177830)
- 基金(164978)
- 研究(163737)
- 家(144016)
- 国家(142605)
- 科学基金(123778)
- 社会(102617)
- 社会科(97237)
- 社会科学(97208)
- 基金项目(88170)
- 省(87184)
- 自然(82190)
- 自然科(80334)
- 自然科学(80314)
- 自然科学基金(78855)
- 教育(75494)
- 划(73509)
- 资助(68027)
- 编号(67261)
- 成果(53165)
- 重点(49491)
- 部(49435)
- 创(46768)
- 发(46492)
- 课题(44476)
- 科研(43596)
- 创新(43582)
- 教育部(42701)
- 大学(42469)
- 期刊
- 济(120177)
- 经济(120177)
- 研究(84684)
- 中国(51702)
- 学报(50181)
- 管理(45719)
- 科学(45261)
- 农(41261)
- 财(40805)
- 大学(38159)
- 学学(35688)
- 教育(33170)
- 农业(29389)
- 技术(28275)
- 图书(20927)
- 财经(20566)
- 融(20231)
- 金融(20231)
- 业经(20183)
- 经济研究(19089)
- 经(17423)
- 理论(15923)
- 科技(15492)
- 问题(15478)
- 情报(15417)
- 技术经济(15011)
- 业(14974)
- 实践(14901)
- 践(14901)
- 版(14585)
共检索到428864条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆杂志
[作者]
鲍宸洋 任明
实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键。目前深度学习在家谱文本信息抽取方面取得了良好的效果,但是对标注数据的依赖始终是其发展瓶颈之一。本文面向家谱的世系小传,研究基于小规模标注数据进行家谱人物和关系的抽取方法。具体来说:基于Bootstrapping的思想,以少量的标注数据作为初始种子集,使用深度学习BiLSTM-CRF模型为待标注样本自动预测标签序列,并筛选高置信分数的样本加入标注集中,从而迭代地扩展标注集,最后训练得到的模型用于命名实体识别和关系抽取。基于真实数据集的实验表明,使用Bootstrapping改进的BiLSTM-CRF模型能够基于小规模标注数据实现家谱信息抽取,使基于深度学习的家谱信息抽取更加高效。在种子集规模为250条时取得的预测效果与训练集规模为1800条的BiLSTM-CRF模型的预测效果接近。
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 情报学报
[作者]
刘挺 吴岩 王开铸
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织,生成连贯的段落
关键词:
自动文摘,信息抽取,文本生成
[期刊] 图书情报工作
[作者]
俞琰 陈磊 姜金德 赵乃瑄
[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。
关键词:
网络招聘文本 技能信息自动抽取 术语抽取
[期刊] 数字图书馆论坛
[作者]
黄政 张学福
本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
[期刊] 情报学报
[作者]
梁娜 姚长青 王峥 高影繁 李岩
近年来,企业年报的篇幅越来越长,三大财务报表作为年报的主体,其内容几乎没有再增加,而财务报表之外的文字内容却愈加丰富,各种补充说明及解释成为了解公司生产经营现状的有益补充。其中,风险信息披露字段因其前瞻性和决策相关性逐渐成为学者们关注的焦点,如何从大量的风险信息中抽取出真正有价值的内容成为值得研究的问题。因此,本文以全部A股上市公司2016年半年报中披露的风险信息作为背景数据,提出三重维度的风险信息抽取方法,对风险描述文本中的风险信息进行抽取,使得抽取出的风险信息具有更丰富的信息含量,尽可能表征原始风险描述文本所要表达的信息。
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除