- 年份
- 2024(4714)
- 2023(6781)
- 2022(5797)
- 2021(5531)
- 2020(4744)
- 2019(10861)
- 2018(10798)
- 2017(21286)
- 2016(10892)
- 2015(12230)
- 2014(11785)
- 2013(11135)
- 2012(9842)
- 2011(8434)
- 2010(7781)
- 2009(6756)
- 2008(6034)
- 2007(4687)
- 2006(3584)
- 2005(2623)
- 学科
- 济(43389)
- 经济(43350)
- 管理(34909)
- 业(32598)
- 企(27988)
- 企业(27988)
- 方法(25823)
- 数学(23358)
- 数学方法(23030)
- 财(13148)
- 农(10128)
- 务(9738)
- 财务(9700)
- 财务管理(9682)
- 业经(9661)
- 企业财务(9292)
- 中国(9096)
- 技术(7522)
- 贸(7219)
- 贸易(7218)
- 理论(7087)
- 易(7059)
- 农业(6870)
- 学(6633)
- 和(6612)
- 地方(6421)
- 环境(6342)
- 信息(6306)
- 制(5777)
- 划(5776)
- 机构
- 大学(142531)
- 学院(141430)
- 管理(64597)
- 济(58828)
- 经济(57927)
- 理学(57291)
- 理学院(56835)
- 管理学(55934)
- 管理学院(55649)
- 研究(37108)
- 中国(27867)
- 京(27092)
- 财(26103)
- 财经(22365)
- 科学(21547)
- 经(20632)
- 业大(20198)
- 中心(20190)
- 经济学(18520)
- 江(18092)
- 农(17500)
- 财经大学(17144)
- 经济学院(17016)
- 经济管理(16844)
- 商学(16762)
- 商学院(16617)
- 范(16459)
- 师范(16295)
- 北京(15461)
- 所(15077)
- 基金
- 项目(108925)
- 科学(88422)
- 基金(82878)
- 研究(80234)
- 家(71158)
- 国家(70627)
- 科学基金(63620)
- 社会(53282)
- 社会科(50745)
- 社会科学(50734)
- 基金项目(44745)
- 自然(41570)
- 省(41516)
- 自然科(40708)
- 自然科学(40699)
- 自然科学基金(39989)
- 教育(37252)
- 划(34756)
- 资助(32757)
- 编号(32610)
- 部(24721)
- 成果(24550)
- 重点(23693)
- 创(23538)
- 国家社会(23053)
- 发(22254)
- 教育部(22133)
- 创新(22001)
- 人文(21995)
- 科研(21576)
共检索到180928条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 情报理论与实践
[作者]
赵洁 金培权
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题。本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论。在此基础上讨论了Web时态信息的本体表示问题。最后,预测了Web时态信息抽取与检索的若干未来发展方向。
关键词:
信息抽取 信息检索 网络
[期刊] 图书情报工作
[作者]
聂卉 黄贵鹏
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S-DOM树。从S-DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。
关键词:
Web信息抽取 语义标注 包装器
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 情报理论与实践
[作者]
朱红灿 邹凯
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。
关键词:
机器学习 链接抽取 主题漂移 贝叶斯算法
[期刊] 情报理论与实践
[作者]
王吉林 舒江波 李勇 杨森
近年来Web信息抽取技术领域的研究已经取得了一定进展,但系统的抽取性能仍有待提高。针对这一问题,提出了一种Web主题信息自动化抽取的新框架。该框架提供了一种自动生成网页信息抽取规则的方法,并将网页信息抽取的任务由服务器端转移到客户端,充分利用网页设计模版的结构化、层次化特点,通过对网页进行爬取、净化和处理,转化成XML文档,然后根据XPath定位主题信息,抽取出该主题信息的公共抽取规则。实验结果表明,该方法能快速有效地抽取所定制的感兴趣的主题网页信息,并且具有较高的准确率。
关键词:
主题信息 信息抽取 规则
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 图书馆理论与实践
[作者]
阳广元
以国内2002年1月至2016年5月间发表的与基于本体的信息抽取有关的期刊文献为分析对象,运用内容分析法从领域本体的构建及基于本体的信息抽取方法、信息抽取模型、信息抽取算法、信息抽取系统、信息抽取的应用领域等6个方面对国内该领域的研究现状与热点进行分析,认为目前国内该研究领域具有研究内容从理论走向实践、研究主体多样性、尚未形成核心作者和核心团队等特点,指出本体构建的自动化及基于本体的信息抽取的评估机制、信息抽取的实践应用将成为未来的发展趋势。
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报学报
[作者]
刘挺 吴岩 王开铸
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织,生成连贯的段落
关键词:
自动文摘,信息抽取,文本生成
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除