- 年份
- 2024(4869)
- 2023(7030)
- 2022(6010)
- 2021(5692)
- 2020(4907)
- 2019(11185)
- 2018(11048)
- 2017(21705)
- 2016(11140)
- 2015(12579)
- 2014(12114)
- 2013(11454)
- 2012(10191)
- 2011(8783)
- 2010(8194)
- 2009(7059)
- 2008(6407)
- 2007(4927)
- 2006(3836)
- 2005(2851)
- 学科
- 济(43864)
- 经济(43821)
- 管理(35641)
- 业(33143)
- 企(28516)
- 企业(28516)
- 方法(25982)
- 数学(23445)
- 数学方法(23105)
- 财(13531)
- 农(10236)
- 务(10028)
- 财务(9989)
- 财务管理(9970)
- 业经(9776)
- 企业财务(9529)
- 中国(9370)
- 技术(7630)
- 贸(7335)
- 贸易(7332)
- 理论(7314)
- 易(7170)
- 农业(6928)
- 学(6836)
- 和(6712)
- 地方(6500)
- 环境(6413)
- 信息(6364)
- 制(5997)
- 划(5890)
- 机构
- 大学(145746)
- 学院(144400)
- 管理(65645)
- 济(59770)
- 经济(58822)
- 理学(58167)
- 理学院(57694)
- 管理学(56756)
- 管理学院(56461)
- 研究(38190)
- 中国(29369)
- 京(27970)
- 财(27001)
- 财经(22919)
- 科学(22187)
- 经(21138)
- 中心(20793)
- 业大(20585)
- 江(18778)
- 经济学(18734)
- 农(17981)
- 财经大学(17553)
- 经济学院(17188)
- 商学(17054)
- 经济管理(17040)
- 范(16979)
- 商学院(16907)
- 师范(16808)
- 北京(16053)
- 所(15845)
- 基金
- 项目(110524)
- 科学(89633)
- 基金(84042)
- 研究(81362)
- 家(72183)
- 国家(71647)
- 科学基金(64487)
- 社会(53935)
- 社会科(51356)
- 社会科学(51345)
- 基金项目(45361)
- 自然(42163)
- 省(42018)
- 自然科(41292)
- 自然科学(41283)
- 自然科学基金(40558)
- 教育(37772)
- 划(35232)
- 资助(33210)
- 编号(33167)
- 成果(25110)
- 部(25058)
- 重点(24036)
- 创(23832)
- 国家社会(23342)
- 发(22515)
- 教育部(22434)
- 人文(22298)
- 创新(22282)
- 科研(21881)
共检索到188630条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
聂卉 黄贵鹏
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S-DOM树。从S-DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。
关键词:
Web信息抽取 语义标注 包装器
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 情报理论与实践
[作者]
赵洁 金培权
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题。本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论。在此基础上讨论了Web时态信息的本体表示问题。最后,预测了Web时态信息抽取与检索的若干未来发展方向。
关键词:
信息抽取 信息检索 网络
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 情报理论与实践
[作者]
朱红灿 邹凯
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。
关键词:
机器学习 链接抽取 主题漂移 贝叶斯算法
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报学报
[作者]
刘挺 吴岩 王开铸
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织,生成连贯的段落
关键词:
自动文摘,信息抽取,文本生成
[期刊] 图书馆建设
[作者]
白华
针对用户标注的弱点,在标签的基础上构建本体框架并赋予标签丰富的语义,有助于进一步改善知识组织系统的性能。在大量标签数据的支持下,提取知识框架是一种建立本体框架的有效方法,提取方法主要采用特征或属性概括法,即针对一类标签集合的共同特征抽取它们的上位概念,并根据这些上位概念的关系建立知识框架。对基于两种系统的语义分析而构建的可以整合标签和概念本体的兼容本体进行分析可知,它吸取了用户标注的灵活、多元、表达性强大的特征,提高了知识组织系统的组织能力和标引功能;同时,也改进了用户标注系统的语义能力,使之具有丰富的结构和语义表达功能。
关键词:
用户标注 本体框架抽取 知识组织系统
[期刊] 情报理论与实践
[作者]
张海潮 王昊 唐慧慧 薛蔚
[目的/意义]探讨中文社会科学领域题名关键词最佳抽取模型,用以获取引文题名关键词,完成附加关键词的抽取。[方法/过程]文章以2014年CSSCI全部文献的题名为语料,运用条件随机场(CRFs),通过探究不同特征(或集合)和参数对关键词识别的影响,构建字角色标注的题名关键词标引模型,最终迁移应用到引文题名。[结果/结论]通过实验,获得最佳题名关键词标引模型,F1值可达到52.03%,每篇原文可获得附加关键词9个左右。在恰当的特征组合与参数下,构建的标引模型可以有效完成附加关键词的获取工作。[局限]语料中的每个关键词平均出现两次可能会影响机器学习的效果,原文与引文题名的差异可能影响模型的适用性,此外模型得到的附加关键词尚需进一步斟酌选择。
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
[期刊] 情报理论与实践
[作者]
王吉林 舒江波 李勇 杨森
近年来Web信息抽取技术领域的研究已经取得了一定进展,但系统的抽取性能仍有待提高。针对这一问题,提出了一种Web主题信息自动化抽取的新框架。该框架提供了一种自动生成网页信息抽取规则的方法,并将网页信息抽取的任务由服务器端转移到客户端,充分利用网页设计模版的结构化、层次化特点,通过对网页进行爬取、净化和处理,转化成XML文档,然后根据XPath定位主题信息,抽取出该主题信息的公共抽取规则。实验结果表明,该方法能快速有效地抽取所定制的感兴趣的主题网页信息,并且具有较高的准确率。
关键词:
主题信息 信息抽取 规则
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 图书情报工作
[作者]
俞琰 陈磊 姜金德 赵乃瑄
[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。
关键词:
网络招聘文本 技能信息自动抽取 术语抽取
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除