- 年份
- 2024(5406)
- 2023(8141)
- 2022(6863)
- 2021(6549)
- 2020(5737)
- 2019(13559)
- 2018(13806)
- 2017(26533)
- 2016(14627)
- 2015(17200)
- 2014(17791)
- 2013(17515)
- 2012(16290)
- 2011(14808)
- 2010(15146)
- 2009(14036)
- 2008(14318)
- 2007(13282)
- 2006(11501)
- 2005(10352)
- 学科
- 济(57480)
- 经济(57419)
- 管理(42715)
- 业(40389)
- 企(33142)
- 企业(33142)
- 方法(27586)
- 数学(23566)
- 数学方法(23290)
- 农(16862)
- 财(16850)
- 中国(14857)
- 学(13583)
- 业经(13091)
- 理论(12146)
- 制(11481)
- 务(11419)
- 贸(11405)
- 贸易(11398)
- 地方(11394)
- 财务(11376)
- 财务管理(11337)
- 易(11008)
- 农业(10972)
- 企业财务(10679)
- 和(10474)
- 银(9082)
- 银行(9057)
- 行(8489)
- 技术(8434)
- 机构
- 学院(216146)
- 大学(215570)
- 管理(81577)
- 济(80736)
- 经济(78632)
- 研究(69319)
- 理学(68857)
- 理学院(68067)
- 管理学(66703)
- 管理学院(66289)
- 中国(53468)
- 京(46572)
- 科学(44554)
- 财(39445)
- 农(37700)
- 所(36521)
- 江(35077)
- 中心(33850)
- 研究所(32865)
- 业大(32719)
- 财经(30999)
- 农业(29806)
- 北京(29479)
- 范(29420)
- 师范(29113)
- 州(28370)
- 经(27766)
- 技术(25739)
- 院(24485)
- 经济学(24124)
- 基金
- 项目(136077)
- 科学(104090)
- 研究(101074)
- 基金(94311)
- 家(82169)
- 国家(81461)
- 科学基金(68393)
- 社会(59264)
- 社会科(55871)
- 社会科学(55849)
- 省(54779)
- 基金项目(50025)
- 教育(47883)
- 划(45721)
- 编号(45308)
- 自然(44407)
- 自然科(43289)
- 自然科学(43275)
- 自然科学基金(42486)
- 资助(39459)
- 成果(38310)
- 重点(30834)
- 课题(30386)
- 部(29455)
- 发(29002)
- 创(27882)
- 项目编号(27739)
- 科研(26229)
- 创新(26023)
- 大学(25939)
共检索到324827条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
王吉林 舒江波 李勇 杨森
近年来Web信息抽取技术领域的研究已经取得了一定进展,但系统的抽取性能仍有待提高。针对这一问题,提出了一种Web主题信息自动化抽取的新框架。该框架提供了一种自动生成网页信息抽取规则的方法,并将网页信息抽取的任务由服务器端转移到客户端,充分利用网页设计模版的结构化、层次化特点,通过对网页进行爬取、净化和处理,转化成XML文档,然后根据XPath定位主题信息,抽取出该主题信息的公共抽取规则。实验结果表明,该方法能快速有效地抽取所定制的感兴趣的主题网页信息,并且具有较高的准确率。
关键词:
主题信息 信息抽取 规则
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 情报理论与实践
[作者]
赵洁 金培权
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题。本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论。在此基础上讨论了Web时态信息的本体表示问题。最后,预测了Web时态信息抽取与检索的若干未来发展方向。
关键词:
信息抽取 信息检索 网络
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报理论与实践
[作者]
高庆宁 吴鹏 张晶晶
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。
关键词:
文档对象模型 算法 网页 信息抽取
[期刊] 宏观经济管理
[作者]
郭雪梅 吕利 王轶 白丹
在当前能源资源约束增强和日益严峻的全球减排温室气体形势下,世界各国纷纷调整能源消费结构,转变经济发展模式。分布式能源作为未来世界能源技术的重要发展方向,备受政府和企业的关注,尤其开拓国内终端市场是国内光伏产业生存和发展的根本出路,应大力推进分布式新能源可持续发展。
关键词:
分布式新能源 规模化利用 可持续发展
[期刊] 图书情报工作
[作者]
聂卉 黄贵鹏
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S-DOM树。从S-DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。
关键词:
Web信息抽取 语义标注 包装器
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报理论与实践
[作者]
聂卉 张津华
以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。
关键词:
网页 信息抽取 主题分析
[期刊] 中国远程教育
[作者]
吴娱
回顾分布式领导的缘起、内涵与类型,分析教育信息化发展趋势与教育资源共享情境,从分布式领导的视角,教育信息化领导力促进教育资源共享的过程可划分为初创规划阶段、协同互动阶段和主动创新阶段。以此为基础,教育信息化领导力在教育资源共享实践中不断完善、螺旋演进。当起步与推广阶段的分布式领导方式逐渐嵌入教育资源共建共享过程中,则分布式领导逐渐进入比较成熟的阶段,继而在资源共享实践中建立制度保障,渗透共享文化理念,形成自下而上、主动创新的氛围。我国教育信息化已经步入以应用能力建设为核心的发展阶段,要探索多元共治的教育资
[期刊] 中国图书馆学报
[作者]
耿骞 汤艳莉
多Agent系统对数字图书馆的建立 ,特别是在因特网这样的分布开放环境下建立数字图书馆具有重要意义。多Agent的分布式、主动性、智能性、反应性、适应性、移动性和合作性为数字图书馆提供了良好的理论与技术基础。图 1。参考文献 15。
[期刊] 情报理论与实践
[作者]
朱红灿 邹凯
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。
关键词:
机器学习 链接抽取 主题漂移 贝叶斯算法
[期刊] 情报科学
[作者]
李枫林 柯佳
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识
关键词:
深度学习 神经网络 实体关系抽取 词向量
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除