- 年份
- 2024(6730)
- 2023(9877)
- 2022(8822)
- 2021(8431)
- 2020(6965)
- 2019(16359)
- 2018(16512)
- 2017(31638)
- 2016(17245)
- 2015(19530)
- 2014(19525)
- 2013(19267)
- 2012(17458)
- 2011(15516)
- 2010(15335)
- 2009(13794)
- 2008(13257)
- 2007(11284)
- 2006(9810)
- 2005(8339)
- 学科
- 济(65760)
- 经济(65690)
- 管理(51375)
- 业(47292)
- 企(40530)
- 企业(40530)
- 方法(33551)
- 数学(28822)
- 数学方法(28477)
- 财(17133)
- 农(16397)
- 中国(15946)
- 业经(15431)
- 学(15227)
- 理论(13037)
- 地方(12998)
- 务(11896)
- 财务(11833)
- 财务管理(11813)
- 和(11511)
- 企业财务(11261)
- 技术(11155)
- 农业(11126)
- 贸(10885)
- 贸易(10880)
- 易(10541)
- 环境(10436)
- 制(10392)
- 教育(9666)
- 划(9356)
- 机构
- 大学(241233)
- 学院(238792)
- 管理(100356)
- 济(88069)
- 理学(87396)
- 理学院(86478)
- 经济(85991)
- 管理学(84969)
- 管理学院(84537)
- 研究(74277)
- 中国(53826)
- 京(51474)
- 科学(48233)
- 财(39888)
- 业大(36634)
- 所(36377)
- 农(35853)
- 中心(34745)
- 研究所(33376)
- 江(33318)
- 财经(32879)
- 北京(32339)
- 范(31545)
- 师范(31269)
- 经(29872)
- 农业(28146)
- 州(28134)
- 院(27244)
- 技术(26257)
- 商学(25477)
- 基金
- 项目(170440)
- 科学(133185)
- 研究(125244)
- 基金(122768)
- 家(106379)
- 国家(105483)
- 科学基金(91272)
- 社会(76368)
- 社会科(72263)
- 社会科学(72244)
- 省(66875)
- 基金项目(66193)
- 自然(60667)
- 自然科(59247)
- 自然科学(59236)
- 自然科学基金(58170)
- 教育(57754)
- 划(55954)
- 编号(52633)
- 资助(50747)
- 成果(42516)
- 重点(37079)
- 部(36905)
- 创(35371)
- 课题(35135)
- 发(34841)
- 项目编号(33304)
- 创新(32843)
- 科研(32683)
- 大学(32252)
共检索到334996条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
赵洁 金培权
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题。本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论。在此基础上讨论了Web时态信息的本体表示问题。最后,预测了Web时态信息抽取与检索的若干未来发展方向。
关键词:
信息抽取 信息检索 网络
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 中国图书馆学报
[作者]
沈思 李成名 吴鹏
基于时态语义的Web信息检索在动态时间信息挖掘、群体记忆、时间问答系统等检索情景中具有相对广泛的应用。在大数据和人工智能迅猛发展的大趋势下,对基于时态语义的Web信息检索从关键技术的角度进行系统而全面的综述,不仅有利于了解该领域研究的整体状况,而且有益于把握时态检索的未来发展趋势。本文在引入文本时间信息的抽取和标注并融合时间信息的检索模型的基础上,以时态语义的技术为整体脉络,从三个方面综述研究情况:信息需求中隐含的时间意图分析,加入时间因素的检索模型构建,时间对提升检索结果的生成。以时态语义检索的本源问题和其在学术文献上的相关应用为切入点,提出时态语义检索未来的发展趋势:识别多源异构信息下的时间表达,构建能识别查询的时间预测模型,搭建能精准检索时间意图的检索平台和开发基于深度学习的隐含时间意图自动分类模型。
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 数据分析与知识发现
[作者]
张晓娟 韩毅
【目的】总结国内外时态信息检索研究现状,以期为相关学者更好地把握时态信息检索研究问题提供理论基础。【文献范围】在Google Scholar中分别以检索式"Temporal Information"与"时态信息"且不限定时间范围地进行文献检索,获得部分相关文献后,再结合追溯法最终得到92篇相关文献。【方法】基于文献调研与归纳总结方法,分别从文档中时态信息抽取、查询中时态信息识别和时间感知排序三方面对时态信息检索的相关研究进行综述与评述。【结果】研究发现时态信息检索研究存在着如下问题和挑战:国外对时态检索研
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 情报学报
[作者]
李志义 黄子风 许晓绵
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 情报学报
[作者]
王晔 王继成 张福炎
本文针对当前Web信息检索的不足 ,提出了一种新的基于元数据的检索方式 ,并利用Z39 50协议实现了一个检索服务器。通过DublinCore元数据集到MARC的相互转化 ,保持了与通用的Z39 50客户端的兼容性
[期刊] 图书情报工作
[作者]
聂卉 黄贵鹏
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S-DOM树。从S-DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。
关键词:
Web信息抽取 语义标注 包装器
[期刊] 情报理论与实践
[作者]
王吉林 舒江波 李勇 杨森
近年来Web信息抽取技术领域的研究已经取得了一定进展,但系统的抽取性能仍有待提高。针对这一问题,提出了一种Web主题信息自动化抽取的新框架。该框架提供了一种自动生成网页信息抽取规则的方法,并将网页信息抽取的任务由服务器端转移到客户端,充分利用网页设计模版的结构化、层次化特点,通过对网页进行爬取、净化和处理,转化成XML文档,然后根据XPath定位主题信息,抽取出该主题信息的公共抽取规则。实验结果表明,该方法能快速有效地抽取所定制的感兴趣的主题网页信息,并且具有较高的准确率。
关键词:
主题信息 信息抽取 规则
[期刊] 情报理论与实践
[作者]
朱红灿 邹凯
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。
关键词:
机器学习 链接抽取 主题漂移 贝叶斯算法
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 情报学报
[作者]
张晓林
本文描述网络环境语义检索的需求 ,分析SemanticWeb的组成框架 ,探讨概念集 (ontologies)及其定义和标记语言 ,并介绍基于概念集的信息资源语义标注和语义推理基本过程。
[期刊] 情报理论与实践
[作者]
储节旺 郭春侠 袁勤俭
Several characteristics of network based information retrieval are described.The existing tactics of information retrieval under the network circumstances are studied.Based on this,the paper puts forward a new tactics.
[期刊] 情报理论与实践
[作者]
郭少友
用户当前正在浏览的网页内容有助于说明用户的即时信息需求。在现有相关研究的基础上提出了一种基于上下文的W eb即时信息检索方法,该方法允许用户从正在浏览的网页中选择一段文本作为原始检索条件,由检索系统从其上下文中提取一级扩展词和二级扩展词来形成新的检索条件进行检索,并将检索结果按相似度从大到小的顺序呈现给用户。
关键词:
信息检索 即时信息需求 检索方法
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除