搜索文献-EPS

年份: 2024(7209); 2023(10470); 2022(9237); 2021(8711); 2020(7325); 2019(16953); 2018(17286); 2017(32949); 2016(17767); 2015(20345); 2014(20349); 2013(20047); 2012(18379); 2011(16278); 2010(16082); 2009(14618); 2008(14156); 2007(12270); 2006(10690); 2005(9272)

作者: 王(52671); 张(43441); 李(43257); 刘(41067); 陈(27728); 杨(21024); 晓(19674); 赵(17244); 周(16610); 华(15552); 吴(15016); 文(14520); 明(13781); 林(13742); 伟(13403); 丽(13232); 志(13154); 孙(13016); 黄(12516); 徐(12388); 玉(10856); 平(10653); 军(10478); 朱(9862); 红(9810); 建(9717); 郭(9688); 胡(9562); 春(8753); 艳(8621)

学科: 济(70162); 经济(70090); 管理(56130); 业(53591); 企(46059); 企业(46059); 方法(35791); 数学(30598); 数学方法(30133); 财(17554); 农(17496); 技术(17246); 学(16931); 中国(16429); 业经(16057); 理论(13474); 地方(12975); 务(12371); 财务(12301); 财务管理(12279); 贸(12246); 贸易(12241); 和(12186); 农业(12033); 易(11902); 企业财务(11700); 环境(11133); 制(10558); 划(10076); 教育(9725)

机构: 大学(257500); 学院(254386); 管理(106971); 济(94884); 理学(93148); 经济(92642); 理学院(92173); 管理学(90455); 管理学院(89999); 研究(81080); 中国(58311); 京(55348); 科学(52969); 财(41498); 所(40420); 业大(40212); 农(39855); 中心(37310); 研究所(37150); 江(35598); 北京(34999); 财经(34314); 范(33417); 师范(33118); 农业(31409); 经(31183); 州(29815); 院(29654); 技术(28992); 师范大学(26834)

基金: 项目(180846); 科学(141721); 研究(131376); 基金(130746); 家(114087); 国家(113186); 科学基金(97643); 社会(80319); 社会科(76133); 社会科学(76110); 省(70662); 基金项目(70026); 自然(65361); 自然科(63858); 自然科学(63847); 自然科学基金(62696); 教育(60083); 划(59477); 编号(54382); 资助(54293); 成果(43611); 重点(39735); 部(39168); 创(37797); 发(37293); 课题(36380); 创新(35210); 科研(34637); 项目编号(34377); 大学(33479)

期刊: 济(98357); 经济(98357); 研究(70382); 中国(44617); 学报(42254); 管理(38185); 科学(38065); 农(34863); 大学(31156); 财(30692); 学学(28952); 教育(28828); 技术(25612); 农业(25310); 图书(19454); 融(16215); 金融(16215); 业经(15942); 财经(15590); 经济研究(15208); 情报(14534); 科技(14503); 技术经济(14309); 理论(14136); 实践(13373); 践(13373); 经(13098); 业(12964); 书馆(12640); 图书馆(12640)

全选本页取消本页

共检索到358956条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

全自动生成网页信息抽取包装器的主要技术方法研究

[期刊] 情报理论与实践 [作者] 李广建乔建忠

网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。

关键词：信息抽取包装器信息技术深层网

一种基于网页信息抽取的OA期刊资源采集方法研究

[期刊] 数字图书馆论坛 [作者] 黄政张学福

本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了

关键词： OA期刊 OA期刊资源采集网页信息采集 OA期刊资源采集系统

结合语义知识的藏文网页主题句抽取算法研究

[期刊] 图书馆理论与实践 [作者] 艾金勇

通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。

关键词：藏文网页语义信息主题句抽取

基于领域本体的Web信息抽取方法的设计与实现——以网易汽车资讯网页信息抽取为例

[期刊] 图书馆论坛 [作者] 吴恒亮

以网易汽车资讯网页信息抽取为例,研究了基于领域本体的Web信息抽取技术的设计与实现。

关键词： Web信息抽取领域本体 Web数据挖掘

基于引用背景信息的关键词自动抽取方法研究

[期刊] 情报理论与实践 [作者] 宋宇罗准辰真溱

科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息，用来改进关键词自动抽取效果的方法，并通过实验验证了方法的有效性。

关键词：自动抽取关键词科技文献引用

基于文档对象模型与行块分布算法的网页信息抽取

[期刊] 情报理论与实践 [作者] 高庆宁吴鹏张晶晶

［目的］网页所表达的主要信息通常隐藏在大量无关的结构和内容中，使用户不能迅速获取主题内容，限制了网页资源的可用性，使用信息抽取技术解决了这一问题。［方法］基于文档对象模型（ＤＯＭ）的信息抽取技术能够简单准确地从网页中提取所需内容，但依靠网页本身结构；基于行块分布算法的技术摆脱网页结构的限制，克服限定数据源的缺点，但需要人工干预，文章结合ＤＯＭ技术和行块分布算法以及正则表达式，实现网页信息采集与信息抽取。［结论］能够自动准确提取网页信息。［局限］对英文以及结构复杂的网页抽取效果不是很理想，抽取内容仅限于文字。

关键词：文档对象模型算法网页信息抽取

基于网页规划布局的页面主题内容抽取

[期刊] 情报理论与实践 [作者] 聂卉张津华

以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。

关键词：网页信息抽取主题分析

基于信息抽取和文本生成的自动文摘系统设计

[期刊] 情报学报 [作者] 刘挺吴岩王开铸

本文提出了一种自动文摘系统的设计方案，该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析，并在此基础上参考用户对摘要的需求，抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织，生成连贯的段落

关键词：自动文摘,信息抽取,文本生成

基于Ontology的信息抽取技术方法分析

[期刊] 情报理论与实践 [作者] 洪娜张智雄刘建华

本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。

关键词：本体信息抽取信息技术

基于专家主页的信息源相关信息及关系抽取研究

[期刊] 情报理论与实践 [作者] 李天阳王新

关键词：

基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例

[期刊] 情报理论与实践 [作者] 钱爱兵江岚

结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。

关键词：词频逆文档频率新闻网页关键词抽取

网络招聘文本技能信息自动抽取研究

[期刊] 图书情报工作 [作者] 俞琰陈磊姜金德赵乃瑄

[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。

关键词：网络招聘文本技能信息自动抽取术语抽取

Deep Web信息抽取研究

[期刊] 图书情报工作 [作者] 董旻方曙

针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。

关键词： Deep Web 信息抽取查询接口命名实体识别文档对象模型

生成式情报学术语自动抽取与多维关联知识挖掘研究

[期刊] 情报学报 [作者] 胡昊天邓三鸿孔玲闫晓慧杨文霞王东波沈思

情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献，自动术语抽取替代了人工筛选，但现有方法严重依赖大规模标注数据集，难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法（generative term extraction for information science,GTX-IS），将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调，提升面向特定任务的文本生成能力，能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果，本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法，从术语自身、术语间关联、时间信息等维度，对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法，结合时间维度特征，从术语角度出发，完善期刊的动态简介，探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型，展现出较强的小样本学习能力，为领域信息抽取提供了新的思路。

关键词：情报学术语术语自动抽取文本生成科学计量热点分析

基于信息抽取的项目记忆获取方法研究

[期刊] 情报理论与实践 [作者] 徐进朱孝文

[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理，需要投入大量的人力和时间。如何表示项目记忆，以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆，仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇，利用依存句法和规则抽取方法得到项目记忆短语和基础信息，利用LDA模型提取项目文档的主题，并对文档集聚类和描述，达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析，验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。

关键词：项目记忆记忆获取知识抽取短语抽取主题建模

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

面向科技文献的混合语义信息抽取方法研究一种基于视觉分块的Web信息抽取方法研究基于Bootstrapping的家谱文本信息抽取方法研究信息抽取技术在数字图书馆中的应用研究事件抽取技术研究综述 Web时态信息抽取与检索研究基于GATE语义标注的Web信息的自动抽取关键词自动抽取技术综述基于三重维度的企业风险信息抽取方法研究针对科技路线图的文本挖掘研究:信息抽取方法