搜索文献-EPS

年份: 2024(9381); 2023(13639); 2022(12080); 2021(11353); 2020(9636); 2019(22442); 2018(22242); 2017(43296); 2016(22982); 2015(25913); 2014(25522); 2013(24930); 2012(22575); 2011(20062); 2010(19660); 2009(17785); 2008(17026); 2007(14443); 2006(12373); 2005(10423)

作者: 王(64492); 张(53634); 李(53123); 刘(50633); 陈(34195); 杨(25831); 晓(24305); 赵(21221); 周(20622); 华(18973); 吴(18408); 文(17924); 林(16857); 明(16750); 伟(16632); 志(16190); 丽(16151); 孙(16018); 黄(15449); 徐(15319); 玉(13158); 平(12971); 军(12858); 朱(12312); 胡(11911); 郭(11900); 红(11829); 建(11736); 春(10776); 艳(10620)

学科: 济(90286); 经济(90193); 管理(67518); 业(63038); 企(53850); 企业(53850); 方法(46112); 数学(40007); 数学方法(39360); 财(23648); 农(22410); 中国(21463); 学(20571); 业经(20049); 地方(16793); 理论(16410); 务(16194); 财务(16114); 财务管理(16079); 企业财务(15284); 贸(15159); 贸易(15152); 农业(15065); 易(14698); 和(14652); 技术(14582); 制(13887); 环境(13613); 划(12504); 银(11619)

机构: 大学(319418); 学院(315915); 管理(131034); 济(120789); 经济(118191); 理学(114744); 理学院(113551); 管理学(111272); 管理学院(110705); 研究(99947); 中国(72768); 京(67259); 科学(64138); 财(54508); 业大(49379); 农(49335); 所(48707); 中心(46526); 财经(44962); 研究所(44824); 江(44074); 北京(41809); 范(41151); 经(41022); 师范(40760); 农业(38613); 院(37259); 州(36275); 经济学(35618); 财经大学(33847)

基金: 项目(228206); 科学(179487); 基金(166427); 研究(164902); 家(145296); 国家(144155); 科学基金(124892); 社会(102691); 社会科(97349); 社会科学(97321); 基金项目(88855); 省(88703); 自然(83346); 自然科(81481); 自然科学(81460); 自然科学基金(79959); 教育(76216); 划(74707); 资助(68987); 编号(67538); 成果(53489); 重点(50408); 部(49907); 创(47233); 发(47055); 课题(45130); 科研(44309); 创新(44036); 教育部(42926); 大学(42907)

期刊: 济(121770); 经济(121770); 研究(86914); 中国(54317); 学报(52608); 科学(46865); 管理(46428); 农(43054); 财(41938); 大学(39973); 学学(37303); 教育(34475); 农业(30301); 技术(29070); 融(21171); 金融(21171); 图书(21132); 财经(20874); 业经(20441); 经济研究(19743); 经(17690); 理论(16118); 科技(15708); 问题(15620); 业(15526); 情报(15455); 技术经济(15359); 实践(15091); 践(15091); 版(14969)

全选本页取消本页

共检索到441047条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

一种基于视觉分块的Web信息抽取方法研究

[期刊] 情报理论与实践 [作者] 耿焕同宋庆席何宏强

随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。

关键词：网络信息抽取视觉分块

一种基于网页信息抽取的OA期刊资源采集方法研究

[期刊] 数字图书馆论坛 [作者] 黄政张学福

本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了

关键词： OA期刊 OA期刊资源采集网页信息采集 OA期刊资源采集系统

基于Heritrix的Web信息抽取

[期刊] 图书情报工作 [作者] 陈俊彬曹树金

针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。

关键词： Heritrix 信息抽取 HTMLparser Web数据采集

Deep Web信息抽取研究

[期刊] 图书情报工作 [作者] 董旻方曙

针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。

关键词： Deep Web 信息抽取查询接口命名实体识别文档对象模型

一种基于TFIDF方法的中文关键词抽取算法

[期刊] 情报理论与实践 [作者] 徐文海温有奎

本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。

关键词：关键词抽取向量空间模型算法

一种基于句法分析的情感标签抽取方法

[期刊] 图书情报工作 [作者] 李纲刘广兴毛进叶光辉

指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。

关键词：情感标签观点挖掘依存句法分析产品评论

基于分块和统计相结合的新闻正文抽取

[期刊] 情报理论与实践 [作者] 李烯徐朝军

本文提出一种结合网页分块与统计的方法来抽取新闻类网页中的正文。首先,在网页解析的基础上根据标签信息对网页进行分块处理,并计算出每一个内容块的实际长度;其次,在得到内容块的长度集合后,计算这些内容块长度的均值,同时利用方差能反映一组数据的波动大小的特性,按内容块长度降序排列并依次计算去掉最大内容块后的方差变化情况,寻找最有可能的正文内容块;最后随机选取了一些新闻网页进行测试,结果显示准确率可达96%,充分证明了该方法的有效性。

关键词：数据挖掘网页分块数学期望正文抽取

一种多模态信息增强表示的中文关键词抽取方法研究

[期刊] 清华大学学报(自然科学版) [作者] 周炫余刘林卢笑李璇张思敏

关键词抽取是指能自动抽取反映文本主题的词或者短语,被广泛应用于文本检索、文本摘要等领域中。目前关键词抽取任务主要依赖于预训练语言模型来获取文本表示,这类语言模型主要基于单一模态的通用文本语料进行训练,存在无法根据下游任务特性进行领域适配和语义表征能力有限的问题。该文提出一种多模态信息增强表示的中文关键词抽取方法MIEnhance-KPE,首先引入Adapter层将偏旁和部首信息集成到预训练语言模型层中,得到领域自适应的文本表示;其次利用卷积神经网络提取汉字的图像特征,同时使用交叉注意力机制融合汉字图像特征和文本特征,实现文本语义表示增强;最后利用CRF(conditional random field)模型进行序列标注任务,并计算词语的位置词频权重对其进行排序获得关键词。与目前十分先进的关键词抽取方法KIEMP相比, MIEnhance-KPE在公开的中文科学文献数据集和自构建的中文教育关键词抽取数据集上的F值分别提升了15.71%和3.40%;消融实验结果表明,所提出的领域自适应模块和视觉语义增强表示模块均能有效提高关键词抽取的准确性。MIEnhance-KPE的提出有助于教育研究者精准了解教育发展趋势,促进教育理论和实践的创新。

关键词：中文关键词抽取多模态信息多粒度语义特征交叉注意力机制领域自适应

一种基于有向图的同义词抽取结果排序方法

[期刊] 图书情报工作 [作者] 刘伟

[目的/意义]鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程]将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论]通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。

关键词：同义词信息抽取噪音清洗结果排序

Web时态信息抽取与检索研究

[期刊] 情报理论与实践 [作者] 赵洁金培权

时态信息抽取和检索是Web领域中时态信息处理的两个关键问题。本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论。在此基础上讨论了Web时态信息的本体表示问题。最后,预测了Web时态信息抽取与检索的若干未来发展方向。

关键词：信息抽取信息检索网络

基于信息抽取的项目记忆获取方法研究

[期刊] 情报理论与实践 [作者] 徐进朱孝文

[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理，需要投入大量的人力和时间。如何表示项目记忆，以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆，仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇，利用依存句法和规则抽取方法得到项目记忆短语和基础信息，利用LDA模型提取项目文档的主题，并对文档集聚类和描述，达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析，验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。

关键词：项目记忆记忆获取知识抽取短语抽取主题建模

基于Ontology的信息抽取技术方法分析

[期刊] 情报理论与实践 [作者] 洪娜张智雄刘建华

本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。

关键词：本体信息抽取信息技术

基于引用背景信息的关键词自动抽取方法研究

[期刊] 情报理论与实践 [作者] 宋宇罗准辰真溱

科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息，用来改进关键词自动抽取效果的方法，并通过实验验证了方法的有效性。

关键词：自动抽取关键词科技文献引用

基于Bootstrapping的家谱文本信息抽取方法研究

[期刊] 图书馆杂志 [作者] 鲍宸洋任明

实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键。目前深度学习在家谱文本信息抽取方面取得了良好的效果，但是对标注数据的依赖始终是其发展瓶颈之一。本文面向家谱的世系小传，研究基于小规模标注数据进行家谱人物和关系的抽取方法。具体来说：基于Bootstrapping的思想，以少量的标注数据作为初始种子集，使用深度学习BiLSTM-CRF模型为待标注样本自动预测标签序列，并筛选高置信分数的样本加入标注集中，从而迭代地扩展标注集，最后训练得到的模型用于命名实体识别和关系抽取。基于真实数据集的实验表明，使用Bootstrapping改进的BiLSTM-CRF模型能够基于小规模标注数据实现家谱信息抽取，使基于深度学习的家谱信息抽取更加高效。在种子集规模为250条时取得的预测效果与训练集规模为1800条的BiLSTM-CRF模型的预测效果接近。

关键词：家谱文本信息抽取深度学习 Bootstrapping BiLSTM-CRF

基于领域本体的Web信息抽取方法的设计与实现——以网易汽车资讯网页信息抽取为例

[期刊] 图书馆论坛 [作者] 吴恒亮

以网易汽车资讯网页信息抽取为例,研究了基于领域本体的Web信息抽取技术的设计与实现。

关键词： Web信息抽取领域本体 Web数据挖掘

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于领域本体的中文Web文本主题特征抽取方法基于GATE语义标注的Web信息的自动抽取基于三重维度的企业风险信息抽取方法研究面向科技文献的混合语义信息抽取方法研究全自动生成网页信息抽取包装器的主要技术方法研究基于专家主页的信息源相关信息及关系抽取研究基于机器学习的Web链接的抽取分布式Web主题信息抽取的框架探析基于词义的关键词抽取方法研究针对学术定义的抽取规则构建方法研究