标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(7209)
2023(10470)
2022(9237)
2021(8711)
2020(7325)
2019(16953)
2018(17286)
2017(32949)
2016(17767)
2015(20346)
2014(20349)
2013(20048)
2012(18379)
2011(16278)
2010(16082)
2009(14618)
2008(14156)
2007(12270)
2006(10690)
2005(9272)
作者
(52671)
(43442)
(43257)
(41067)
(27728)
(21024)
(19675)
(17244)
(16610)
(15552)
(15018)
(14520)
(13781)
(13742)
(13403)
(13232)
(13154)
(13016)
(12516)
(12389)
(10856)
(10653)
(10478)
(9862)
(9810)
(9717)
(9688)
(9562)
(8754)
(8622)
学科
(70164)
经济(70092)
管理(56130)
(53591)
(46059)
企业(46059)
方法(35793)
数学(30600)
数学方法(30135)
(17554)
(17496)
技术(17246)
(16931)
中国(16429)
业经(16057)
理论(13474)
地方(12975)
(12371)
财务(12301)
财务管理(12279)
(12246)
贸易(12241)
(12186)
农业(12033)
(11902)
企业财务(11700)
环境(11133)
(10558)
(10076)
教育(9725)
机构
大学(257502)
学院(254387)
管理(106971)
(94886)
理学(93148)
经济(92644)
理学院(92173)
管理学(90455)
管理学院(89999)
研究(81082)
中国(58311)
(55348)
科学(52969)
(41498)
(40421)
业大(40212)
(39855)
中心(37312)
研究所(37150)
(35598)
北京(34999)
财经(34314)
(33417)
师范(33118)
农业(31409)
(31183)
(29815)
(29654)
技术(28992)
师范大学(26834)
基金
项目(180848)
科学(141723)
研究(131378)
基金(130748)
(114089)
国家(113188)
科学基金(97645)
社会(80321)
社会科(76135)
社会科学(76112)
(70662)
基金项目(70026)
自然(65363)
自然科(63860)
自然科学(63849)
自然科学基金(62698)
教育(60084)
(59478)
编号(54382)
资助(54295)
成果(43612)
重点(39735)
(39169)
(37797)
(37293)
课题(36380)
创新(35210)
科研(34637)
项目编号(34377)
大学(33481)
期刊
(98358)
经济(98358)
研究(70383)
中国(44617)
学报(42254)
管理(38185)
科学(38065)
(34863)
大学(31156)
(30693)
学学(28952)
教育(28828)
技术(25612)
农业(25310)
图书(19454)
(16215)
金融(16215)
业经(15942)
财经(15591)
经济研究(15208)
情报(14534)
科技(14503)
技术经济(14309)
理论(14136)
实践(13373)
(13373)
(13099)
(12964)
书馆(12640)
图书馆(12640)
共检索到358958条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报理论与实践  [作者] 李广建  乔建忠  
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
[期刊] 数字图书馆论坛  [作者] 黄政  张学福  
本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
[期刊] 图书馆理论与实践  [作者] 艾金勇  
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。
[期刊] 图书馆论坛  [作者] 吴恒亮  
以网易汽车资讯网页信息抽取为例,研究了基于领域本体的Web信息抽取技术的设计与实现。
[期刊] 情报理论与实践  [作者] 宋宇  罗准辰  真溱  
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
[期刊] 情报理论与实践  [作者] 高庆宁  吴鹏  张晶晶  
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。
[期刊] 情报理论与实践  [作者] 聂卉  张津华  
以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。
[期刊] 情报学报  [作者] 刘挺  吴岩  王开铸  
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织,生成连贯的段落
[期刊] 情报理论与实践  [作者] 洪娜  张智雄  刘建华  
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
[期刊] 情报理论与实践  [作者] 李天阳  王新  
关键词:
[期刊] 情报理论与实践  [作者] 钱爱兵  江岚  
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。
[期刊] 图书情报工作  [作者] 俞琰  陈磊  姜金德  赵乃瑄  
[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。
[期刊] 图书情报工作  [作者] 董旻  方曙  
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 情报学报  [作者] 胡昊天   邓三鸿   孔玲   闫晓慧   杨文霞   王东波   沈思  
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法 (generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。
[期刊] 情报理论与实践  [作者] 徐进  朱孝文  
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除