- 年份
- 2024(7135)
- 2023(10311)
- 2022(8833)
- 2021(8220)
- 2020(7327)
- 2019(16858)
- 2018(17049)
- 2017(32910)
- 2016(17610)
- 2015(20280)
- 2014(20394)
- 2013(20003)
- 2012(18415)
- 2011(16438)
- 2010(16137)
- 2009(14883)
- 2008(14737)
- 2007(13225)
- 2006(11030)
- 2005(9552)
- 学科
- 济(75419)
- 经济(75346)
- 管理(56368)
- 业(55190)
- 企(46496)
- 企业(46496)
- 方法(41928)
- 数学(37268)
- 数学方法(36753)
- 财(20762)
- 农(18761)
- 技术(16746)
- 中国(16397)
- 学(15414)
- 业经(15362)
- 务(14565)
- 财务(14509)
- 财务管理(14473)
- 企业财务(13781)
- 贸(13592)
- 贸易(13590)
- 易(13238)
- 农业(12694)
- 理论(12343)
- 地方(12202)
- 和(11657)
- 制(11588)
- 环境(10644)
- 银(9740)
- 银行(9709)
- 机构
- 大学(258539)
- 学院(257394)
- 管理(106052)
- 济(104152)
- 经济(102027)
- 理学(92225)
- 理学院(91318)
- 管理学(89636)
- 管理学院(89147)
- 研究(78707)
- 中国(58925)
- 京(53298)
- 科学(49905)
- 财(46038)
- 农(42340)
- 业大(40326)
- 中心(39163)
- 所(39063)
- 财经(38016)
- 江(37407)
- 研究所(35794)
- 经(34457)
- 农业(33694)
- 北京(32601)
- 经济学(31868)
- 范(31582)
- 师范(31238)
- 州(29785)
- 经济学院(29115)
- 技术(28650)
- 基金
- 项目(178508)
- 科学(140840)
- 基金(130762)
- 研究(127650)
- 家(114143)
- 国家(113273)
- 科学基金(98238)
- 社会(80615)
- 社会科(76613)
- 社会科学(76589)
- 省(70026)
- 基金项目(69543)
- 自然(65318)
- 自然科(63880)
- 自然科学(63861)
- 自然科学基金(62717)
- 教育(59599)
- 划(58891)
- 资助(54302)
- 编号(52307)
- 成果(41249)
- 部(39899)
- 重点(39842)
- 创(37543)
- 发(37085)
- 创新(35199)
- 科研(35088)
- 教育部(34193)
- 课题(34182)
- 国家社会(33637)
- 期刊
- 济(102389)
- 经济(102389)
- 研究(65285)
- 中国(43278)
- 学报(40846)
- 财(37918)
- 科学(36843)
- 农(35994)
- 管理(35924)
- 大学(30416)
- 学学(28635)
- 技术(27170)
- 农业(24777)
- 教育(22801)
- 财经(18312)
- 融(17870)
- 金融(17870)
- 业经(16744)
- 经济研究(16585)
- 图书(16285)
- 经(15648)
- 统计(15532)
- 技术经济(15460)
- 策(13928)
- 问题(13845)
- 业(13808)
- 理论(13375)
- 情报(12690)
- 决策(12582)
- 科技(12576)
共检索到357375条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报理论与实践
[作者]
郑彦宁 邓擘
对海量信息进行有效收集与组织是情报学要解决的关键问题。分析了信息抽取技术的特点及其关键技术,讨论了信息抽取技术在情报学中的应用价值。通过信息抽取技术收集和组织信息,可提高信息相关性并为知识服务奠定基础。
关键词:
情报学 信息抽取 信息收集 信息组织
[期刊] 图书情报工作
[作者]
李纲 刘广兴 毛进 叶光辉
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 图书馆理论与实践
[作者]
阳广元
以国内2002年1月至2016年5月间发表的与基于本体的信息抽取有关的期刊文献为分析对象,运用内容分析法从领域本体的构建及基于本体的信息抽取方法、信息抽取模型、信息抽取算法、信息抽取系统、信息抽取的应用领域等6个方面对国内该领域的研究现状与热点进行分析,认为目前国内该研究领域具有研究内容从理论走向实践、研究主体多样性、尚未形成核心作者和核心团队等特点,指出本体构建的自动化及基于本体的信息抽取的评估机制、信息抽取的实践应用将成为未来的发展趋势。
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 情报理论与实践
[作者]
李广建 乔建忠
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
关键词:
信息抽取 包装器 信息技术 深层网
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 图书馆杂志
[作者]
鲍宸洋 任明
实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键。目前深度学习在家谱文本信息抽取方面取得了良好的效果,但是对标注数据的依赖始终是其发展瓶颈之一。本文面向家谱的世系小传,研究基于小规模标注数据进行家谱人物和关系的抽取方法。具体来说:基于Bootstrapping的思想,以少量的标注数据作为初始种子集,使用深度学习BiLSTM-CRF模型为待标注样本自动预测标签序列,并筛选高置信分数的样本加入标注集中,从而迭代地扩展标注集,最后训练得到的模型用于命名实体识别和关系抽取。基于真实数据集的实验表明,使用Bootstrapping改进的BiLSTM-CRF模型能够基于小规模标注数据实现家谱信息抽取,使基于深度学习的家谱信息抽取更加高效。在种子集规模为250条时取得的预测效果与训练集规模为1800条的BiLSTM-CRF模型的预测效果接近。
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
[期刊] 情报理论与实践
[作者]
刘一宁 郑彦宁 化柏林
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。
关键词:
学术定义 知识抽取 自然语言处理 分析
[期刊] 情报理论与实践
[作者]
杜思奇 李红莲 吕学强
[目的/意义]面向电子商务领域的在线评论,通过识别产品特征和评价词之间是否存在修饰关系,抽取出在线评论中的情感标签,从而帮助网购用户迅速了解某一产品的性能。[方法/过程]引入汉语组块分析对评论文本进行初始化处理,对名词性信息以及形容词性信息进行抽取。通过最大熵对初始化集合进行过滤,从而获得最终的情感标签集合。[结果/结论]该方法对评论文本的适应性较好,可以有效抽取出情感标签。[局限]需要对语料进行初始化抽取,经过过滤后才能获得最终的情感标签集合。
关键词:
情感标签 汉语组块分析 最大熵模型
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 数字图书馆论坛
[作者]
黄政 张学福
本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除