- 年份
- 2024(8729)
- 2023(12644)
- 2022(11171)
- 2021(10543)
- 2020(8797)
- 2019(20403)
- 2018(20155)
- 2017(39352)
- 2016(20945)
- 2015(23571)
- 2014(23364)
- 2013(22793)
- 2012(20514)
- 2011(18224)
- 2010(17659)
- 2009(15743)
- 2008(14809)
- 2007(12391)
- 2006(10396)
- 2005(8446)
- 学科
- 济(81715)
- 经济(81628)
- 管理(60783)
- 业(58493)
- 企(48881)
- 企业(48881)
- 方法(42603)
- 数学(37569)
- 数学方法(37049)
- 农(21579)
- 财(20503)
- 中国(20168)
- 业经(17819)
- 学(17224)
- 地方(15897)
- 技术(15133)
- 农业(14808)
- 贸(13884)
- 贸易(13880)
- 理论(13861)
- 和(13820)
- 务(13732)
- 财务(13664)
- 财务管理(13637)
- 易(13477)
- 企业财务(12934)
- 环境(12888)
- 制(12202)
- 划(11397)
- 银(10679)
- 机构
- 大学(288210)
- 学院(286334)
- 管理(121019)
- 济(111488)
- 经济(109148)
- 理学(106882)
- 理学院(105802)
- 管理学(103843)
- 管理学院(103331)
- 研究(88432)
- 中国(63826)
- 京(59688)
- 科学(56511)
- 财(48369)
- 业大(44160)
- 农(43150)
- 所(41887)
- 中心(41266)
- 财经(40506)
- 研究所(38771)
- 江(38444)
- 经(37129)
- 范(37123)
- 师范(36788)
- 北京(36742)
- 农业(33733)
- 经济学(33036)
- 院(33001)
- 州(31808)
- 经济管理(31103)
- 基金
- 项目(210645)
- 科学(166609)
- 研究(154132)
- 基金(153820)
- 家(133324)
- 国家(132255)
- 科学基金(115316)
- 社会(96570)
- 社会科(91590)
- 社会科学(91566)
- 基金项目(82825)
- 省(82146)
- 自然(76207)
- 自然科(74473)
- 自然科学(74454)
- 自然科学基金(73086)
- 教育(70718)
- 划(69029)
- 编号(63185)
- 资助(62860)
- 成果(49017)
- 部(46359)
- 重点(46221)
- 创(44507)
- 发(44045)
- 课题(41807)
- 创新(41454)
- 科研(40643)
- 教育部(40089)
- 大学(39659)
- 期刊
- 济(110083)
- 经济(110083)
- 研究(77487)
- 中国(46741)
- 学报(44795)
- 管理(42209)
- 科学(41383)
- 农(37629)
- 财(35730)
- 大学(34557)
- 学学(32192)
- 教育(29900)
- 农业(26901)
- 技术(26264)
- 业经(19158)
- 融(18687)
- 金融(18687)
- 财经(18456)
- 图书(18079)
- 经济研究(17451)
- 科技(16155)
- 经(15616)
- 理论(14501)
- 问题(14480)
- 技术经济(13947)
- 实践(13585)
- 践(13585)
- 情报(13255)
- 业(13223)
- 版(12979)
共检索到388349条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
张思凤 梁梦丽 曹高辉
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词
关键词:
科技文献 引文 主题抽取 关键词
[期刊] 情报理论与实践
[作者]
石义金 王忠义 沈雪莹 郑鑫
为提高科技文献中各类型知识元抽取的效率,提出一种基于序列模式的科技文献知识元抽取模型。该方法首先在各类型知识元描述规则的基础上,对知识元语句进行依存句法分析,生成融入语义的知识元序列模式;其次,基于知识元序列模式,通过模式匹配算法实现各类型知识元的抽取;最后,基于Prefixspan算法,从抽取的知识元中挖掘出新的描述知识元的序列模式,以实现知识元序列模式的不断动态更新与扩展,进而依据知识元序列模式提高知识元的抽取效率。基于序列模式的科技文献中知识元的抽取方法,克服了基于规则匹配的语义局限,具有学科延展性,提高了知识元抽取的效率。
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
[期刊] 情报理论与实践
[作者]
叶春蕾 冷伏海
海量的科技文献中蕴含着大量揭示学科内容的主题信息。文章提出了一种新的概率模型:引文—主题概率模型,该模型对文献中的关键词和引文进行联合建模以完成科技文献中的主题内容识别,在获得主题中关键词分布的同时也获得相关主题间的引文分布。实验表明,基于引文—主题模型识别的主题信息能为进一步的主题演化分析提供一定的分析基础。
[期刊] 图书馆建设
[作者]
赵丹宁 牟冬梅 斯琴
以研究型科技文献摘要为对象,结合内容分析、语义分析和语法分析构建研究型科技文献的实验数据自动抽取模型,并以药物代谢动力学领域文献摘要为自动收取对象,根据得到的实验数据抽取结果验证该自动抽取模型的应用性。结果发现,该模型能够有效地对研究型科技文献实验数据进行自动抽取,在帮助科研人员提高对科技文献的信息获取速度的同时,也为图书情报领域在未来更好地为其他领域科研人员提供知识服务奠定了基础。
关键词:
科技文献 实验数据 自动识别 信息抽取
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报理论与实践
[作者]
沈雪莹 欧石燕
[目的/意义]知识单元作为人类控制和管理知识的基本单元,是科学文献内容的基本组成成分。通过对知识单元抽取技术和应用研究进行梳理与总结,探索知识单元相关研究未来发展方向,以便更好地实现对科学知识的发掘和利用。[方法/过程]采用文献调研法,通过人工对相关文献进行阅读和分析,从知识单元抽取和应用两个视角对科学文献中知识单元相关研究进行梳理和总结。[结果/结论]目前,知识单元抽取的准确性和智能性还有待于进一步提高,未来研究可关注新兴深度学习技术在知识挖掘中的应用;当前知识单元的应用主要包括科学知识图谱构建、学术评价和知识演化分析,未来研究可进一步探索知识单元更多的应用场景,包括基于引文内容的知识单元评价、基于知识图谱的学术文献创新性评价和基于知识单元的跨学科知识流动分析等。
关键词:
知识抽取 知识单元 知识实体 科学文献
[期刊] 情报理论与实践
[作者]
郑梦悦 秦春秀 马续补
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。
[期刊] 情报学报
[作者]
马雨萌 王昉 黄金霞 姜恩波 张翕宇
大数据时代科研人员对高效获取和利用领域知识提出了更高的要求,文献作为科研人员快速准确地了解本领域研究状况的有效途径,基于文献的知识发掘已成为一种新的科研方式。专题知识库作为组织和管理某一特定领域知识的工具,能够用于挖掘和展现文献背后的知识以满足用户个性化需求。本文提出了面向特定研究问题的专题知识库建设路线,采用基于知识工程的信息抽取方法,通过抽象研究问题要素构建专题知识模型,将其作为信息抽取的知识模式,制定知识模型各节点的知识抽取策略,对文献中实体、关系及属性进行解析、抽取与关联组织,基于这些结构化知识提供知识检索、浏览、问答、可视化关联组织等一系列知识服务。然后以中药活血化瘀领域建设实践为例,详细阐述了基于文献知识抽取构建专题知识库的实施方案。系统功能测试显示,该专题知识库能够实现知识快速查询、知识与文献关联发现、知识结构梳理等预期服务场景。本研究提供了一种构建专题知识库行之有效的技术路线,能够帮助科研用户快速而准确地定位和获取文献中的深层知识,提供了数据密集型科研环境下学科化资源建设与个性化精准服务的转型方式。
[期刊] 情报理论与实践
[作者]
刘春江 朱江
在会议文献开放资源采集与服务系统中实现了自动抽取+人工校对的元数据抽取流程,并设计了一个自动抽取器。针对会议文献开放资源本身的特点,该自动抽取器集成了多个基础抽取模板,并易于构建针对某个会议文献集的处理模板,能实现对多种格式的文献进行自动抽取,具有较高的准确度。
关键词:
开放获取 会议文献 元数据 信息抽取
[期刊] 情报理论与实践
[作者]
聂卉 张津华
以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。
关键词:
网页 信息抽取 主题分析
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 图书馆理论与实践
[作者]
艾金勇
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。
关键词:
藏文网页 语义信息 主题句 抽取
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除