- 年份
- 2024(8682)
- 2023(12686)
- 2022(10558)
- 2021(9897)
- 2020(8257)
- 2019(19012)
- 2018(19083)
- 2017(37269)
- 2016(20364)
- 2015(22693)
- 2014(22751)
- 2013(22295)
- 2012(20100)
- 2011(17942)
- 2010(17779)
- 2009(15926)
- 2008(15397)
- 2007(13480)
- 2006(11762)
- 2005(10428)
- 学科
- 济(81680)
- 经济(81596)
- 管理(58339)
- 业(55622)
- 企(46619)
- 企业(46619)
- 方法(37164)
- 数学(31699)
- 数学方法(31348)
- 中国(22749)
- 农(22327)
- 财(19787)
- 业经(19523)
- 学(18911)
- 地方(17226)
- 农业(14881)
- 制(14873)
- 理论(14139)
- 技术(13605)
- 贸(13605)
- 贸易(13596)
- 和(13266)
- 易(13184)
- 务(12522)
- 财务(12455)
- 财务管理(12433)
- 环境(11965)
- 企业财务(11835)
- 产业(11574)
- 银(11534)
- 机构
- 大学(285994)
- 学院(282727)
- 管理(114882)
- 济(110689)
- 经济(108271)
- 理学(100092)
- 理学院(99001)
- 管理学(97230)
- 管理学院(96726)
- 研究(94110)
- 中国(68061)
- 京(61430)
- 科学(59878)
- 财(49056)
- 所(46662)
- 农(44699)
- 业大(43075)
- 研究所(42882)
- 中心(41813)
- 江(40406)
- 财经(39929)
- 北京(38555)
- 范(38442)
- 师范(38074)
- 经(36365)
- 农业(34893)
- 院(34614)
- 州(33022)
- 经济学(32835)
- 师范大学(30914)
- 基金
- 项目(199457)
- 科学(157232)
- 研究(146208)
- 基金(144945)
- 家(126237)
- 国家(125199)
- 科学基金(108029)
- 社会(91527)
- 社会科(86732)
- 社会科学(86709)
- 基金项目(77652)
- 省(77513)
- 自然(70607)
- 自然科(68980)
- 自然科学(68964)
- 自然科学基金(67739)
- 教育(66553)
- 划(65343)
- 编号(59848)
- 资助(58962)
- 成果(48525)
- 重点(44465)
- 部(43577)
- 发(42415)
- 创(41393)
- 课题(40526)
- 创新(38585)
- 科研(37987)
- 教育部(37425)
- 国家社会(37388)
- 期刊
- 济(119110)
- 经济(119110)
- 研究(83086)
- 中国(50698)
- 学报(46146)
- 科学(42495)
- 管理(42038)
- 农(40764)
- 财(35714)
- 大学(34974)
- 教育(32862)
- 学学(32579)
- 农业(28449)
- 技术(24454)
- 融(21635)
- 金融(21635)
- 业经(19923)
- 经济研究(18991)
- 财经(18979)
- 图书(17783)
- 问题(16204)
- 经(16130)
- 科技(14574)
- 理论(14453)
- 业(14371)
- 技术经济(13786)
- 实践(13365)
- 践(13365)
- 现代(13266)
- 版(12908)
共检索到404348条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
郑梦悦 秦春秀 马续补
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。
[期刊] 中国图书馆学报
[作者]
张卫 王昊 邓三鸿 张宝隆
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。
[期刊] 图书情报工作
[作者]
季培培 鄢小燕 岑咏华
领域中文术语识别与抽取是领域中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。在对领域术语的内涵和特征的阐述基础上,重点对领域中文术语识别与抽取的研究现状、主要的方法以及典型的应用进行综述,最后指出其未来的发展趋势。
关键词:
术语抽取 术语识别 领域中文信息处理
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
[期刊] 数据分析与知识发现
[作者]
姜赢 张婧 朱玲萱
【目的】为更方便地查询和利用各个领域的海量关联数据,提出一种关联数据知识图谱概览的生成方法,使得用户在查询前就能了解关联数据访问点的内部数据结构。【方法】通过SPARQL查询关联数据所包含的领域知识关系,针对每一个知识关系构建知识图谱概览三元组并形成初步的知识图谱概览,再抽取每个知识分类的知识图谱概览三元组并合并到前者形成完整的知识图谱概览。【结果】研发Cytoscape插件实现此方法,并进一步提供知识图谱概览可视化功能。【局限】不能处理匿名节点等复杂知识分类抽取。【结论】在生物医学领域分别进行单点抽取、
[期刊] 情报学报
[作者]
王君泽 宋小炯 杜洪涛
在共指消解领域,目前已经有大量研究工作围绕实体共指问题展开,而有关事件共指方面的研究则相对较少。由于事件表述的灵活性,共指事件识别的研究重点之一在于如何构建事件表述相似度的计算模型。而在对同一事件的相似表述中,不仅包含词级别的同义表述,还包含语句级别的同义表述。针对该状况,本文基于新闻报道语料的特点,一方面针对词级别同义表述模式的抽取,设计了同义词知识库的自动构建策略,并考虑了缩略语、同位语等情况的处理;另一方面在词级别同义表述模式抽取的基础上,设计了语句级别同义表述实例的识别策略,进而可以抽取同义表述模式并剔除模式中的冗余成分。通过在实际数据集合上的实验,表明了本文策略的有效性。基于抽取到的词级别和语句级别的同义表述模式,可以有效提升共指事件识别的效果;本文工作也可以视为对共指事件识别现有策略的有益补充。
[期刊] 图书情报工作
[作者]
王汀 冀付军 徐天晟
[目的 /意义]在进行大规模知识库构建时,基于手工方式的构建模式效率较低并且可行性较差,因此,从网络百科中自动地获取海量知识已经被越来越多的学者所关注。目前的研究主要关注于从英文网络百科数据源进行海量知识的抽取,而面向中文百科数据源进行的知识抽取研究工作尚处于起步阶段。[方法 /过程]为解决中文大规模知识库的构建问题,提出一种新的基于中文网络百科架构的大规模知识库的自动化构建方法:在第一阶段,对知识三元组中的主语和宾语之间的语义关系进行自扩展学习;在第二阶段,基于条件随机场和支持向量机协同分类器,对标注出的属性和属性值实体之间的语义关系进行预测。[结果 /结论]实验评测结果表明,该方法较前人工...
[期刊] 图书情报工作
[作者]
卓可秋 沈思 王东波
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。
[期刊] 情报理论与实践
[作者]
蒋婷 孙建军
[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
[期刊] 情报理论与实践
[作者]
王东波 高瑞卿 苏新宁 朱丹浩
情报课程是情报学教学体系的核心和灵魂,是新的情报学人才培养模式的基础。在大数据、数据科学、人工智能发展的大环境下,数据学科与情报学之间存在很多共同点和交叉点,尤其是在对相应工作者所具有的技能素养上。文章通过对数据科学招聘信息中出现的人才技能素养实体的抽取,探究指导情报学学科紧跟时代发展潮流的课程设计内容。通过对招聘网站中数据科学相关工作岗位公告的抓取,经人工标注10534条公告数据,构建了基于预训练字嵌入的BI-LSTM-CRF神经网络的技能素养实体自动抽取模型,并在开发集中取得最高调和平均值85. 04%的效果。文章利用最优模型在11508条招聘公告中进行实体自动抽取,分析抽取结果,并围绕数据科学技能素养要求为情报学课程发展提出了适当建议。
关键词:
情报学课程 数据科学 深度学习 自动抽取
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 图书情报工作
[作者]
孟旭阳 陈阳 白海燕
[目的/意义]在学术文献检索与阅读场景下,当前学术信息量已远超用户信息处理能力,造成信息堆积。为应对用户阅读效率与知识吸收难题,面向学术文献检索结果集开展内容的综合挖掘揭示。[方法/过程]一方面从阅读体验出发,针对文献检索场景的特点,进行结构化综述表达设计;另一方面从技术方法与内容质量提升出发,利用基于深度学习的文本自动生成技术,构建科技文献数据集,训练并优化文本摘要模型,在此基础上利用大语言模型技术实现结构化的综述文本生成。[结果/结论 ]训练优化后的摘要模型在各指标的召回率和F1值上平均增长2.07%。基于大模型的结构化综述生成,在实际测评中能够有效地提炼、总结和归纳内容要点,验证本文技术路线和应用实践的可行性,为进一步提升学术文献的知识化服务水平、智能辅助阅读与语义内容综合挖掘揭示等方面提供应用实践指南。
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除