标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10630)
2023(15284)
2022(12695)
2021(11701)
2020(9544)
2019(21530)
2018(21447)
2017(40939)
2016(22302)
2015(25152)
2014(24787)
2013(24084)
2012(22064)
2011(19702)
2010(19614)
2009(18072)
2008(17293)
2007(15034)
2006(12973)
2005(10975)
作者
(63250)
(52395)
(52290)
(49360)
(33339)
(25058)
(23746)
(20542)
(19931)
(18583)
(17972)
(17610)
(16492)
(16161)
(15965)
(15953)
(15879)
(15536)
(15045)
(14814)
(12960)
(12836)
(12517)
(12024)
(11724)
(11684)
(11684)
(11513)
(10463)
(10364)
学科
(85143)
经济(85041)
管理(64825)
(59414)
(51549)
企业(51549)
方法(38495)
数学(31485)
数学方法(31043)
业经(24397)
中国(22641)
(22540)
(20795)
(20511)
理论(17523)
地方(16300)
(15616)
(15266)
贸易(15260)
农业(15079)
(14787)
技术(14554)
产业(14353)
(14128)
教育(13579)
(13564)
财务(13497)
财务管理(13471)
环境(13385)
(12849)
机构
大学(313407)
学院(313303)
管理(124438)
(115094)
经济(112427)
理学(108448)
理学院(107225)
管理学(105192)
管理学院(104636)
研究(100226)
中国(72040)
(65925)
科学(64901)
(52796)
(49403)
(47865)
业大(46722)
研究所(45564)
中心(45277)
(44637)
(44533)
师范(44257)
财经(43160)
北京(40941)
(39159)
农业(37683)
(37112)
(36710)
师范大学(35638)
技术(34139)
基金
项目(221095)
科学(173845)
研究(164329)
基金(158589)
(137695)
国家(136504)
科学基金(117448)
社会(102074)
社会科(96583)
社会科学(96560)
(87346)
基金项目(84364)
教育(75783)
自然(75742)
自然科(73959)
自然科学(73941)
(73468)
自然科学基金(72568)
编号(69013)
资助(63592)
成果(56464)
重点(49170)
(47466)
课题(46838)
(46669)
(46603)
创新(43218)
项目编号(43141)
科研(41986)
国家社会(41266)
期刊
(123211)
经济(123211)
研究(88011)
中国(55141)
学报(50937)
科学(46066)
管理(43914)
(43573)
教育(40868)
(38923)
大学(38087)
学学(35408)
农业(30818)
技术(26554)
(22086)
金融(22086)
业经(22059)
图书(21667)
财经(19850)
经济研究(19481)
(16903)
科技(15781)
问题(15674)
(15544)
(15240)
理论(15239)
书馆(14678)
图书馆(14678)
实践(14247)
(14247)
共检索到440007条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 张卫  王昊  李晓敏  Song Min  
[目的/意义]古典诗歌意象善于运用物象(源域)隐喻人物或氛围情感(目标域),然而物象与情感知识目前广泛分布在多源异构的非结构化古诗文本内,尚未组织成具有知识解释体系的文化图式。[方法/过程]针对古诗意象提出一套基于知识本体的文化图式构建模式与技术实现方法。首先,定义基于序列标注的物象术语抽取和基于关系分类的物象与情感关系抽取任务。其次,在无学习语料下,搭建中文领域物象术语知识体系,用于文本内物象术语的自动标注;设计基于结构层面的规则模板与内容层面的概念共现约束,用于文本内意象关系的自动生成,进而通过深度学习实现物象术语与意象知识抽取。[结果/结论]基于古诗鉴赏文本开展实验,利用由5个一级类、12个二级类构成的物象知识体系标注29 765个物象术语,通过触发词与共现频率约束可获得8 977条结构和内容层面的意象关系。基于BE RT-BiLSTM-CNN-CRF的物象术语抽取F1值多在95%以上,基于BERT-SE-FC的物象与情感关系抽取准确率均在94%以上,并泛化出大量新物象术语与新意象关系。将意象知识存储形成知识图谱并展开知识关联可知:“喜爱”类专有意象包括等,构建古诗中将喜爱之情诉诸春日物象的文化图式;“长安”“女子”“明月”等通用物象则能构建多种文化图式来隐喻古诗中的不同情感。
[期刊] 中国图书馆学报  [作者] 张卫  王昊  邓三鸿  张宝隆  
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。
[期刊] 图书情报工作  [作者] 卓可秋  沈思  王东波  
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。
[期刊] 情报理论与实践  [作者] 化柏林  刘一宁  郑彦宁  
学术定义是学术研究中一种基础性的知识。科技文献中蕴含着丰富的定义,对定义进行自动抽取是知识抽取的一种应用。这些定义具有一定的特征与规律,利用这些特征与规律形成规则对定义进行抽取是常见的方法。定义抽取中最重要的工作是规则构建。文章通过对定义语句的结构方式和分类进行研究,提出了一种基于多重规则的学术定义抽取规则构建方案。该方案通过构建模式规则、句法规则以及加权词规则,构建学术定义抽取所需要的多重规则。
[期刊] 情报理论与实践  [作者] 曾刚  赵雪芹  
[目的/意义]基于知识元研究视角探索知识抽取与组织方法,提高万里茶道数字资源开发利用效率。[方法/过程]构建知识元语义描述模型,基于该模型实现万里茶道知识抽取,并利用深度学习实现对知识语义层面的细粒度组织。[结果/结论]实现对细粒度、多维关联知识的揭示与展示,推动万里茶道历史人文资源的活化和保护。
[期刊] 情报理论与实践  [作者] 董坤  
[目的/意义]针对非物质文化遗产(简称非遗)现有组织方法的不足,提出了一个基于知识元的非遗知识抽取与组织方法以实现对细粒度非遗知识的揭示与利用。[方法/过程]文章在现有知识组织方法的基础上,构建非遗知识元语义描述模型,基于该模型提出非遗多元知识及其知识之间语义关系的抽取方法,[结果/结论]实现了非遗知识的细粒度、多维关联组织与聚合。
[期刊] 图书情报工作  [作者] 宋雪雁   罗慧   裴心源   赵小旭   赵妮  
[目的/意义]送别诗是古代诗歌中极其重要的一类题材,通过研究送别诗中涉及的典故及文化意象,可以为唐代的历史文化变迁提供考证。[方法/过程]以《全唐诗》中的送别诗为研究对象,基于知识重组的视角,运用数字人文工具,通过对送别诗中出现的典故及文化意象进行统计分类,结合语义对送别诗想要表达的情感展开研究。[结果/结论 ]梳理送别诗文本中包含的典故及文化意象,直观地展现《全唐诗》送别诗中典故、文化意象等要素,有利于后续对《全唐诗》中的其他知识元素进行深度挖掘及可视化。
[期刊] 数据分析与知识发现  [作者] 王东波  吴毅  叶文豪  刘睿伦  
【目的】从大规模食品安全事件当中抽取食品安全事件实体。【方法】基于已发生的食品安全事件,结合情报学数据获取、标注和组织的方法,融合食品安全事件实体的多种分布特征知识,通过条件随机场模型,构建食品安全事件语料并从中抽取相应的实体。【局限】在食品安全事件实体抽取过程中所制定的特征模板在领域化迁移上具有一定的局限性。【结果】在已有1 500万字经过标注的食品安全事件语料的规模上,通过统计食品安全事件实体的内部和外部特征,基于条件随机场机器学习模型,构建了食品安全实体的抽取模型,该模型最高的F值达到91.94%。
[期刊] 图书情报工作  [作者] 张卫   王昊   王东波   裘靖文   李晓敏   邓三鸿  
[目的/意义]古诗是我国古典文学的宝贵遗产,从语义关联的视角对领域信息资源中显性知识(人物、时间、地点等)、隐喻知识(物象、情感等)以及用于解释隐喻文化背景的文化图式进行语义组织,对于新时代下我国文脉的内涵式传承与认知服务具有重要意义。[方法/过程]提出基于知识本体的隐喻知识及其文化图式组织模型。从古诗的物象与情感概念切入,剖析物象与意象隐喻知识的概念内涵与作用机制;对古诗文本进行特征解析以归纳核心的元数据,以构建融合显性与隐喻概念的古诗知识本体;获取领域显性与隐喻知识构建古诗知识图谱进而开展图谱解析。采取语义推理逻辑从图谱三元组数据中发掘古诗隐喻文化图式;将文化图式的图谱数据作为古诗表示特征进行计算,从族性和特性的角度探索古诗分类编目和个性化推荐等知识服务应用。[结果/结论]所构建的古诗知识本体能够从语言层面和诗人心理层面对隐喻知识及其文化图式进行有效知识组织,真正实现从语言、语义、情感及隐喻等层面对古诗进行知识挖掘与数据关联,以提升读者对古诗文化的感知、理解与认知能力。
[期刊] 图书馆论坛  [作者] 李佳斌   魏庭新   曲维光   李斌   冯敏萱   王东波  
古诗中典故、意象、专名等具有高语义复杂度的组块桎梏大众对古诗的语义理解。为此,文章对古诗中的复杂语义组块进行梳理并分类。借助大语言模型的文本处理与信息抽取能力,对搜集到的各类词典知识进行整合处理,构建用于古诗笺注的知识库,并在古诗自动笺注和翻译任务中进行验证与应用。实验结果显示,构建的笺注知识库在古诗中五个关键组块的笺注任务上,宏平均F1值达93.90%,优于现有的笺注方案。利用知识库再次预训练得到的古诗领域语言模型AnnoKB_GLM,在古诗机器翻译任务上的性能超越现有现代汉语通用大语言模型和古籍文本基座模型,验证了该笺注知识库的实用价值。
[期刊] 图书情报工作  [作者] 董旻  方曙  
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 情报学报  [作者] 马雨萌  王昉  黄金霞  姜恩波  张翕宇  
大数据时代科研人员对高效获取和利用领域知识提出了更高的要求,文献作为科研人员快速准确地了解本领域研究状况的有效途径,基于文献的知识发掘已成为一种新的科研方式。专题知识库作为组织和管理某一特定领域知识的工具,能够用于挖掘和展现文献背后的知识以满足用户个性化需求。本文提出了面向特定研究问题的专题知识库建设路线,采用基于知识工程的信息抽取方法,通过抽象研究问题要素构建专题知识模型,将其作为信息抽取的知识模式,制定知识模型各节点的知识抽取策略,对文献中实体、关系及属性进行解析、抽取与关联组织,基于这些结构化知识提供知识检索、浏览、问答、可视化关联组织等一系列知识服务。然后以中药活血化瘀领域建设实践为例,详细阐述了基于文献知识抽取构建专题知识库的实施方案。系统功能测试显示,该专题知识库能够实现知识快速查询、知识与文献关联发现、知识结构梳理等预期服务场景。本研究提供了一种构建专题知识库行之有效的技术路线,能够帮助科研用户快速而准确地定位和获取文献中的深层知识,提供了数据密集型科研环境下学科化资源建设与个性化精准服务的转型方式。
[期刊] 情报理论与实践  [作者] 刘江峰  刘雏菲  齐月  刘浏  李斌  刘畅  王东波  
[目的/意义]诗词创作是数字人文领域自然语言生成研究的重要方向,对古诗词遣词造句的版本争议判断、自动诗词问答等具有一定意义,然而当前尚未出现能够自动生成繁体中文古诗词的预训练模型,已有研究着眼于根据使用者需求创作不同风格的简体古诗词。[方法/过程]文章基于CLM使用繁体《四库全书》无标点语料、繁体中文古诗词语料在gpt2-chinese-cluecorpussmall上进行继续预训练构建SikuGPT2、SikuGPT2-poem模型。采用困惑度、BLEU、专家打分、图灵测试等验证模型性能。[结果/结论]实验显示SikuGPT2-poem模型困惑度较低,生成的诗歌BLUE评分较基准模型低0.053左右,在人工打分中较基准模型平均高1.93分。总体而言,文章提出的模型表现优异且通过图灵测试,提出的古汉语生成式系列模型的预训练语料集尚小。模型在古诗生成方面表现较好,但尚不能满足赋、曲等体裁的需要。
[期刊] 情报理论与实践  [作者] 刘鲁红  刘力强  胡亚军  
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严峻挑战。本文分析了信息抽取的概念、类型与方法,提出了信息抽取技术在数字图书馆中的几个应用领域。
[期刊] 情报理论与实践  [作者] 相玉飞  王曰芬  刘卫江  
关键词:
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除