标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10172)
2023(14406)
2022(11570)
2021(10600)
2020(8670)
2019(19790)
2018(19673)
2017(36807)
2016(19978)
2015(22588)
2014(22174)
2013(21182)
2012(19602)
2011(17414)
2010(17016)
2009(15058)
2008(14260)
2007(12369)
2006(10413)
2005(8808)
作者
(56559)
(47149)
(46711)
(44369)
(29774)
(22531)
(21495)
(18567)
(18337)
(16673)
(16204)
(15785)
(15102)
(14551)
(14539)
(14371)
(14078)
(14048)
(13635)
(13623)
(11556)
(11390)
(11338)
(11048)
(10695)
(10377)
(10350)
(10345)
(9488)
(9441)
学科
(77832)
经济(77744)
管理(57206)
(50225)
(42000)
企业(42000)
方法(35040)
数学(30616)
数学方法(30067)
业经(20676)
(20659)
中国(20441)
(19758)
(18296)
地方(15605)
(14726)
理论(13979)
农业(13850)
技术(12936)
产业(12327)
(12079)
(12077)
贸易(12073)
财务(12006)
财务管理(11966)
(11955)
(11939)
银行(11896)
(11691)
(11520)
机构
大学(269102)
学院(267959)
管理(103492)
(101186)
经济(98852)
理学(89531)
研究(88844)
理学院(88514)
管理学(86621)
管理学院(86131)
中国(67573)
科学(57432)
(57300)
(47579)
(46651)
(43806)
中心(43155)
业大(42942)
(40662)
研究所(40087)
农业(37761)
财经(37049)
(36429)
师范(35901)
北京(34835)
(33810)
(33628)
(32421)
技术(31492)
经济学(30659)
基金
项目(193106)
科学(151600)
研究(139500)
基金(139274)
(123123)
国家(122104)
科学基金(104890)
社会(87189)
社会科(82536)
社会科学(82516)
(76602)
基金项目(73529)
自然(69004)
自然科(67432)
自然科学(67408)
自然科学基金(66151)
教育(64625)
(64546)
编号(57236)
资助(56084)
成果(45911)
重点(43395)
(41406)
(41158)
(40872)
课题(38880)
创新(38226)
科研(37566)
国家社会(36527)
计划(35917)
期刊
(105810)
经济(105810)
研究(72843)
中国(56520)
学报(47264)
(41691)
科学(40848)
(37908)
管理(37856)
大学(35782)
学学(33224)
教育(33197)
农业(28385)
技术(26681)
(20968)
金融(20968)
图书(19394)
业经(17696)
财经(17544)
经济研究(16819)
(15447)
(15187)
(14305)
问题(13803)
书馆(13493)
图书馆(13493)
科技(13186)
理论(12552)
技术经济(12437)
业大(12342)
共检索到393619条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 常博林  万晨  李斌  陈欣雨  冯敏萱  王东波  
[目的/意义]探索能够实现基于词和实体的检索与知识挖掘的人文知识库构建方法。[方法/过程]以《资治通鉴·周秦汉纪》为例,对68卷60万字的文本自动分词与词性标注之后,人工标注文本中的人物、地点GIS、时间等实体信息,实现基于词和实体的全文检索和地图检索系统;利用同现信息,统计出人物关系与人物游历信息;进而使用TF-IDF方法,通过时间序列分析,挖掘出多事之秋、风云人物、风云之地等结果。[结果/结论]基于词和实体的深度信息标注,能够解决缺乏词界、同名异指和异名同指的检索难题,更可以为古籍多角度的知识发掘与知识服务提供基础支撑。
[期刊] 图书馆论坛  [作者] 徐润华  王东波  刘欢  梁媛  陈康  
可以降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究少。文章面向《资治通鉴》语料,基于Siku BERT预训练模型进行自动摘要实验,并对比传统抽取式自动摘要算法和百度智能云摘要分析算法在《资治通鉴》语料上的表现。实验结果表明,基于Siku BERT预训练模型生成的摘要结果在稳定性、覆盖度等方面均优于其他两种方法;通过专家人工打分方式,基于Siku BERT预训练模型生成的摘要结果平均得分最高。实验验证了使用数字人文技术对古文进行自动摘要任务的可行性和利用Siku BERT预训练模型对古文进行信息处理的适用性。
[期刊] 情报学报  [作者] 刘浏   齐月   刘雏菲   李文祺   王东波  
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。
[期刊] 中国图书馆学报  [作者] 陈力  
“数字人文”是在传统人文研究中引入数字技术及方法来研究人类社会各种文化现象的新型跨学科研究范式。在涉及古代社会与文化研究领域,数字人文研究除了采用人工智能、大数据分析等研究方法以外,还需要一些基础条件,包括如何让计算机利用和理解古代文献和古代文化,古籍数字化和古典知识库建设就是数字人文研究所必须的基础条件。古籍数字化主要涉及两个方面的问题:一个是计算机编码汉字,尤其是异体字和异形字的编码问题;另一个是计算机图像识别并转换为字符的能力问题。古典知识库是对古籍内容进行数据统计、信息和知识挖掘的基础,需要从语言、时间、地理、体系化、联结古今等维度筹划古典知识库建设,以助力数字人文的研究。图1。表1。参考文献16。
[期刊] 图书馆杂志  [作者] 张晓晓  张卫东  
数字人文的发展推动了中医古籍数字化的进程,通过构建中医古籍方药库、探索方药库中文本信息之间的隐性关联,发挥方药库的知识服务功能。以产后腹痛为例,通过自动分词、文本实体信息获取、药材性能信息获取、数据存储实现产后腹痛方药库的构建;利用频次分析,探讨中医古籍中产后腹痛的主要证治方法;依托改进的Bina-Apriori算法,挖掘产后腹痛药材配伍规律;通过历时分布分析,挖掘出方药运用贡献较大的时代,实现方药库的知识服务功能。将数字化工具运用于中医古籍的方药库构建及应用过程中,能够实现古籍显性知识的结构化表示及隐性知识的深度挖掘,为中医古籍数字化的发展提供支撑。
[期刊] 图书情报工作  [作者] 王东波  黄水清  何琳  
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的
[期刊] 情报学报  [作者] 李新福  郭宝兰  
依据古籍文献正文、校勘、参考文献等部分之间的非线性结构特性和计算机超文本技术,以720万字的《续资治通鉴长编》文本资料库超文本标注为例,着重讨论了超文本自动标注及其实现方法,并简要介绍了超文本和超文本标注语言(HTML)。
[期刊] 图书情报知识  [作者] 肖怀志  李明杰  
“正史”纪传体因人记事的体例,造成了同一史实散见于史书不同篇卷的弊端。为满足专业研究者查找史实全貌的需要,本文选取较有代表性的《三国志》为例,通过历史年代本体建立的语义关联来聚集相关历史年代知识元,达到聚集同一或相关史实的目的,为古籍数字化知识发现功能的实现提供了一条全新的思路。
[期刊] 图书馆论坛  [作者] 耿云冬  张逸勤  刘欢  王东波  
在深度学习技术不断发展和预训练语言模型不断改进的背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SIKU-BERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明,SIKU-BERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
[期刊] 图书馆建设  [作者] 莫俊  
线装古籍册次的标注分数字和非数字两种形式,数字式有汉字数字、阿拉伯数字、苏州码子、点阵以及数字的混用、借用、省简、增字等;非数字式或为诗文的节选,或是照录、增减书名文字。册次的标注位置可在书根、书脚、书脊、书脑、书眉、版心等处。册次标注在书籍装饰、文献检索、古籍整理、藏书文化和古代数字研究上有重要作用和价值。
[期刊] 财务与会计  [作者] 程平  陈珊  
本文从审计知识服务的角度构建了基于云会计的审计知识库模型,并从审计知识地图、审计知识检索服务平台和审计知识创新服务系统等方面阐述了基于云会计的大数据审计知识库的应用。
[期刊] 图书馆论坛  [作者] 赵连振  张逸勤  刘江峰  王东波  冯敏萱  李斌  
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书馆论坛  [作者] 林立涛  王东波  刘江峰  李斌  冯敏萱  
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 情报学报  [作者] 马雨萌  王昉  黄金霞  姜恩波  张翕宇  
大数据时代科研人员对高效获取和利用领域知识提出了更高的要求,文献作为科研人员快速准确地了解本领域研究状况的有效途径,基于文献的知识发掘已成为一种新的科研方式。专题知识库作为组织和管理某一特定领域知识的工具,能够用于挖掘和展现文献背后的知识以满足用户个性化需求。本文提出了面向特定研究问题的专题知识库建设路线,采用基于知识工程的信息抽取方法,通过抽象研究问题要素构建专题知识模型,将其作为信息抽取的知识模式,制定知识模型各节点的知识抽取策略,对文献中实体、关系及属性进行解析、抽取与关联组织,基于这些结构化知识提供知识检索、浏览、问答、可视化关联组织等一系列知识服务。然后以中药活血化瘀领域建设实践为例,详细阐述了基于文献知识抽取构建专题知识库的实施方案。系统功能测试显示,该专题知识库能够实现知识快速查询、知识与文献关联发现、知识结构梳理等预期服务场景。本研究提供了一种构建专题知识库行之有效的技术路线,能够帮助科研用户快速而准确地定位和获取文献中的深层知识,提供了数据密集型科研环境下学科化资源建设与个性化精准服务的转型方式。
[期刊] 现代情报  [作者] 付苓  
构建单元信息知识库,可以实现对单元信息的有效揭示、组织与利用,为实现精粹服务的需求提供知识保障。本文引入本体提出了单元信息知识库的构建方法,设计了知识库的总体结构,构建了单元信息本体,阐述了数据建设的过程,并以"养生领域"为例实现了知识库的构建。本文所构建的基于本体的单元信息知识库能够较好地组织、存储和利用单元信息,提供知识检索和知识发现服务,实现从海量数据中有效获取有价值信息的需求。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除