标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10172)
2023(14316)
2022(11949)
2021(10891)
2020(8823)
2019(19771)
2018(19592)
2017(37294)
2016(20385)
2015(22731)
2014(22269)
2013(22030)
2012(19814)
2011(17933)
2010(17783)
2009(16346)
2008(15414)
2007(13262)
2006(11403)
2005(9825)
作者
(59231)
(49010)
(48706)
(46176)
(30990)
(23501)
(22187)
(19366)
(18659)
(17160)
(16820)
(16323)
(15387)
(15165)
(15029)
(14934)
(14843)
(14612)
(13977)
(13755)
(12199)
(11909)
(11647)
(11051)
(11043)
(10930)
(10869)
(10677)
(9765)
(9755)
学科
(83175)
经济(83090)
管理(59608)
(53806)
(45715)
企业(45715)
方法(35862)
数学(30223)
数学方法(29867)
业经(22727)
(21389)
中国(20381)
(20292)
地方(18794)
(17679)
农业(14617)
(14448)
理论(14396)
(14052)
贸易(14044)
(13576)
技术(13557)
环境(13124)
产业(13096)
(12363)
(11819)
信息(11512)
(11452)
财务(11386)
财务管理(11369)
机构
大学(286886)
学院(286480)
管理(115630)
(105924)
经济(103473)
理学(100927)
理学院(99789)
管理学(98007)
管理学院(97498)
研究(93440)
中国(67077)
科学(62095)
(60861)
(46584)
(46344)
(46116)
业大(44804)
研究所(43037)
中心(42096)
(40347)
(39737)
师范(39349)
北京(37997)
财经(37958)
农业(36333)
(34668)
(34476)
(33689)
师范大学(31808)
技术(31417)
基金
项目(206525)
科学(162016)
研究(150448)
基金(148384)
(129962)
国家(128901)
科学基金(110743)
社会(93275)
社会科(88309)
社会科学(88290)
(81785)
基金项目(79234)
自然(72756)
自然科(71004)
自然科学(70988)
自然科学基金(69667)
(68733)
教育(68155)
编号(62580)
资助(59667)
成果(49818)
重点(46283)
(44563)
(43631)
(43333)
课题(42097)
创新(40337)
科研(39527)
项目编号(38759)
国家社会(37962)
期刊
(113201)
经济(113201)
研究(78788)
中国(49936)
学报(48241)
科学(43801)
(41750)
管理(40737)
大学(35677)
教育(33531)
学学(33310)
(32721)
农业(29538)
技术(24487)
业经(20519)
图书(19721)
(19224)
金融(19224)
经济研究(17816)
财经(16965)
科技(15552)
(15048)
(14399)
问题(14285)
理论(14035)
资源(13625)
(13488)
技术经济(13338)
情报(13324)
实践(13178)
共检索到400194条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 吴梦成  林立涛  齐月  黄水清  王东波  刘浏  
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
[期刊] 图书馆论坛  [作者] 徐娟  刘东华  刘宇  
色彩作为承载中国传统思想观念、文化习俗、社会礼制的重要载体,是传统文化不可或缺的部分,全面探析明清时期色彩的演变发展、思想流变及其文化内涵,对弘扬传统色彩文化具有重要意义。文章以明清时期的四本典籍文本为语料,提出一种基于文本挖掘进行明清时期色彩知识探究的研究方法,通过实体标注、实体关系抽取、色彩演变分析、色彩与社会阶层关系探究4个部分的研究,探索明清时期色彩的演变特征,在此基础上揭示其文化内涵。与传统方法相比,文章通过量化的方式更加清晰地展现了明清时期色彩的演变特征;通过分析文本内容,进一步发现明清时期色彩等级随着政治、经济、染色工艺等的变化,呈现出动态变化的特点。分析结果得到历史学、艺术学相关研究资料的佐证,验证了方法的有效性。
[期刊] 图书馆建设  [作者] 李章超   何琳  
国家文化数字化战略背景下,从海量、多源和异构的典籍内容中抽取出细粒度故事要素并实现知识组织,对于当下数字人文研究的路径整合及典籍内容的创造性转化和创新发展具有重要意义。提出涵盖“解构”“重组”和“故事化”的典籍内容数字化开发路径,并以路径为指导完成案例对象《左传》的数字化开发实践,从大众、学者和产业的视角检验所提路径的有效性,最后从数字人文视角对实践工作进行总结,提出典籍内容数字化开发推进策略。提出的路径不仅是对当下研究的整合,亦是当下研究方法和技术的理论化和范式化,更为相关实践提供路径和策略参考。
[期刊] 图书馆论坛  [作者] 林立涛  王东波  刘江峰  李斌  冯敏萱  
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 图书馆论坛  [作者] 赵连振  张逸勤  刘江峰  王东波  冯敏萱  李斌  
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书情报工作  [作者] 邓君   钟楚依   吕佳   王奕铧  
[目的/意义]立足数字人文视域,对《徐霞客游记》游踪信息和情感信息进行可视化展示和细粒度剖析,在验证文学、历史学等领域相关研究结论基础上,为学者们后续研究《徐霞客游记》提供助力参考。[方法/过程]藉由QGIS工具和GPT-3模型,通过数据采集、清洗、统计、分析,以可视化方式展现《徐霞客游记》游踪信息和情感信息,挖掘游记文本背后的深层信息。[结果/结论]直观展现《徐霞客游记》的游踪及情感信息的时空分布,将数据思维引入《徐霞客游记》的内容挖掘中,丰富游记体裁研究范式。
[期刊] 图书情报工作  [作者] 王东波  黄水清  何琳  
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的
[期刊] 情报学报  [作者] 王东波  高瑞卿  沈思  李斌  
近年来,自动问答系统已成为机器学习、信息检索和自然语言处理领域的研究热点。问句分类作为问答系统要处理的第一步,其分类结果的好坏直接影响问答系统的质量,但目前大部分问句分类研究集中在现代汉语领域,针对古文相关内容的问句分类研究相对较少。本文从问句分类的概念出发,构建了古文文献问句分类体系,然后利用TF-IDF提取类别特征词,先后利用支持向量机、条件随机场、深度学习模型完成针对先秦10部典籍的问句自动分类实验。结果表明,3种分类模型中,使用Bi-LSTM模型分类效果最好,在本文提出的7种类别上,达到调和平均值94.78%,具有较强的推广和应用价值。
[期刊] 图书情报工作  [作者] 王东波  何琳  黄水清  
[目的 /意义]在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法 /过程]基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果 /结论]基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。
[期刊] 情报理论与实践  [作者] 陈诗  王东波  黄水清  
[目的/意义]指代消解是古文信息挖掘的重要组成部分,是古文数字人文研究的技术支撑研究之一。文章使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,旨于为古文数字人文研究的发展做出推进。[方法/过程]选取《史记》为语料来源,通过阅读大量文献的同时结合语料特征制定标注规范,人工构建实验所需的语料库;另外,使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,并将文本划分为无词性字单位语料、无词性词单位语料、有词性词单位语料三种,探索不同分割单位与词性特征引入对指代消解效果的影响。[结果/结论]实验结果表明,在Bi-LSTM-CRF模型实验中引入词性特征,消解效果(F均值)达84.01%,而在未引入词性特征的情况下,BERT模型指代消解效果优于Bi-LSTM-CRF,F均值达82.43%。基于Bi-LSTM-CRF模型的无词性字单位文本实验与无词性词单位文本实验中F均值分别为74.13%、77.57%。所利用的深度学习方法能够有效解决古文句内人称代词指代消解问题,同时词性特征的引入能够有效提升模型的指代消解性能。[局限]仅针对句内、有且只有一条指代链的情况进行人称代词指代消解研究,同时文本量较小,实验具有一定局限性。
[期刊] 中国图书馆学报  [作者] 陈力  
“数字人文”是在传统人文研究中引入数字技术及方法来研究人类社会各种文化现象的新型跨学科研究范式。在涉及古代社会与文化研究领域,数字人文研究除了采用人工智能、大数据分析等研究方法以外,还需要一些基础条件,包括如何让计算机利用和理解古代文献和古代文化,古籍数字化和古典知识库建设就是数字人文研究所必须的基础条件。古籍数字化主要涉及两个方面的问题:一个是计算机编码汉字,尤其是异体字和异形字的编码问题;另一个是计算机图像识别并转换为字符的能力问题。古典知识库是对古籍内容进行数据统计、信息和知识挖掘的基础,需要从语言、时间、地理、体系化、联结古今等维度筹划古典知识库建设,以助力数字人文的研究。图1。表1。参考文献16。
[期刊] 国家图书馆学刊  [作者] 王东波  高瑞卿  沈思  李斌  
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。
[期刊] 大学图书馆学报  [作者] 郭金龙  许鑫  
概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。
[期刊] 图书馆论坛  [作者] 刘嘉龙   宋宁远   裴雷   胡志伟  
为增强数字人文历史研究的可解释性,文章提出“历史研究线索”概念,将其界定为发现和论证史实的依据,以历史研究线索的挖掘与应用为核心,实现数字人文历史研究与传统历史研究的关联互动。首先分析历史研究线索在历史研究过程中的呈现形式与作用,梳理历史研究线索挖掘与应用逻辑;接着基于数字人文技术体系构建历史研究线索挖掘与应用路径;最后以南京大屠杀为例挖掘历史研究线索,验证路径的可行性。研究发现:历史研究线索呈现为史料资源、史料资源实体、史料资源内容关联关系三类,前两类通过学术史梳理挖掘而得,可以支撑关键问题明确与史料资源知识重构,第三类由专家质性总结与量化分析挖掘而得,能够对已有史实进行补充与论证。作为史料收集、内容解析、关联组织的依据,历史研究线索可以支撑历史研究开展,而其挖掘与应用路径能够为关联数字人文历史研究与传统历史研究提供理论指导与方法支撑。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在人文计算兴起这一背景下,为了更加深入和精准地从古代典籍中挖掘出相应的知识,针对先秦文献进行自动分词的探究。[方法/过程]基于《汉学引得丛刊》中的《春秋经传注疏引书引得》制定词汇表,在由《春秋左氏传》和《晏子春秋》所构成的训练和测试语料上,通过条件随机场模型,结合使用统计和人工内省方法确定的特征模板,完成对先秦典籍进行自动分词的探究。[结果/结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、内部特征模板和组合特征模板下的自动分词模型,最好的分词模型调和平均值达到97.47%,具有较强的推广和应用价值。在构建自动分词模型的过程中,通过融入内部和外部的特征知识,模型的精确率...
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除