- 年份
- 2024(3897)
- 2023(5096)
- 2022(3369)
- 2021(2686)
- 2020(1900)
- 2019(3970)
- 2018(3870)
- 2017(7402)
- 2016(4077)
- 2015(4376)
- 2014(4315)
- 2013(4184)
- 2012(4035)
- 2011(3693)
- 2010(3764)
- 2009(3277)
- 2008(3121)
- 2007(2866)
- 2006(2459)
- 2005(2377)
- 学科
- 济(20173)
- 经济(20149)
- 管理(10526)
- 业经(9583)
- 业(9318)
- 产业(8209)
- 信息(7938)
- 总论(7606)
- 信息产业(7579)
- 企(6624)
- 企业(6624)
- 中国(5976)
- 方法(5173)
- 农(5154)
- 数学(4495)
- 数学方法(4440)
- 融(4061)
- 金融(4061)
- 财(3972)
- 农业(3920)
- 银(3882)
- 银行(3876)
- 学(3789)
- 行(3771)
- 发(3557)
- 制(3150)
- 贸(2950)
- 贸易(2948)
- 地方(2924)
- 易(2879)
- 机构
- 大学(61174)
- 学院(59234)
- 济(23871)
- 经济(23314)
- 研究(22703)
- 管理(21382)
- 理学(17982)
- 中国(17858)
- 理学院(17702)
- 管理学(17423)
- 管理学院(17273)
- 科学(14138)
- 京(13980)
- 所(11373)
- 财(11157)
- 农(10703)
- 研究所(10460)
- 中心(10391)
- 范(9364)
- 师范(9283)
- 江(9097)
- 业大(8999)
- 北京(8804)
- 院(8657)
- 农业(8592)
- 财经(8571)
- 经济学(7984)
- 经(7885)
- 师范大学(7761)
- 州(7450)
- 基金
- 项目(42099)
- 科学(33227)
- 研究(31700)
- 基金(30535)
- 家(27334)
- 国家(27128)
- 科学基金(22722)
- 社会(20597)
- 社会科(19645)
- 社会科学(19638)
- 省(15443)
- 基金项目(15368)
- 划(13690)
- 教育(13526)
- 编号(13335)
- 自然(13253)
- 自然科(12937)
- 自然科学(12935)
- 自然科学基金(12678)
- 资助(11166)
- 成果(11124)
- 发(9690)
- 重点(9562)
- 国家社会(9516)
- 部(9072)
- 创(8928)
- 课题(8436)
- 创新(8395)
- 项目编号(8356)
- 制(8249)
共检索到94167条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 大学图书馆学报
[作者]
钱智勇 陈涛 张志美 徐宇红 何书
典籍图像是馆藏重要资源,图像数字化和内容揭示是数字人文基础建设,可实现“以图证史”“图像叙事”、多媒介传播等应用价值。文章依据图像元数据、资源描述框架(RDF)和国际图像互操作框架(IIIF)等标准规范,研究典籍图像深度揭示与利用的模型架构与实现方法。该模型由图像数字化、内容深度标注和数字人文应用三个相互关联的模块组成。从图像场景、实体对象和语义关联三个层次,揭示图像特征、典籍注释及背景知识,辅助数字人文研究。例证选用经典辞书《尔雅》插图版《尔雅音图》进行数字化,构建《尔雅》多语语义词表并与实体进行关联,深度揭示《尔雅》词汇的古今释义、音韵、分类、典籍注疏、例句典故等知识内容,探究《尔雅》图像的数字人文应用场景。
[期刊] 图书馆论坛
[作者]
赵连振 张逸勤 刘江峰 王东波 冯敏萱 李斌
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书馆论坛
[作者]
刘畅 王东波 胡昊天 张逸勤 李斌
数字人文研究为古籍文献的深度开发与展示提供了良好的平台。精准的文本分词是研究者在古籍文献处理中需要优先解决的问题。文章基于记载春秋至魏晋时期历史的最具有代表性的6部官修史籍构建古文分词语料库,结合预训练和词典信息融合两种策略运用4种深度学习模型进行多组对比实验,以确定不同模型的适用范畴。在此基础上开发面向繁体古文的分词工具,为从事数字人文的研究者提供简单有效的文本分词方法。
[期刊] 图书馆
[作者]
张毅 李欣
特藏资源是一个图书馆独特价值的体现,很多图书馆都非常重视特色馆藏建设与数字化,然而,传统的资源揭示方式无法充分体现特藏资源的价值。文章通过解读数字人文概念、调查国内外数字人文研究进展,探索图书馆利用现有数字人文研究成果揭示与激活特藏资源的方法,又以华东师范大学图书馆特藏方志数据库建设为例,利用文本挖掘、GIS、可视化、关联数据等技术在时间和空间两个维度对方志资源进行揭示。
[期刊] 图书馆论坛
[作者]
耿云冬 张逸勤 刘欢 王东波
在深度学习技术不断发展和预训练语言模型不断改进的背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SIKU-BERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明,SIKU-BERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
[期刊] 图书情报工作
[作者]
翟姗姗 刘齐进 白阳
[目的/意义]全面梳理近年来国内外非遗数字化保护的研究重点,进一步拓展其资源描述、语义揭示研究的理论内涵与外延,为促进我国非遗数字化技术发展、文化传承与传播提供新的思路。[方法/过程]借助信息空间理论,对非遗数字化资源描述与语义揭示问题进行全面综述,提出面向传承与传播的非遗数字资源描述与语义揭示多维度研究框架,并阐明现阶段的研究重点及不足之处。[结果/结论]非遗资源的语义描述与知识传播还需要大众广泛参与,这将有助于不同用户学习、交流与创新相关非遗知识,解决非遗知识传播与创新中出现的问题。
[期刊] 国家图书馆学刊
[作者]
王东波 高瑞卿 沈思 李斌
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。
[期刊] 情报理论与实践
[作者]
赵雪芹 李天娥 曾刚
[目的/意义]虚拟世界中充斥着海量的数字人文图像资源,其中蕴含着丰富的语义信息,面向数字人文图像的知识元本体构建及关联展示研究,可促进数字人文图像资源的知识组织、语义关联及知识服务。[方法/过程]构建一种数字人文图像知识元本体模型。首先,分析图像知识元的结构组成;然后,在Protégé中实现图像知识元本体的可视化构建,并提出基于知识元本体的数字人文图像语义关联展示思路;最后,以万里茶道图像资源为例进行实证研究。[结果/结论]图像知识元本体从细粒度层面对数字人文图像资源进行描述,为海量的图像资源提供了一种语义描述和关联组织的方式。
[期刊] 情报理论与实践
[作者]
曾子明 周知
[目的/意义]数字人文领域中图像包含大量的重要语义信息,是重要的研究对象,然而由于"语义鸿沟"的问题,目前常用的图像自动化标注方法并不适用于这一领域的图像语义描述工作。[方法/过程]提出一种面向数字人文的图像语义描述模型。根据用户认知特征制定图像语义结构化描述框架,并利用多方法组合进行语义特征词抽取与映射。最后,采集中国国家图书馆老照片数据进行实验。[结果/结论]实验结果显示,文章构建的模型在充分符合反映用户认知习惯的同时,对于语义特征词的识别与映射效果较好,有助于解决数字人文环境下图像语义描述问题。
关键词:
数字人文 图像 语义描述 模型设计
[期刊] 情报理论与实践
[作者]
陈诗 王东波 黄水清
[目的/意义]指代消解是古文信息挖掘的重要组成部分,是古文数字人文研究的技术支撑研究之一。文章使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,旨于为古文数字人文研究的发展做出推进。[方法/过程]选取《史记》为语料来源,通过阅读大量文献的同时结合语料特征制定标注规范,人工构建实验所需的语料库;另外,使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,并将文本划分为无词性字单位语料、无词性词单位语料、有词性词单位语料三种,探索不同分割单位与词性特征引入对指代消解效果的影响。[结果/结论]实验结果表明,在Bi-LSTM-CRF模型实验中引入词性特征,消解效果(F均值)达84.01%,而在未引入词性特征的情况下,BERT模型指代消解效果优于Bi-LSTM-CRF,F均值达82.43%。基于Bi-LSTM-CRF模型的无词性字单位文本实验与无词性词单位文本实验中F均值分别为74.13%、77.57%。所利用的深度学习方法能够有效解决古文句内人称代词指代消解问题,同时词性特征的引入能够有效提升模型的指代消解性能。[局限]仅针对句内、有且只有一条指代链的情况进行人称代词指代消解研究,同时文本量较小,实验具有一定局限性。
[期刊] 图书馆论坛
[作者]
王国强
古籍序跋保存了大量著者的有关信息及生平资料,有时甚至是惟一的资料,具有不可替代的价值。文章论证了古籍序跋在揭示著者署名、著者家世生平和图书著述时间方面的文献价值。
关键词:
古籍序跋 序跋 文献价值 文献学
[期刊] 图书馆建设
[作者]
李章超 何琳
国家文化数字化战略背景下,从海量、多源和异构的典籍内容中抽取出细粒度故事要素并实现知识组织,对于当下数字人文研究的路径整合及典籍内容的创造性转化和创新发展具有重要意义。提出涵盖“解构”“重组”和“故事化”的典籍内容数字化开发路径,并以路径为指导完成案例对象《左传》的数字化开发实践,从大众、学者和产业的视角检验所提路径的有效性,最后从数字人文视角对实践工作进行总结,提出典籍内容数字化开发推进策略。提出的路径不仅是对当下研究的整合,亦是当下研究方法和技术的理论化和范式化,更为相关实践提供路径和策略参考。
关键词:
数字人文 典籍内容 数字化开发 知识组织
[期刊] 图书馆论坛
[作者]
林立涛 王东波 刘江峰 李斌 冯敏萱
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 图书情报工作
[作者]
吴梦成 林立涛 齐月 黄水清 王东波 刘浏
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
[期刊] 图书馆
[作者]
李娜 包平
在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和调和平均数F为测评指标,最佳的测试效果分别为98.16%、91.55%、94.57%。结果显示,条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。
关键词:
条件随机场 方志古籍 地名 馆藏资源
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除