- 年份
- 2024(5523)
- 2023(7689)
- 2022(5685)
- 2021(4919)
- 2020(3953)
- 2019(8914)
- 2018(8988)
- 2017(17121)
- 2016(9346)
- 2015(10686)
- 2014(10521)
- 2013(10009)
- 2012(8994)
- 2011(8038)
- 2010(8339)
- 2009(7407)
- 2008(7146)
- 2007(6408)
- 2006(5546)
- 2005(4854)
- 学科
- 济(42341)
- 经济(42308)
- 管理(26744)
- 业(24039)
- 企(20229)
- 企业(20229)
- 方法(20179)
- 数学(18376)
- 数学方法(17875)
- 业经(13508)
- 中国(11226)
- 产业(9694)
- 农(9584)
- 信息(8984)
- 总论(8412)
- 信息产业(8359)
- 财(8112)
- 理论(7856)
- 学(7062)
- 贸(6524)
- 贸易(6518)
- 地方(6450)
- 农业(6412)
- 易(6347)
- 银(6175)
- 银行(6163)
- 和(6103)
- 技术(6036)
- 教学(5920)
- 行(5910)
- 机构
- 学院(130597)
- 大学(128957)
- 管理(51728)
- 济(49869)
- 经济(48806)
- 理学(44796)
- 理学院(44319)
- 管理学(43100)
- 管理学院(42855)
- 研究(40431)
- 中国(30594)
- 京(27206)
- 科学(26062)
- 财(22046)
- 农(19830)
- 所(19654)
- 业大(19557)
- 江(19296)
- 中心(19206)
- 研究所(18069)
- 财经(17464)
- 范(16940)
- 北京(16890)
- 师范(16765)
- 技术(16106)
- 州(15909)
- 经(15834)
- 农业(15389)
- 经济学(15272)
- 院(14946)
- 基金
- 项目(92532)
- 科学(73097)
- 研究(67627)
- 基金(66004)
- 家(57813)
- 国家(57362)
- 科学基金(49960)
- 社会(42144)
- 社会科(40157)
- 社会科学(40144)
- 省(37543)
- 基金项目(33836)
- 自然(32164)
- 教育(32114)
- 自然科(31502)
- 自然科学(31497)
- 划(31170)
- 自然科学基金(30889)
- 编号(28728)
- 资助(27207)
- 成果(22849)
- 重点(20735)
- 创(20012)
- 发(19646)
- 课题(19388)
- 部(19118)
- 创新(18604)
- 项目编号(18089)
- 国家社会(17820)
- 科研(17589)
共检索到189784条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆
[作者]
李娜 包平
在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和调和平均数F为测评指标,最佳的测试效果分别为98.16%、91.55%、94.57%。结果显示,条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。
关键词:
条件随机场 方志古籍 地名 馆藏资源
[期刊] 中国图书馆学报
[作者]
朱锁玲 包平
以地方志资料汇编《方志物产》(广东分卷)为语料,设计并构建了古籍地名识别系统。采用规则与统计相结合的命名实体识别方法,实现了物产地名的自动识别。分析了命名实体识别技术在中国方志类古籍整理中的应用前景,为方志类古籍进行数字化整理、挖掘物产分布、物产引进和传播等相关研究提供了新的途径。
[期刊] 图书馆论坛
[作者]
徐润华 王东波 刘欢 梁媛 陈康
可以降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究少。文章面向《资治通鉴》语料,基于Siku BERT预训练模型进行自动摘要实验,并对比传统抽取式自动摘要算法和百度智能云摘要分析算法在《资治通鉴》语料上的表现。实验结果表明,基于Siku BERT预训练模型生成的摘要结果在稳定性、覆盖度等方面均优于其他两种方法;通过专家人工打分方式,基于Siku BERT预训练模型生成的摘要结果平均得分最高。实验验证了使用数字人文技术对古文进行自动摘要任务的可行性和利用Siku BERT预训练模型对古文进行信息处理的适用性。
[期刊] 图书情报工作
[作者]
黄水清 王东波 何琳
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 图书馆论坛
[作者]
朱锁玲 包平
以地方志资料汇编《方志物产》(广东分卷)为语料,利用命名实体识别技术实现物产地名的自动识别。通过对物产地名、识别规则的文献计量学研究,挖掘物产分布、物产引进和传播等知识内容,为方志类古籍的数字化整理提供新途径。
[期刊] 图书馆论坛
[作者]
赵连振 张逸勤 刘江峰 王东波 冯敏萱 李斌
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书馆论坛
[作者]
刘畅 王东波 胡昊天 张逸勤 李斌
数字人文研究为古籍文献的深度开发与展示提供了良好的平台。精准的文本分词是研究者在古籍文献处理中需要优先解决的问题。文章基于记载春秋至魏晋时期历史的最具有代表性的6部官修史籍构建古文分词语料库,结合预训练和词典信息融合两种策略运用4种深度学习模型进行多组对比实验,以确定不同模型的适用范畴。在此基础上开发面向繁体古文的分词工具,为从事数字人文的研究者提供简单有效的文本分词方法。
[期刊] 图书情报工作
[作者]
张宁 Miguel Baptista Nunes 李俊炀 张伟波
[目的/意义]旨在借助VR媒介技术,克服或弱化普通读者在古籍阅读中存在的古籍获取不便和古汉语理解、专业知识、特定文化背景知识、阅读动力不足的问题,促进古籍阅读推广与文化传播。[方法/过程]利用文献调研方法分析梳理认知科学和教育技术领域相关理论,提出VR古籍系统设计原则与模型,基于单个案例分析,设计、开发、测试系统原型,最后利用实验方法以问卷方式收集评估数据,验证设计原则、模型的有用性。[结果/结论]研究成果包括VR古籍系统设计原则、VR古籍系统理论模型、首例VR古籍系统应用原型、VR古籍系统使用理论,可为后续从事VR古籍系统研究与设计的科研人员和设计人员借鉴使用。
[期刊] 国家图书馆学刊
[作者]
王东波 高瑞卿 沈思 李斌
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。
[期刊] 图书馆
[作者]
张毅 李欣
特藏资源是一个图书馆独特价值的体现,很多图书馆都非常重视特色馆藏建设与数字化,然而,传统的资源揭示方式无法充分体现特藏资源的价值。文章通过解读数字人文概念、调查国内外数字人文研究进展,探索图书馆利用现有数字人文研究成果揭示与激活特藏资源的方法,又以华东师范大学图书馆特藏方志数据库建设为例,利用文本挖掘、GIS、可视化、关联数据等技术在时间和空间两个维度对方志资源进行揭示。
[期刊] 图书馆论坛
[作者]
耿云冬 张逸勤 刘欢 王东波
在深度学习技术不断发展和预训练语言模型不断改进的背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SIKU-BERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明,SIKU-BERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
[期刊] 情报理论与实践
[作者]
张卫东 左娜
[目的/意义]引入"数字人文"的思维,帮助馆藏资源可视化研究摆脱封闭性、内部矛盾性等限制,最终实现馆藏资源可视化的价值。[方法/过程]阐述"数字人文"理论的核心思想,并厘清数字人文与馆藏资源可视化之间的关系,在分析可视化流程的基础之上,设计构建了面向数字人文的馆藏资源可视化模型,并重点介绍了"数据""分析""技术"和"服务"四个模型节点。[结果/结论]将馆藏资源可视化建设置于数字人文研究的大背景中具有重要的意义,不仅为可视化研究提供了跨学科、跨领域的开放、协作的环境,又为相关研究的工作者提供了新的视角。
关键词:
数字人文 馆藏资源 可视化分析 模型
[期刊] 图书馆杂志
[作者]
余馨玲 常娥
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DA-BERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
[期刊] 中国图书馆学报
[作者]
夏翠娟 林海青 刘炜
在数字人文逐步成为数字图书馆建设新常态的大背景下,本文通过借鉴"循证实践"和"循证社会学"的思想,提出了"古籍循证"的概念。利用文献调研、需求分析、数据建模、实验验证等方法,调研古代目录、现代联合目录的编排体例和古籍元数据标准规范的结构框架,分析在互联网和机器智能时代,基于古籍循证的版本学、校勘学、分类学及历史人文学等特定领域的研究需求,设计一个可将不同来源、不同格式的古籍目录、元数据记录、古籍文献全文和各类古籍知识融合为一体的古籍数据模型。依托"中文古籍联合目录及循证平台"的建设,利用此模型和本体词表融
关键词:
数字人文 古籍循证 数据建模
[期刊] 中国图书馆学报
[作者]
欧阳剑
传统的古籍开发与应用模式已难以适应人文学科研究的需要,人文学科研究者期待一个技术逻辑和人文逻辑相耦合的数字人文研究范式的出现。本文从古籍文献深层次开发与利用出发,利用新的信息技术与面向数字人文研究跨学科方法,以大规模中国古籍文本为研究对象,采用大数据研究理念,对古籍进行整理、标注、自动分词等处理,以词频分析统计为研究核心,采用数据降噪、基于窗口时间单位的统计分析计算、滑动窗口预测等分析与挖掘方法,采用大数据实时分析技术,实现了实时、在线、立体、可视化、定量分析字词的历史词频分布规律,创建了一个以语言学、历史文献学、历史地理学等人文学科研究为主的古籍实时统计分析平台,可辅助研究者在大量的古籍文献...
关键词:
数字人文 文本可视化 数据挖掘 古籍文献
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除