- 年份
- 2024(8981)
- 2023(12714)
- 2022(10566)
- 2021(9638)
- 2020(7760)
- 2019(17480)
- 2018(17517)
- 2017(33587)
- 2016(18175)
- 2015(20304)
- 2014(19884)
- 2013(19455)
- 2012(17393)
- 2011(15533)
- 2010(15246)
- 2009(14110)
- 2008(13071)
- 2007(11079)
- 2006(9491)
- 2005(7986)
- 学科
- 济(70591)
- 经济(70516)
- 管理(52477)
- 业(48451)
- 企(41039)
- 企业(41039)
- 方法(31941)
- 数学(27398)
- 数学方法(27069)
- 业经(20220)
- 农(18596)
- 中国(18111)
- 财(16679)
- 学(15262)
- 地方(13577)
- 贸(12634)
- 贸易(12628)
- 理论(12552)
- 农业(12544)
- 产业(12267)
- 易(12247)
- 和(11819)
- 环境(11265)
- 技术(11249)
- 务(11048)
- 制(10986)
- 财务(10984)
- 财务管理(10968)
- 信息(10961)
- 企业财务(10329)
- 机构
- 学院(249797)
- 大学(249672)
- 管理(102707)
- 济(92785)
- 经济(90636)
- 理学(89891)
- 理学院(88939)
- 管理学(87362)
- 管理学院(86926)
- 研究(78471)
- 中国(56551)
- 京(52469)
- 科学(50684)
- 财(41137)
- 所(38055)
- 业大(37668)
- 农(37041)
- 中心(35623)
- 研究所(35059)
- 江(34257)
- 范(34015)
- 财经(33875)
- 师范(33727)
- 北京(32751)
- 经(30791)
- 院(29111)
- 农业(29069)
- 州(28905)
- 师范大学(27161)
- 技术(27081)
- 基金
- 项目(179659)
- 科学(141024)
- 研究(133779)
- 基金(128969)
- 家(111532)
- 国家(110580)
- 科学基金(95709)
- 社会(82820)
- 社会科(78400)
- 社会科学(78381)
- 省(70997)
- 基金项目(68934)
- 自然(61994)
- 教育(60862)
- 自然科(60519)
- 自然科学(60507)
- 自然科学基金(59375)
- 划(59308)
- 编号(56568)
- 资助(51925)
- 成果(44891)
- 重点(39511)
- 部(38233)
- 发(38055)
- 创(37805)
- 课题(37659)
- 项目编号(35390)
- 创新(35086)
- 科研(34270)
- 大学(33456)
共检索到346329条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
陈诗 王东波 黄水清
[目的/意义]指代消解是古文信息挖掘的重要组成部分,是古文数字人文研究的技术支撑研究之一。文章使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,旨于为古文数字人文研究的发展做出推进。[方法/过程]选取《史记》为语料来源,通过阅读大量文献的同时结合语料特征制定标注规范,人工构建实验所需的语料库;另外,使用深度学习的方法对古代汉语文本的人称指代问题进行实验探索,并将文本划分为无词性字单位语料、无词性词单位语料、有词性词单位语料三种,探索不同分割单位与词性特征引入对指代消解效果的影响。[结果/结论]实验结果表明,在Bi-LSTM-CRF模型实验中引入词性特征,消解效果(F均值)达84.01%,而在未引入词性特征的情况下,BERT模型指代消解效果优于Bi-LSTM-CRF,F均值达82.43%。基于Bi-LSTM-CRF模型的无词性字单位文本实验与无词性词单位文本实验中F均值分别为74.13%、77.57%。所利用的深度学习方法能够有效解决古文句内人称代词指代消解问题,同时词性特征的引入能够有效提升模型的指代消解性能。[局限]仅针对句内、有且只有一条指代链的情况进行人称代词指代消解研究,同时文本量较小,实验具有一定局限性。
[期刊] 图书馆建设
[作者]
李章超 何琳
国家文化数字化战略背景下,从海量、多源和异构的典籍内容中抽取出细粒度故事要素并实现知识组织,对于当下数字人文研究的路径整合及典籍内容的创造性转化和创新发展具有重要意义。提出涵盖“解构”“重组”和“故事化”的典籍内容数字化开发路径,并以路径为指导完成案例对象《左传》的数字化开发实践,从大众、学者和产业的视角检验所提路径的有效性,最后从数字人文视角对实践工作进行总结,提出典籍内容数字化开发推进策略。提出的路径不仅是对当下研究的整合,亦是当下研究方法和技术的理论化和范式化,更为相关实践提供路径和策略参考。
关键词:
数字人文 典籍内容 数字化开发 知识组织
[期刊] 图书馆论坛
[作者]
林立涛 王东波 刘江峰 李斌 冯敏萱
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 图书情报工作
[作者]
吴梦成 林立涛 齐月 黄水清 王东波 刘浏
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
[期刊] 图书馆论坛
[作者]
刘畅 王东波 胡昊天 张逸勤 李斌
数字人文研究为古籍文献的深度开发与展示提供了良好的平台。精准的文本分词是研究者在古籍文献处理中需要优先解决的问题。文章基于记载春秋至魏晋时期历史的最具有代表性的6部官修史籍构建古文分词语料库,结合预训练和词典信息融合两种策略运用4种深度学习模型进行多组对比实验,以确定不同模型的适用范畴。在此基础上开发面向繁体古文的分词工具,为从事数字人文的研究者提供简单有效的文本分词方法。
[期刊] 清华大学教育研究
[作者]
许建平
本文对英语人称代词的翻译问题作了探讨。笔者认为,翻译时不恰当地套用原文的人称代词容易造成译文的冗赘、不畅,词语搭配、句式衔接、连贯的不当,不利传达原文的风格、语气。文章用若干翻译实例对上述各点作了分析、评述。
关键词:
英语 人称代词 翻译 问题
[期刊] 华东经济管理
[作者]
徐守勤
英语人称代词的理解与翻译徐守勤英语人称代词的数量虽然不多,用法却异常活跃,稍不留意便会发生理解错误,从而导致误译。本文从英语人称代词的歧义、指代意义、拟人化用法及习惯用法等方面讨论对英语人称代同的理解和翻译问题。(一)人称代词的歧义:WE:1、可用作...
[期刊] 图书馆论坛
[作者]
耿云冬 张逸勤 刘欢 王东波
在深度学习技术不断发展和预训练语言模型不断改进的背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SIKU-BERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明,SIKU-BERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
[期刊] 大学图书馆学报
[作者]
钱智勇 陈涛 张志美 徐宇红 何书
典籍图像是馆藏重要资源,图像数字化和内容揭示是数字人文基础建设,可实现“以图证史”“图像叙事”、多媒介传播等应用价值。文章依据图像元数据、资源描述框架(RDF)和国际图像互操作框架(IIIF)等标准规范,研究典籍图像深度揭示与利用的模型架构与实现方法。该模型由图像数字化、内容深度标注和数字人文应用三个相互关联的模块组成。从图像场景、实体对象和语义关联三个层次,揭示图像特征、典籍注释及背景知识,辅助数字人文研究。例证选用经典辞书《尔雅》插图版《尔雅音图》进行数字化,构建《尔雅》多语语义词表并与实体进行关联,深度揭示《尔雅》词汇的古今释义、音韵、分类、典籍注疏、例句典故等知识内容,探究《尔雅》图像的数字人文应用场景。
[期刊] 图书情报工作
[作者]
何琳 马晓雯 喻雪寒 艾毓茜 李章超 高丹
[目的/意义]事件自动识别抽取是当前典籍主题挖掘研究中一个新的重要课题,其中事件触发词的识别是一项基础的工作,本研究旨在探索古代典籍中事件触发词自动识别和分类的通用方法。[方法/过程]首先运用LDA模型对动词进行主题聚类,归纳典籍事件触发动词的分类体系;并依据聚类结果与分类体系,初步构建触发动词的种子词集。在此基础上,通过语义相似度计算,对种子词集进行扩展,构建典籍事件触发词语义数据集。在实验阶段,以先秦时期的重要典籍《左传》为例,对分类体系构建和种子词集扩展的方法进行验证。[结果/结论]结果表明,本文所提出的典籍事件触发词识别方法可行有效,据此构建的事件触发词集具有较高可信度,未来可进一步扩大实验的样本数量及范围。
[期刊] 图书馆论坛
[作者]
赵连振 张逸勤 刘江峰 王东波 冯敏萱 李斌
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书情报工作
[作者]
王东波 黄水清 何琳
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的
[期刊] 图书馆论坛
[作者]
吴梦成 林立涛 胡蝶 刘畅 黄水清 孟凯 王东波
中国存世典籍成书于不同时代,典籍文本的语体风格及内容均具有时代性。文章以古代汉语到现代汉语的机器翻译为切入点,探究典籍文本的时代特征及其对中国古代典籍机器翻译的影响,提出针对不同历史时期训练翻译模型的策略,以提高古文翻译质量。以《二十四史全译》为研究语料,将语料划分为远古、中古、近古三个时期,从计算人文视角利用统计计量的方法对不同历史时期典籍文本的词频、词性、依存关系进行比较分析;在数据增强的基础上,利用每个时期的语料分别训练多种机器翻译模型并比较翻译效果。研究发现:典籍文本存在时代特征差异,并会对机器翻译效果产生显著影响;针对不同时期典籍文本分别训练机器翻译模型,能够提高古文翻译的准确性和流畅性。
[期刊] 常州工学院学报(社科版)
[作者]
朱铭宇
“这N+让+人称代词+V的”是现代汉语口语中常见的习语性构式。该构式派生自口语构式“这NV的”,具有表达负面评价立场的功能。其构式义可以概括为说话人对某事物或事态作出负面评价的同时,确立了自己对施事者(或称责任者)的负面评价立场。“这N+让+人称代词+V的”构式的形成,一方面是因为礼貌原则、交互主观性的驱动,另一方面是因为交互激活模式、最小偏离原则产生的适切性判断,该构式最终在高频使用和语境吸收中实现了负面评价立场的规约化。
[期刊] 情报理论与实践
[作者]
麦范金 李东普 甘国庆
本文介绍了一种建立在指代消解基础上的自动文摘方法。创新之处是在对文档内容使用自然语言处理技术全面分析的基础之上,只需对关键句进行指代消解,缩小了消解的范围,降低了对指代消解的要求。同时模拟人性思维,对于出现在不同位置的关键词和句子赋予不同的权重,凸显出含有关键词和总结性的句子。实验证明这种方法是可行的,有效的。
关键词:
指代消解 自动文摘 自然语言处理
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除