标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(8628)
2023(12527)
2022(11118)
2021(10515)
2020(8722)
2019(20322)
2018(20151)
2017(39207)
2016(21089)
2015(23643)
2014(23444)
2013(22848)
2012(20530)
2011(18212)
2010(17690)
2009(15692)
2008(14708)
2007(12254)
2006(10217)
2005(8310)
作者
(57375)
(47709)
(47142)
(44937)
(30262)
(22846)
(21561)
(18983)
(18164)
(16618)
(16367)
(15785)
(14827)
(14801)
(14667)
(14398)
(14240)
(14174)
(13543)
(13431)
(11662)
(11374)
(11337)
(10875)
(10620)
(10457)
(10428)
(10347)
(9505)
(9428)
学科
(80300)
经济(80215)
管理(60112)
(56668)
(47810)
企业(47810)
方法(42225)
数学(37250)
数学方法(36704)
(20863)
(20231)
中国(19333)
业经(17756)
(17123)
地方(15474)
理论(14268)
农业(14093)
(13812)
贸易(13807)
(13549)
财务(13481)
财务管理(13454)
(13405)
技术(13371)
(13114)
环境(12831)
企业财务(12741)
(12099)
(11336)
教育(10673)
机构
大学(287055)
学院(284896)
管理(119593)
(109858)
经济(107536)
理学(105696)
理学院(104577)
管理学(102583)
管理学院(102079)
研究(87988)
中国(62684)
(59422)
科学(55931)
(47862)
业大(43790)
(42454)
(41636)
中心(40866)
财经(40084)
研究所(38606)
(38192)
(38176)
师范(37850)
(36719)
北京(36631)
农业(33219)
(32843)
经济学(32609)
(31558)
师范大学(30914)
基金
项目(210013)
科学(166059)
研究(153779)
基金(153297)
(132951)
国家(131874)
科学基金(114914)
社会(96111)
社会科(91073)
社会科学(91049)
基金项目(82488)
(81878)
自然(76166)
自然科(74431)
自然科学(74414)
自然科学基金(73038)
教育(71653)
(69151)
编号(63243)
资助(62649)
成果(49214)
重点(46524)
(46368)
(43984)
(43852)
课题(42330)
创新(40946)
科研(40652)
教育部(40211)
大学(39768)
期刊
(108536)
经济(108536)
研究(77728)
中国(46615)
学报(44514)
管理(41606)
科学(40986)
(37140)
(35513)
大学(34455)
教育(33308)
学学(32305)
农业(26482)
技术(26211)
业经(18898)
财经(18372)
(18222)
金融(18222)
经济研究(17234)
图书(16364)
(15560)
科技(14312)
问题(14276)
理论(14037)
技术经济(13483)
实践(13135)
(13135)
(13026)
(12963)
资源(12733)
共检索到384575条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报学报  [作者] 王东波  高瑞卿  沈思  李斌  
近年来,自动问答系统已成为机器学习、信息检索和自然语言处理领域的研究热点。问句分类作为问答系统要处理的第一步,其分类结果的好坏直接影响问答系统的质量,但目前大部分问句分类研究集中在现代汉语领域,针对古文相关内容的问句分类研究相对较少。本文从问句分类的概念出发,构建了古文文献问句分类体系,然后利用TF-IDF提取类别特征词,先后利用支持向量机、条件随机场、深度学习模型完成针对先秦10部典籍的问句自动分类实验。结果表明,3种分类模型中,使用Bi-LSTM模型分类效果最好,在本文提出的7种类别上,达到调和平均值94.78%,具有较强的推广和应用价值。
[期刊] 图书情报工作  [作者] 王东波  何琳  黄水清  
[目的 /意义]在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法 /过程]基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果 /结论]基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。
[期刊] 图书情报工作  [作者] 王东波  黄水清  何琳  
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的
[期刊] 国家图书馆学刊  [作者] 王东波  高瑞卿  沈思  李斌  
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。
[期刊] 图书馆论坛  [作者] 赵连振  张逸勤  刘江峰  王东波  冯敏萱  李斌  
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书情报工作  [作者] 吴梦成  林立涛  齐月  黄水清  王东波  刘浏  
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在人文计算兴起这一背景下,为了更加深入和精准地从古代典籍中挖掘出相应的知识,针对先秦文献进行自动分词的探究。[方法/过程]基于《汉学引得丛刊》中的《春秋经传注疏引书引得》制定词汇表,在由《春秋左氏传》和《晏子春秋》所构成的训练和测试语料上,通过条件随机场模型,结合使用统计和人工内省方法确定的特征模板,完成对先秦典籍进行自动分词的探究。[结果/结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、内部特征模板和组合特征模板下的自动分词模型,最好的分词模型调和平均值达到97.47%,具有较强的推广和应用价值。在构建自动分词模型的过程中,通过融入内部和外部的特征知识,模型的精确率...
[期刊] 图书情报工作  [作者] 王彦力  冉蔚然  杨新涯  
[目的/意义]为更好地对中国传统典籍进行阅读推广,提出对中国传统典籍进行分类指导阅读推广,并以此分类为基础提出有针对性的各类不同推广策略。[方法/过程]界定适合阅读推广的中国传统典籍范围,建立以阅读推广为基础的中国传统典籍分类书目体系,梳理研究中国传统典籍推广现有模式及案例。[结果/结论]建立起一套以阅读推广为基础的中国传统典籍自主分类体系,面向不同阅读群体提出各具特色的推广模式,促进中国传统典籍阅读推广工作的高效与可持续发展。
[期刊] 图书馆论坛  [作者] 徐娟  刘东华  刘宇  
色彩作为承载中国传统思想观念、文化习俗、社会礼制的重要载体,是传统文化不可或缺的部分,全面探析明清时期色彩的演变发展、思想流变及其文化内涵,对弘扬传统色彩文化具有重要意义。文章以明清时期的四本典籍文本为语料,提出一种基于文本挖掘进行明清时期色彩知识探究的研究方法,通过实体标注、实体关系抽取、色彩演变分析、色彩与社会阶层关系探究4个部分的研究,探索明清时期色彩的演变特征,在此基础上揭示其文化内涵。与传统方法相比,文章通过量化的方式更加清晰地展现了明清时期色彩的演变特征;通过分析文本内容,进一步发现明清时期色彩等级随着政治、经济、染色工艺等的变化,呈现出动态变化的特点。分析结果得到历史学、艺术学相关研究资料的佐证,验证了方法的有效性。
[期刊] 图书情报工作  [作者] 何琳  马晓雯  喻雪寒  艾毓茜  李章超  高丹  
[目的/意义]事件自动识别抽取是当前典籍主题挖掘研究中一个新的重要课题,其中事件触发词的识别是一项基础的工作,本研究旨在探索古代典籍中事件触发词自动识别和分类的通用方法。[方法/过程]首先运用LDA模型对动词进行主题聚类,归纳典籍事件触发动词的分类体系;并依据聚类结果与分类体系,初步构建触发动词的种子词集。在此基础上,通过语义相似度计算,对种子词集进行扩展,构建典籍事件触发词语义数据集。在实验阶段,以先秦时期的重要典籍《左传》为例,对分类体系构建和种子词集扩展的方法进行验证。[结果/结论]结果表明,本文所提出的典籍事件触发词识别方法可行有效,据此构建的事件触发词集具有较高可信度,未来可进一步扩大实验的样本数量及范围。
[期刊] 大学图书馆学报  [作者] 钱智勇  陈涛  张志美  徐宇红  何书  
典籍图像是馆藏重要资源,图像数字化和内容揭示是数字人文基础建设,可实现“以图证史”“图像叙事”、多媒介传播等应用价值。文章依据图像元数据、资源描述框架(RDF)和国际图像互操作框架(IIIF)等标准规范,研究典籍图像深度揭示与利用的模型架构与实现方法。该模型由图像数字化、内容深度标注和数字人文应用三个相互关联的模块组成。从图像场景、实体对象和语义关联三个层次,揭示图像特征、典籍注释及背景知识,辅助数字人文研究。例证选用经典辞书《尔雅》插图版《尔雅音图》进行数字化,构建《尔雅》多语语义词表并与实体进行关联,深度揭示《尔雅》词汇的古今释义、音韵、分类、典籍注疏、例句典故等知识内容,探究《尔雅》图像的数字人文应用场景。
[期刊] 图书馆论坛  [作者] 刘畅  王东波  胡昊天  张逸勤  李斌  
数字人文研究为古籍文献的深度开发与展示提供了良好的平台。精准的文本分词是研究者在古籍文献处理中需要优先解决的问题。文章基于记载春秋至魏晋时期历史的最具有代表性的6部官修史籍构建古文分词语料库,结合预训练和词典信息融合两种策略运用4种深度学习模型进行多组对比实验,以确定不同模型的适用范畴。在此基础上开发面向繁体古文的分词工具,为从事数字人文的研究者提供简单有效的文本分词方法。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 长江大学学报(社科版)  [作者] 卢军羽  刘宝才  
中国瓷器的生产历史就是一部窑场的变迁史,向域外读者译介中国陶瓷典籍和传播中国悠久的窑炉文化,是中国文化走出去的重要任务。中国陶瓷典籍中的窑名可分为三类:地名窑、人名窑和功能窑。窑炉文化具有系统性,且窑名属陶瓷行业术语,因此窑名的翻译应遵循系统性和可辨性原则,但具体翻译方法因窑名的不同类别而异。
[期刊] 山西财经大学学报  [作者] 王苏华  孙萃英  
在文化强国战略引领下,我国既要注重其他民族优秀文化的引进,又要在高校教育中传播"中华文化走出去"观念,让世界领略中华优秀文化的魅力,提升中华文化国际影响力。在此背景下,以传统文化推介作为突破口,将戏剧的译介作为推动中华文化进一步传播的主要手段,是一项非常有文化交流意义、值得持续推进的工程。然而,在跨语言文化交流中,文化信息的传递需要通过翻译的手段实现。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除