标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(7941)
2023(11491)
2022(10149)
2021(9758)
2020(8069)
2019(18551)
2018(18724)
2017(35695)
2016(19754)
2015(22258)
2014(22378)
2013(21785)
2012(19963)
2011(17827)
2010(17683)
2009(15920)
2008(15248)
2007(13177)
2006(11385)
2005(9869)
作者
(56580)
(46755)
(46420)
(44220)
(29632)
(22339)
(21077)
(18659)
(17936)
(16601)
(16134)
(15686)
(14869)
(14767)
(14408)
(14292)
(14013)
(13972)
(13362)
(13162)
(11725)
(11505)
(11261)
(10738)
(10453)
(10390)
(10317)
(10241)
(9395)
(9318)
学科
(72395)
经济(72302)
管理(55176)
(49709)
(41478)
企业(41478)
方法(33826)
数学(28981)
数学方法(28636)
中国(20099)
(19810)
(18750)
(18353)
业经(16076)
地方(15380)
(14656)
理论(14051)
农业(13027)
(12601)
(12181)
贸易(12174)
教育(11825)
(11781)
技术(11603)
环境(11483)
(11296)
(11228)
财务(11226)
财务管理(11201)
银行(11185)
机构
大学(272075)
学院(269172)
管理(107638)
(100362)
经济(97915)
理学(93274)
理学院(92184)
研究(91095)
管理学(90530)
管理学院(90031)
中国(66222)
(59006)
科学(58708)
(46200)
(45727)
(44990)
业大(42387)
研究所(41964)
中心(40885)
(38935)
北京(37327)
(37120)
财经(36850)
师范(36738)
农业(35231)
(33648)
(33579)
(31667)
技术(30243)
师范大学(29773)
基金
项目(190506)
科学(148592)
研究(139730)
基金(136598)
(119605)
国家(118602)
科学基金(101129)
社会(85082)
社会科(80409)
社会科学(80388)
(74651)
基金项目(73032)
自然(66748)
自然科(65167)
自然科学(65152)
教育(64170)
自然科学基金(63938)
(63361)
编号(58050)
资助(55754)
成果(47538)
重点(42379)
(41428)
(40078)
课题(39916)
(39366)
创新(36631)
科研(36481)
项目编号(36033)
大学(35298)
期刊
(109730)
经济(109730)
研究(79114)
中国(52546)
学报(46487)
科学(41176)
(40679)
管理(39123)
教育(35143)
大学(34800)
(34385)
学学(32340)
农业(28320)
技术(23804)
(20296)
金融(20296)
业经(18264)
图书(17219)
财经(17214)
经济研究(16914)
(14538)
问题(14183)
(14095)
科技(13956)
理论(13736)
(13148)
实践(12824)
(12824)
技术经济(12193)
业大(12048)
共检索到391157条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 国家图书馆学刊  [作者] 王东波  高瑞卿  沈思  李斌  
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。
[期刊] 图书馆论坛  [作者] 赵连振  张逸勤  刘江峰  王东波  冯敏萱  李斌  
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型,以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练,探索了基于深度学习技术的古文自动标点模型。实验结果表明,SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越,对于书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越,均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性,有助于推动数字人文在古籍研究中的发展。
[期刊] 图书情报工作  [作者] 王东波  何琳  黄水清  
[目的 /意义]在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法 /过程]基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果 /结论]基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。
[期刊] 情报学报  [作者] 王东波  高瑞卿  沈思  李斌  
近年来,自动问答系统已成为机器学习、信息检索和自然语言处理领域的研究热点。问句分类作为问答系统要处理的第一步,其分类结果的好坏直接影响问答系统的质量,但目前大部分问句分类研究集中在现代汉语领域,针对古文相关内容的问句分类研究相对较少。本文从问句分类的概念出发,构建了古文文献问句分类体系,然后利用TF-IDF提取类别特征词,先后利用支持向量机、条件随机场、深度学习模型完成针对先秦10部典籍的问句自动分类实验。结果表明,3种分类模型中,使用Bi-LSTM模型分类效果最好,在本文提出的7种类别上,达到调和平均值94.78%,具有较强的推广和应用价值。
[期刊] 图书情报工作  [作者] 王东波  黄水清  何琳  
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的
[期刊] 图书情报工作  [作者] 刘忠宝  党建飞  张志剑  
[目的/意义]《史记》是我国第一部纪传体史书,几乎囊括黄帝时代到汉武帝元狩元年3000多年的重大历史事件。如何快速准确地发现这些历史事件及其之间的内在联系,对于透过历史现象、揭示历史实质以及发现历史规律具有重要意义。[方法/过程]在BERT模型和LSTM-CRF模型的基础上,提出面向《史记》的历史事件及其组成元素抽取方法,并基于此构建《史记》事理图谱。[结果/结论]实验结果表明,利用所提方法抽取历史事件及其组成元素的F1值分别达到0.823和0.760。通过事理图谱能够发现蕴含在《史记》中鲜为人知的知识,这为文献学、历史学、社会学等领域专家开展研究提供必要的资料准备。
[期刊] 图书馆  [作者] 李娜  包平  
在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和调和平均数F为测评指标,最佳的测试效果分别为98.16%、91.55%、94.57%。结果显示,条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。
[期刊] 图书馆论坛  [作者] 刘畅  王东波  胡昊天  张逸勤  李斌  
数字人文研究为古籍文献的深度开发与展示提供了良好的平台。精准的文本分词是研究者在古籍文献处理中需要优先解决的问题。文章基于记载春秋至魏晋时期历史的最具有代表性的6部官修史籍构建古文分词语料库,结合预训练和词典信息融合两种策略运用4种深度学习模型进行多组对比实验,以确定不同模型的适用范畴。在此基础上开发面向繁体古文的分词工具,为从事数字人文的研究者提供简单有效的文本分词方法。
[期刊] 图书馆论坛  [作者] 杨跃翔   刘文玲   林睿婷   陈雨杰   王皖  
突发事件影响广泛,涉及因素较多,当前突发事件要素识别研究存在灾害要素信息、应对流程信息、承灾载体信息等数据自动识别困难等问题。文章构建突发事件应急要素“四维”模型,确定包含保障措施、响应措施等流程性信息在内的八类应急要素类别,提出TDA-RoBERTa-wwm-BiLSTM-CRF模型。该模型采用基于模板的数据增强策略,融合预训练模型与双向长短期记忆网络-条件随机场方法,实现了突发事件多要素信息的自动识别。对比与消融实验结果表明,该模型在突发事件应急要素自动识别中能起到良好效果。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 图书馆论坛  [作者] 林立涛  王东波  刘江峰  李斌  冯敏萱  
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 图书情报工作  [作者] 吴梦成  林立涛  齐月  黄水清  王东波  刘浏  
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在人文计算兴起这一背景下,为了更加深入和精准地从古代典籍中挖掘出相应的知识,针对先秦文献进行自动分词的探究。[方法/过程]基于《汉学引得丛刊》中的《春秋经传注疏引书引得》制定词汇表,在由《春秋左氏传》和《晏子春秋》所构成的训练和测试语料上,通过条件随机场模型,结合使用统计和人工内省方法确定的特征模板,完成对先秦典籍进行自动分词的探究。[结果/结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、内部特征模板和组合特征模板下的自动分词模型,最好的分词模型调和平均值达到97.47%,具有较强的推广和应用价值。在构建自动分词模型的过程中,通过融入内部和外部的特征知识,模型的精确率...
[期刊] 经济学动态  [作者] 何健  侯炜  
传统经济学是建立在静态的均衡分析基础之上,以边际报酬递减规律作为假设前提。依据一般经济理论,均衡意味着"最优",即对资源的最优利用与分配。在此框架下,经济运行被描述成线性的、静态的、确定的、简单的和可逆的。也就是说,在报酬递减规律的作用下,经济系统最终会达到可预见的均衡。然而,现实情况与此经常相反。如早期产生的一种产品或技术,尽管其质量较次或技术不成熟,但一旦在市场上出现,便会逐渐占据市场的主要份额,甚至居于垄断地位。传统经济理论对此无法解释。但经济理论必须反映经济现实,因而,另一种理论观点-报酬递增理论在当代越来越多地被经济学家们所接受,并被阿瑟为代表的一些学者用来解释此现象。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除