标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(9608)
2023(14087)
2022(12469)
2021(11809)
2020(9889)
2019(23083)
2018(22935)
2017(44742)
2016(24235)
2015(27374)
2014(27151)
2013(26389)
2012(23854)
2011(21136)
2010(21039)
2009(18836)
2008(17997)
2007(15438)
2006(13072)
2005(10839)
作者
(66882)
(55777)
(55341)
(52604)
(35374)
(26729)
(25209)
(22143)
(21201)
(19724)
(19087)
(18470)
(17454)
(17327)
(17229)
(16774)
(16702)
(16607)
(15865)
(15836)
(13724)
(13463)
(13461)
(12776)
(12466)
(12339)
(12285)
(12204)
(11179)
(11081)
学科
(92742)
经济(92641)
管理(69608)
(65140)
(55240)
企业(55240)
方法(48402)
数学(42642)
数学方法(41892)
(24054)
(23226)
中国(22727)
业经(20466)
(20021)
地方(17950)
理论(17366)
农业(16092)
(15636)
贸易(15629)
(15259)
技术(15250)
(15179)
财务(15170)
(15137)
财务管理(15134)
(15121)
环境(14533)
企业财务(14287)
(13127)
(12420)
机构
学院(331183)
大学(330334)
管理(135928)
(125599)
经济(122845)
理学(119586)
理学院(118311)
管理学(115780)
管理学院(115196)
研究(102043)
中国(74191)
(68764)
科学(65868)
(55638)
业大(51194)
(50956)
(49367)
中心(47775)
财经(45943)
(45737)
研究所(45600)
(43317)
师范(42896)
北京(42533)
(41952)
农业(39964)
(37796)
(37739)
经济学(37158)
技术(36566)
基金
项目(238918)
科学(188171)
研究(173662)
基金(172982)
(150540)
国家(149309)
科学基金(129659)
社会(107504)
社会科(101879)
社会科学(101849)
(94295)
基金项目(92176)
自然(86473)
自然科(84510)
自然科学(84492)
自然科学基金(82907)
教育(81638)
(79109)
编号(71954)
资助(71807)
成果(56478)
重点(53033)
(52053)
(50034)
(49844)
课题(48759)
创新(46542)
科研(46014)
教育部(44925)
大学(44863)
期刊
(126324)
经济(126324)
研究(88735)
中国(56586)
学报(52362)
管理(48230)
科学(47670)
(45050)
(42131)
大学(40047)
教育(39062)
学学(37660)
技术(32102)
农业(31785)
(22380)
金融(22380)
业经(22153)
财经(21069)
经济研究(20397)
图书(18616)
(17884)
科技(16410)
(16380)
问题(16316)
技术经济(15974)
统计(15743)
理论(15607)
(15509)
资源(14849)
实践(14519)
共检索到453198条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 图书情报工作  [作者] 常娥  张长秀  侯汉清  惠富平  
借鉴现代汉语词义消歧的研究成果,提出一种改进的向量空间模型词义消歧方法,即在古汉语义项词语知识库的支持下,将待消歧多义词上下文与多义词的义项映射到向量空间模型中,完成语义消歧任务。以中国农业古籍全文数据库为统计语料,对10个典型古汉语多义词,共29个义项、1 836条待消歧上下文进行义项标注的实验,消歧平均正确率达到79.5%。
[期刊] 数据分析与知识发现  [作者] 王晓玉  李斌  
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报理论与实践  [作者] 王知津  
<正>由南京农业大学黄水清和王东波教授编写、南京大学出版社出版的《大规模现代汉语分词语料库构建及应用》一书正式问世了!该书以“新时代人民日报分词语料库”(New Era People’s Daily Segmented Corpus,以下简称NEPD)为研究对象。NEPD收录了2015年1—6月、2016年1月、2017年1月、2018年1月、2022年1月共10个月《人民日报》上刊发的全部文章,构建了迄今规模最大的精加工现代汉语通用分词语料库,超过3000万字符量,向全世界学术界开放供免费获取。在此之前的现代汉语通用语料库中,规模超百万字且为人工标注精加工的,只有1998月1月的北京大学人民日报语料库。NEPD既接续了北京大学1998年1月人民日报语料库,又弥补了北京大学人民日报语料库20多年没有更新以及在词汇的时效性、完备性和覆盖度方面存在的不足,以其高标准的原始语料、高质量的人工标注以及开放共享的理念,支持并促进了图书情报学、语言学、计算机科学等相关学科领域的研究与发展,赢得了学术界的广泛认同和赞誉。在NEPD的数据选取标准、加工流程、应用示范等方面,《大规模现代汉语分词语料库构建及应用》一书给出了至今最为详尽和全面的阐述。该书不仅介绍了NEPD构建的背景、缘由、目的、原则、过程、规范和应用,而且还展望了精标注语料库在当前以深度学习为标志的人工智能发展热潮中的关键作用和重要价值。
关键词:
[期刊] 中国特殊教育  [作者] 吕会华  吴铃  张会文  
目前对聋人汉语书面语的研究尚停留在经验层面。基于聋人汉语书面语语料库的研究,可以解决语料少,作者信息不清以及和其他汉语作为第二语言习得者对比困难等问题。随着对聋人汉语书面语研究的深入,聋人的汉语水平也将得到提高。语料库建设是一项长期、繁重的工作,本研究在考察了几个汉语学习者语料库的基础上,提出了自己的建库构想。确定了语料属性、语料标注标准等。在理论研究的同时,着手进行聋人汉语书面语语料库的初步建设,取得了一定成绩。
[期刊] 情报学报  [作者] 唐雪梅  苏祺  王军  杨浩  
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary (OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究更关注的是如何提高分词效果,忽视了分词任务中的一大挑战,即OOV问题。因此,本文提出了一种基于图卷积神经网络的古汉语分词框架,通过结合预训练语言模型和图卷积神经网络,将外部知识融合到神经网络模型中来提高分词性能并缓解OOV问题。在《左传》《战国策》和《儒林外史》 3个古汉语分词数据集上的研究结果显示,本文模型提高了3个数据集的分词表现。进一步的研究分析证明,本文模型能够有效地融合词典和N-gram信息;特别是N-gram有助于缓解OOV问题。
[期刊] 图书馆  [作者] 李娜  包平  
在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和调和平均数F为测评指标,最佳的测试效果分别为98.16%、91.55%、94.57%。结果显示,条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。
[期刊] 图书馆杂志  [作者] 余馨玲  常娥  
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DA-BERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
[期刊] 中国特殊教育  [作者] 钟经华  李健  高旭  阎嘉  
汉语盲文语料库是进行汉语盲文研究和汉语盲文信息化的重要基础资源。通过盲文语料库能够掌握现行盲文的实际使用情况,能够为研发符合盲文分词连写和标调特点的信息化工具奠定基础。语料库方法能够突破盲文研究中诱导法和内省法的局限,占领盲文本体研究的国际制高点。盲文语料库对促进盲人语言文字权益平等、改进盲文教学、改善盲文生态有重要的理论意义和实践意义。
[期刊] 图书馆理论与实践  [作者] 王阳  
《古汉语常用字字典》作为一部普及型较强的语文辞书,迄今已历五次修订,虽然在修订的过程中纠正了不少失误之处,但是仍有一些不足需要订正。今以第五版为考察对象,对其在释义、注释、例证、标点、用字等方面的问题加以辨正。
[期刊] 长江大学学报(社科版)  [作者] 李华平  
古汉语中有一类同义词本义不同而引申义相同或相近,如"愚-昧""浅-陋""回-复"等。这类同义词是在隐喻思维基础上构成的,可称为隐喻同义词。其有单向和双向两种类型,产生必须同时满足两个条件:第一,两词表现的概念必须具有相同的意象图式,体现在词义上就是具有相同的元义素;第二,必须有触发隐喻投射的动因,可以是语言内部的,如意义的相通相近、语音相同相近,也可以是语言外部的,如因语义空白而引起的词义引申、特殊的语用目的等。
[期刊] 情报学报  [作者] 张民  李生  赵铁军  
本文提出并实现了一种大规模汉语语料库中字、词级任意n的n-gram统计算法,本算法可以一次性统计出所有不大于任意n(本文n取为256)的字、词级n-gram,可将传统n-gram统计时的指数空间开销变为线性的,且与所统计的元数无关。基于这种n-gram的统计,本文还进行了汉语信息熵的计算及字、词级知识获取的研究。本算法及本文的研究结果已应用于我们研制的机译系统中
[期刊] 数据分析与知识发现  [作者] 张琳  秦策  叶文豪  
【目的】法言法语实体的自动识别是实现裁判文书文本挖掘的重要的基础性工作。【方法】采用爬虫方法获取数据,人工方式进行语料标注,利用NLPIR加载法律领域词典对语料进行分词,结合法言法语的内部和外部特征构建基于条件随机场的特征模板,自动识别语料中的法言法语。【结果】融入法言法语内部和外部特征的条件随机场模型,自动识别法言法语的实验效果良好,模型的调和平均值达到90%以上。【局限】法言法语实体自动识别模型在领域的扩展上有一定的局限性。【结论】基于条件随机场对法言法语实体实现自动抽取是可行的。
[期刊] 图书情报工作  [作者] 沈思  苏新宁  谢靖  王东波  
基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
[期刊] 山西财经大学学报  [作者] 郭圣林  
古汉语句中"也"是主位标记的说法不够准确。文章认为,主位有篇章主位、人际主位和话题主位,"也"是话题主位标记,不是其他主位的标记。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除