标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(1532)
2023(2324)
2022(2103)
2021(2188)
2020(1925)
2019(4832)
2018(5017)
2017(10225)
2016(5433)
2015(6330)
2014(6362)
2013(5992)
2012(5138)
2011(4639)
2010(4932)
2009(4448)
2008(4173)
2007(3635)
2006(3107)
2005(2764)
作者
(14853)
(12255)
(12175)
(11682)
(7855)
(5772)
(5546)
(4775)
(4636)
(4440)
(4280)
(4075)
(3925)
(3845)
(3788)
(3673)
(3661)
(3553)
(3512)
(3455)
(3112)
(2988)
(2980)
(2872)
(2771)
(2754)
(2745)
(2652)
(2468)
(2372)
学科
(23878)
经济(23863)
方法(15356)
管理(14882)
数学(14482)
数学方法(14022)
(13486)
(11722)
企业(11722)
(4947)
理论(4831)
中国(4632)
(4221)
业经(4083)
(4017)
(3772)
贸易(3769)
(3673)
教学(3536)
(3515)
地方(3132)
(3065)
农业(3036)
技术(3035)
(2889)
银行(2882)
(2729)
(2715)
环境(2703)
供销(2664)
机构
学院(73541)
大学(72469)
管理(31275)
(28331)
经济(27681)
理学(27408)
理学院(27172)
管理学(26314)
管理学院(26205)
研究(20731)
中国(16454)
(15248)
科学(13750)
(11703)
业大(10939)
(10519)
中心(10249)
(10185)
(10029)
北京(9546)
财经(9471)
研究所(9367)
技术(8896)
(8825)
师范(8740)
(8668)
(8579)
经济学(8178)
经济管理(8033)
农业(7853)
基金
项目(51039)
科学(40323)
基金(36844)
研究(35930)
(32016)
国家(31812)
科学基金(28078)
社会(21737)
社会科(20724)
社会科学(20719)
(20540)
自然(19610)
自然科(19224)
自然科学(19222)
基金项目(18852)
自然科学基金(18845)
教育(17891)
(17188)
资助(16893)
编号(15253)
成果(11548)
重点(11488)
(10829)
(10651)
课题(10318)
(10131)
科研(9940)
创新(9938)
计划(9566)
大学(9526)
期刊
(27366)
经济(27366)
研究(18093)
中国(13143)
管理(11736)
学报(9804)
科学(9772)
技术(9285)
(8828)
教育(8677)
(8637)
大学(7665)
学学(7157)
统计(6677)
农业(5997)
(5966)
决策(5536)
(5361)
金融(5361)
业经(4962)
经济研究(4925)
图书(4440)
技术经济(4412)
财经(4311)
商业(3702)
(3674)
(3644)
科技(3419)
资源(3414)
理论(3396)
共检索到101611条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报理论与实践  [作者] 王知津  
<正>由南京农业大学黄水清和王东波教授编写、南京大学出版社出版的《大规模现代汉语分词语料库构建及应用》一书正式问世了!该书以“新时代人民日报分词语料库”(New Era People’s Daily Segmented Corpus,以下简称NEPD)为研究对象。NEPD收录了2015年1—6月、2016年1月、2017年1月、2018年1月、2022年1月共10个月《人民日报》上刊发的全部文章,构建了迄今规模最大的精加工现代汉语通用分词语料库,超过3000万字符量,向全世界学术界开放供免费获取。在此之前的现代汉语通用语料库中,规模超百万字且为人工标注精加工的,只有1998月1月的北京大学人民日报语料库。NEPD既接续了北京大学1998年1月人民日报语料库,又弥补了北京大学人民日报语料库20多年没有更新以及在词汇的时效性、完备性和覆盖度方面存在的不足,以其高标准的原始语料、高质量的人工标注以及开放共享的理念,支持并促进了图书情报学、语言学、计算机科学等相关学科领域的研究与发展,赢得了学术界的广泛认同和赞誉。在NEPD的数据选取标准、加工流程、应用示范等方面,《大规模现代汉语分词语料库构建及应用》一书给出了至今最为详尽和全面的阐述。该书不仅介绍了NEPD构建的背景、缘由、目的、原则、过程、规范和应用,而且还展望了精标注语料库在当前以深度学习为标志的人工智能发展热潮中的关键作用和重要价值。
关键词:
[期刊] 情报学报  [作者] 张民  李生  赵铁军  
本文提出并实现了一种大规模汉语语料库中字、词级任意n的n-gram统计算法,本算法可以一次性统计出所有不大于任意n(本文n取为256)的字、词级n-gram,可将传统n-gram统计时的指数空间开销变为线性的,且与所统计的元数无关。基于这种n-gram的统计,本文还进行了汉语信息熵的计算及字、词级知识获取的研究。本算法及本文的研究结果已应用于我们研制的机译系统中
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 图书情报工作  [作者] 黄水清  王东波  
[目的/意义] 构建与新时代相适应的人民日报分词语料库,为中文信息处理提供最新的精标注语料,也为从历时的角度分析现代汉语提供新的语言资源。[方法/过程] 在分析已有汉语分词语料库的基础上,描述所构建新时代人民日报语料库的数据源、标注规范和流程,通过构建分词自动标注模型测评语料库的性能,并与已有语料库进行对比。[结果/结论] 新时代人民日报语料库遵循现代汉语语料库基本加工规范,规模大,时间跨度长。选取其中的2018年1月部分,基于条件随机场构建分词模型,与1998年1月人民日报语料进行性能测评与对比,所得到的各项具体测评指标表明,新时代人民日报语料整体性能突出,1998年语料无法替代,当前构建该语料库非常必要。
[期刊] 中国特殊教育  [作者] 吕会华  吴铃  张会文  
目前对聋人汉语书面语的研究尚停留在经验层面。基于聋人汉语书面语语料库的研究,可以解决语料少,作者信息不清以及和其他汉语作为第二语言习得者对比困难等问题。随着对聋人汉语书面语研究的深入,聋人的汉语水平也将得到提高。语料库建设是一项长期、繁重的工作,本研究在考察了几个汉语学习者语料库的基础上,提出了自己的建库构想。确定了语料属性、语料标注标准等。在理论研究的同时,着手进行聋人汉语书面语语料库的初步建设,取得了一定成绩。
[期刊] 中国特殊教育  [作者] 钟经华  李健  高旭  阎嘉  
汉语盲文语料库是进行汉语盲文研究和汉语盲文信息化的重要基础资源。通过盲文语料库能够掌握现行盲文的实际使用情况,能够为研发符合盲文分词连写和标调特点的信息化工具奠定基础。语料库方法能够突破盲文研究中诱导法和内省法的局限,占领盲文本体研究的国际制高点。盲文语料库对促进盲人语言文字权益平等、改进盲文教学、改善盲文生态有重要的理论意义和实践意义。
[期刊] 图书情报工作  [作者] 黄水清  王东波  
[目的/意义]基于新时代人民日报分词语料库从不同维度统计分析句子长度和词汇分布,有助于了解当代汉语文本的语言学特征,进而开展自然语言处理和文本挖掘研究。[方法/过程]在2018年1月人民日报分词语料的基础上,结合1998年1月人民日报分词语料,确定统计中所使用的6种句子类别,统计和分析字与词单位上的句子长度分布,并基于齐普夫定律揭示词汇静态分布情况。[结果/结论]从字词维度上的句子长度分布情况和词汇的齐普夫分布状态上看,随着时间的推移,在1998和2018两个语料上,句子的长度和词汇的分布均发生变化,但这种变化又是延续的、有关联的。
[期刊] 图书情报工作  [作者] 熊文新  
对Web和语料库以及多语语料库的关系进行辨析,针对Web上丰富的各类电子文本,从语言工程角度出发,提出"分步骤、按领域"建设大规模双语平行语料库的思路,即选定领域专一、语言可靠、格式规范的文本,逐次建设特定领域的语料库,最后汇总成高质量、大规模、全领域的"高大全"式双语平行语料库。同时,围绕一个实例介绍如何利用Web资源建设特定领域双语平行语料库。
[期刊] 全球教育展望  [作者] 姚剑鹏  
语料库是由大量收集的书面语或口语构成,并通过计算机储存和处理,用于语言学研究的文本库。它为语言教学和研究提供了自然出现的真实语料和科学的研究方法,在这些领域正发挥越来越大的作用。本文讨论了国外将语料库应用于语言教学领域的研究成果和具体做法以及它对于语言教学所起的独到作用,并介绍了我国语料库发展的现状,探讨了在我国利用语料库进行语言教学的可行性。
[期刊] 中国特殊教育  [作者] 李恒  吴铃  
手语语料库作为手语语言学理论研究的一项具体实践以及研究成果的集中体现,目前已经成为一门专门的学科领域。本文主要结合手语语料库两大基本特征——样本的代表性和语料的机读形式化,介绍其建设的一般方法:1)从语料的搜集来看,词汇、对象和地区的选取都应当采取科学的社会语言学的调查方法,以保证样本的代表性;2)从语料的处理来看,应该突破纯文本转写的劣势,利用多媒体转写软件对语料进行分割、转写和标注。文章另外指出了手语语料库建设对于语言研究的积极意义。
[期刊] 数据分析与知识发现  [作者] 张越  王东波  朱丹浩  
【目的】在食品安全领域中,建立相关数据库对食品安全的监管和控制都会有很大的帮助,自动分词在构建索引、使用索引以及构建语料库中都起到至关重要的作用。将基于条件随机场的字标注统计学习方法,应用在食品安全突发事件语料的自动分词中。【方法】分析语料的词长分布等特点,对该方法自动分词过程中所涉及的特征选择和特征模板进行不同实验,得出不同特征选择和应用不同特征模板对分词结果的影响。【结果】从实验结果可以看出,特征选择时并不是特征越多分词效果越好,会出现特征干扰的情况,在二三字词占46.62%的食品安全突发事件语料中,
[期刊] 全球教育展望  [作者] 徐启龙  
丰富的网络语料库资源使外语教学变得快捷和方便,在教学中引入网络语料库是当今外语教育发展的新趋势,在技术层面上将极大丰富外语教学的手段。本文以语料库语言学理论的视角,着重探讨网络语料库在英语词汇教学中的应用模式,旨在以新的教学模式提高英语词汇教学效益,达到英语新课程标准要求的相关教学目标,并对基于网络语料库的词汇教学发展趋势作一展望。
[期刊] 常州工学院学报(社科版)  [作者] 杨娟  
平行语料库为翻译对应研究提供了切实可行的平台。对"坚持"及其英译对应项的相互对应研究表明英汉高频词汇短语在互译时都可能有很多对应项,这是词义泛化的结果;英汉两种语言因为分属不同的语言体系,难以实现较高的互译对应率;英语译文和英语原文在用词上是有差别的。
[期刊] 沈阳农业大学学报(社会科学版)  [作者] 佟玲  
以天昭宁编著的《擬音語·擬態語辞典》为基础,对《中日对译语料库》中收录的日本文学作品及其汉语译文进行检索,然后参照田守育啓·ローレンス·スコウラップ的统语标准,对检索出的日语原文中的拟态词按统语特征进行分类,同时参照刘月华等的词性分类标准对相应汉语译文的词性进行分类,并将以上的分类结果,经过整理、统计及分析后,总结出文学作品中的日语拟态词汉译后在词性方面体现出的特点。
[期刊] 宏观经济管理  [作者] 鲍玲玲  
在新形势下,语料语言学、专门用途英语理论飞速发展,外语教学研究也迎来了全新的视角,为各类语料库的研制以及应用提供了重要保障,新闻英语语料库便是其中之一。因此,本文作者客观分析了新闻英语与语料库,探讨了新闻英语语料库的研制以及应用。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除