标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(2407)
2023(3798)
2022(3294)
2021(3163)
2020(2702)
2019(6299)
2018(6379)
2017(10595)
2016(5543)
2015(6155)
2014(5878)
2013(5662)
2012(5290)
2011(4844)
2010(5161)
2009(4377)
2008(4553)
2007(4343)
2006(3848)
2005(3576)
作者
(15801)
(12922)
(12906)
(12250)
(8295)
(6125)
(5996)
(4955)
(4900)
(4819)
(4434)
(4411)
(4126)
(4125)
(4056)
(4031)
(3840)
(3836)
(3797)
(3779)
(3346)
(3320)
(3095)
(3030)
(2988)
(2972)
(2953)
(2903)
(2724)
(2585)
学科
(19333)
经济(19322)
管理(14144)
(10581)
(9566)
企业(9566)
方法(7802)
数学(6344)
数学方法(6091)
中国(5760)
(5440)
理论(5172)
(4777)
(4245)
教学(4137)
业经(3987)
(3934)
(3668)
银行(3658)
关系(3567)
教育(3516)
(3454)
(3382)
贸易(3379)
地方(3369)
(3326)
(3266)
(2968)
金融(2966)
(2772)
机构
学院(71844)
大学(71815)
研究(25461)
(24497)
管理(24146)
经济(23726)
中国(21342)
理学(19753)
理学院(19481)
管理学(18770)
管理学院(18625)
(16633)
科学(16408)
(13015)
(12942)
中心(12625)
(11953)
研究所(11745)
(11102)
北京(10811)
技术(10509)
(10468)
师范(10330)
业大(10085)
(10046)
(9603)
财经(9403)
农业(8656)
(8434)
师范大学(8218)
基金
项目(45573)
研究(34474)
科学(34067)
基金(30295)
(26714)
国家(26460)
科学基金(21871)
社会(19597)
社会科(18508)
社会科学(18501)
(18301)
教育(16863)
(15452)
编号(15446)
基金项目(14865)
成果(13962)
自然(13535)
资助(13269)
自然科(13245)
自然科学(13239)
自然科学基金(12951)
课题(11045)
重点(10564)
项目编号(10035)
(9716)
(9291)
(9178)
(9141)
(8946)
大学(8916)
期刊
(28884)
经济(28884)
研究(21174)
中国(19770)
教育(13836)
学报(12956)
(11307)
管理(10308)
科学(9978)
(9970)
大学(9786)
学学(8754)
技术(8721)
(8291)
金融(8291)
图书(7276)
农业(6636)
经济研究(5232)
书馆(5179)
图书馆(5179)
职业(4511)
统计(4457)
情报(4414)
财经(4370)
(4164)
业经(4140)
(4040)
(3868)
(3848)
(3699)
共检索到120838条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 黄水清  王东波  
[目的/意义] 构建与新时代相适应的人民日报分词语料库,为中文信息处理提供最新的精标注语料,也为从历时的角度分析现代汉语提供新的语言资源。[方法/过程] 在分析已有汉语分词语料库的基础上,描述所构建新时代人民日报语料库的数据源、标注规范和流程,通过构建分词自动标注模型测评语料库的性能,并与已有语料库进行对比。[结果/结论] 新时代人民日报语料库遵循现代汉语语料库基本加工规范,规模大,时间跨度长。选取其中的2018年1月部分,基于条件随机场构建分词模型,与1998年1月人民日报语料进行性能测评与对比,所得到的各项具体测评指标表明,新时代人民日报语料整体性能突出,1998年语料无法替代,当前构建该语料库非常必要。
[期刊] 图书情报工作  [作者] 黄水清  王东波  
[目的/意义]基于新时代人民日报分词语料库从不同维度统计分析句子长度和词汇分布,有助于了解当代汉语文本的语言学特征,进而开展自然语言处理和文本挖掘研究。[方法/过程]在2018年1月人民日报分词语料的基础上,结合1998年1月人民日报分词语料,确定统计中所使用的6种句子类别,统计和分析字与词单位上的句子长度分布,并基于齐普夫定律揭示词汇静态分布情况。[结果/结论]从字词维度上的句子长度分布情况和词汇的齐普夫分布状态上看,随着时间的推移,在1998和2018两个语料上,句子的长度和词汇的分布均发生变化,但这种变化又是延续的、有关联的。
[期刊] 情报理论与实践  [作者] 王知津  
<正>由南京农业大学黄水清和王东波教授编写、南京大学出版社出版的《大规模现代汉语分词语料库构建及应用》一书正式问世了!该书以“新时代人民日报分词语料库”(New Era People’s Daily Segmented Corpus,以下简称NEPD)为研究对象。NEPD收录了2015年1—6月、2016年1月、2017年1月、2018年1月、2022年1月共10个月《人民日报》上刊发的全部文章,构建了迄今规模最大的精加工现代汉语通用分词语料库,超过3000万字符量,向全世界学术界开放供免费获取。在此之前的现代汉语通用语料库中,规模超百万字且为人工标注精加工的,只有1998月1月的北京大学人民日报语料库。NEPD既接续了北京大学1998年1月人民日报语料库,又弥补了北京大学人民日报语料库20多年没有更新以及在词汇的时效性、完备性和覆盖度方面存在的不足,以其高标准的原始语料、高质量的人工标注以及开放共享的理念,支持并促进了图书情报学、语言学、计算机科学等相关学科领域的研究与发展,赢得了学术界的广泛认同和赞誉。在NEPD的数据选取标准、加工流程、应用示范等方面,《大规模现代汉语分词语料库构建及应用》一书给出了至今最为详尽和全面的阐述。该书不仅介绍了NEPD构建的背景、缘由、目的、原则、过程、规范和应用,而且还展望了精标注语料库在当前以深度学习为标志的人工智能发展热潮中的关键作用和重要价值。
关键词:
[期刊] 图书情报工作  [作者] 熊文新  
对Web和语料库以及多语语料库的关系进行辨析,针对Web上丰富的各类电子文本,从语言工程角度出发,提出"分步骤、按领域"建设大规模双语平行语料库的思路,即选定领域专一、语言可靠、格式规范的文本,逐次建设特定领域的语料库,最后汇总成高质量、大规模、全领域的"高大全"式双语平行语料库。同时,围绕一个实例介绍如何利用Web资源建设特定领域双语平行语料库。
[期刊] 宏观经济管理  [作者] 鲍玲玲  
在新形势下,语料语言学、专门用途英语理论飞速发展,外语教学研究也迎来了全新的视角,为各类语料库的研制以及应用提供了重要保障,新闻英语语料库便是其中之一。因此,本文作者客观分析了新闻英语与语料库,探讨了新闻英语语料库的研制以及应用。
[期刊] 全球教育展望  [作者] 姚剑鹏  
语料库是由大量收集的书面语或口语构成,并通过计算机储存和处理,用于语言学研究的文本库。它为语言教学和研究提供了自然出现的真实语料和科学的研究方法,在这些领域正发挥越来越大的作用。本文讨论了国外将语料库应用于语言教学领域的研究成果和具体做法以及它对于语言教学所起的独到作用,并介绍了我国语料库发展的现状,探讨了在我国利用语料库进行语言教学的可行性。
[期刊] 中国特殊教育  [作者] 李恒  吴铃  
手语语料库作为手语语言学理论研究的一项具体实践以及研究成果的集中体现,目前已经成为一门专门的学科领域。本文主要结合手语语料库两大基本特征——样本的代表性和语料的机读形式化,介绍其建设的一般方法:1)从语料的搜集来看,词汇、对象和地区的选取都应当采取科学的社会语言学的调查方法,以保证样本的代表性;2)从语料的处理来看,应该突破纯文本转写的劣势,利用多媒体转写软件对语料进行分割、转写和标注。文章另外指出了手语语料库建设对于语言研究的积极意义。
[期刊] 情报理论与实践  [作者] 贾君枝  李晨光  韩笑  
法律框架网络语料库系统构建的目的是实现对法律语料的处理,从而为法律语言学及法律查询者提供强而有力的检索工具。本文提出了法律框架网络语料库系统的设计原则及语料选取原则,并讨论了系统设计模型、数据库设计以及实现功能,尤其是语料统计功能、知识发现功能使该系统具有比一般语料库系统更为复杂的功能。
[期刊] 情报学报  [作者] 徐琳宏  丁堃  陈娜  李冰  
基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。
[期刊] 情报理论与实践  [作者] 马海群  张涛  
[目的/意义]在重视实证研究的大数据环境下,语料库作为一种定量研究方法,在语言研究、统计分析及机器学习等领域发挥了重要的作用。近年来,随着大量文献的文本化,语料库的构建不但会使文献信息的研究科学化、多样化,还会使文献信息服务精准化、智慧化。[方法/过程]文章在现有语料库研究的基础上,结合图书馆、情报与文献学的相关理论,把文献信息作为研究对象,为社会提供智慧服务为目标,提出了一种在文献信息视阈下面向智慧服务语料库构建的思路。[结果/结论]阐述文献信息视阈下语料库建设的过程,并描述了在智慧推送、智能分类、远距离阅读等领域推动智慧服务的应用场景。
[期刊] 情报学报  [作者] 刘小虎  吴葳  李生  赵铁军  蔡萌  鞠英杰  
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。实践证明该方法是行之有效的
[期刊] 常州工学院学报(社科版)  [作者] 杨娟  
平行语料库为翻译对应研究提供了切实可行的平台。对"坚持"及其英译对应项的相互对应研究表明英汉高频词汇短语在互译时都可能有很多对应项,这是词义泛化的结果;英汉两种语言因为分属不同的语言体系,难以实现较高的互译对应率;英语译文和英语原文在用词上是有差别的。
[期刊] 中国特殊教育  [作者] 赵晓驰  任媛媛  丁勇  
国家手语词汇语料库为我国大陆地区第一个手语词汇语料库,采集了九个地区共六万多个手语词视频,语料具有较强的代表性。语料库网站提供了手形检索、汉字检索、拼音检索、笔画检索、英文检索共五种检索方式,具有方便友好的交互界面和远程实时访问的查询功能。但该语料库还存在一些不足,今后需要扩大语料采集的地域、聋人和词汇范围,完善采集方法和标注信息,提供自然手语句例和用法说明,加强拍摄效果和网站功能,并增强聋人的参与,以全面提升语料库的水平和质量。利用该语料库可以在很大程度上推动中国通用手语词汇标准的研究和中国手语语言学的
[期刊] 全球教育展望  [作者] 徐启龙  
丰富的网络语料库资源使外语教学变得快捷和方便,在教学中引入网络语料库是当今外语教育发展的新趋势,在技术层面上将极大丰富外语教学的手段。本文以语料库语言学理论的视角,着重探讨网络语料库在英语词汇教学中的应用模式,旨在以新的教学模式提高英语词汇教学效益,达到英语新课程标准要求的相关教学目标,并对基于网络语料库的词汇教学发展趋势作一展望。
[期刊] 图书情报工作  [作者] 黄水清  王东波  何琳  
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除