- 年份
- 2024(1500)
- 2023(2321)
- 2022(1971)
- 2021(1669)
- 2020(1444)
- 2019(3224)
- 2018(3285)
- 2017(5920)
- 2016(3144)
- 2015(3570)
- 2014(3746)
- 2013(3847)
- 2012(3607)
- 2011(3355)
- 2010(3372)
- 2009(2964)
- 2008(2974)
- 2007(2719)
- 2006(2354)
- 2005(2246)
- 学科
- 济(14325)
- 经济(14316)
- 业(14097)
- 管理(12788)
- 企(12488)
- 企业(12488)
- 技术(10440)
- 方法(6341)
- 技术管理(5771)
- 数学(5075)
- 数学方法(5002)
- 学(3704)
- 中国(3623)
- 理论(3269)
- 农(3230)
- 业经(3134)
- 财(2627)
- 农业(2566)
- 新技术(2554)
- 高新(2548)
- 高新技术(2548)
- 和(2319)
- 贸(2255)
- 贸易(2255)
- 环境(2250)
- 教学(2218)
- 易(2200)
- 地方(2073)
- 划(2062)
- 融(1941)
- 机构
- 大学(51779)
- 学院(50123)
- 济(20809)
- 管理(20656)
- 经济(20352)
- 研究(18179)
- 理学(17886)
- 理学院(17682)
- 管理学(17388)
- 管理学院(17290)
- 中国(12821)
- 科学(11352)
- 京(11351)
- 所(9452)
- 研究所(8596)
- 中心(8096)
- 农(8006)
- 财(7854)
- 江(7666)
- 业大(7630)
- 北京(7337)
- 范(7282)
- 师范(7202)
- 技术(7059)
- 院(6378)
- 财经(6338)
- 农业(6286)
- 经济学(6021)
- 师范大学(6020)
- 经(5856)
- 基金
- 项目(33752)
- 科学(26635)
- 研究(24524)
- 基金(24260)
- 家(21385)
- 国家(21230)
- 科学基金(18166)
- 社会(15368)
- 社会科(14688)
- 社会科学(14681)
- 省(13012)
- 基金项目(13010)
- 自然(11783)
- 自然科(11524)
- 自然科学(11523)
- 教育(11448)
- 自然科学基金(11321)
- 划(11106)
- 编号(9725)
- 资助(9461)
- 创(8024)
- 部(7737)
- 重点(7730)
- 成果(7710)
- 创新(7555)
- 发(7268)
- 教育部(6564)
- 国家社会(6467)
- 课题(6445)
- 人文(6364)
共检索到77214条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 中国图书馆学报
[作者]
熊回香
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 中国特殊教育
[作者]
琚四化 钟经华 徐琴 施海燕 李圆梦 刘奕彤 梁惠燕 王炜杰
分词连写能力影响盲文书写能力,事关盲生的语言文字运用能力。采用听写的方式,使用汉语盲文语料库中的语段对129名盲生的汉语盲文分词连写能力进行测验,结果发现:盲生盲文分词连写错误较多,分词连写能力偏低;小学高年级段、初中段和高中段三个学段的盲生之间没有显著差异;不同性别盲生之间没有显著差异。盲生分词连写错误集中于大类上的词组分词连写错误;集中在小类上的“结构助词”“副词+动词”等8小类错误。未来,应重视盲生的分词连写能力,加强盲校分词连写教学,完善分词连写规则。
关键词:
分词连写 盲文 盲生 汉语盲文语料库
[期刊] 情报学报
[作者]
尹锋
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:
神经网络,汉语分词
[期刊] 中国特殊教育
[作者]
琚四化 鲁明辉 张居晓 刘春玲 徐琴
分词连写规则是当前我国大陆地区书写汉语盲文时必须遵守的书写规范。针对分词连写规则,研究着重探讨了分词连写对汉语盲文阅读的促进作用,以及分词连写规则存在的条目过多、内容过度依赖汉语语法和部分规则内容不够明确三个方面的问题,并提出了调整、简化和取消三类改进措施。未来可展开针对分词连写功能的比较研究、针对分词连写规则问题的调查研究和针对具体改进措施的实验研究。
关键词:
盲文 分词连写 语法
[期刊] 情报学报
[作者]
张民 李生 王海峰 赵铁军 王铁志
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
关键词:
汉语自动分词,歧义,平价函数,词规则
[期刊] 中国特殊教育
[作者]
任媛媛
聋人学生汉语书面语水平一直严重落后于同龄健全学生,这种落后也体现在书面语语法上。聋人学生汉语书面语语法知识的习得及其习得顺序,还有相关的认知心理研究均未成体系。近年来的一些聋人学生书面语语法的偏误分析,手语和汉语、古代汉语等的语法比较研究,对聋人学生汉语书面语教学均有所帮助。
关键词:
聋人学生 书面语 语法
[期刊] 图书情报工作
[作者]
奉国和 郑伟
认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
[期刊] 情报理论与实践
[作者]
王知津
<正>由南京农业大学黄水清和王东波教授编写、南京大学出版社出版的《大规模现代汉语分词语料库构建及应用》一书正式问世了!该书以“新时代人民日报分词语料库”(New Era People’s Daily Segmented Corpus,以下简称NEPD)为研究对象。NEPD收录了2015年1—6月、2016年1月、2017年1月、2018年1月、2022年1月共10个月《人民日报》上刊发的全部文章,构建了迄今规模最大的精加工现代汉语通用分词语料库,超过3000万字符量,向全世界学术界开放供免费获取。在此之前的现代汉语通用语料库中,规模超百万字且为人工标注精加工的,只有1998月1月的北京大学人民日报语料库。NEPD既接续了北京大学1998年1月人民日报语料库,又弥补了北京大学人民日报语料库20多年没有更新以及在词汇的时效性、完备性和覆盖度方面存在的不足,以其高标准的原始语料、高质量的人工标注以及开放共享的理念,支持并促进了图书情报学、语言学、计算机科学等相关学科领域的研究与发展,赢得了学术界的广泛认同和赞誉。在NEPD的数据选取标准、加工流程、应用示范等方面,《大规模现代汉语分词语料库构建及应用》一书给出了至今最为详尽和全面的阐述。该书不仅介绍了NEPD构建的背景、缘由、目的、原则、过程、规范和应用,而且还展望了精标注语料库在当前以深度学习为标志的人工智能发展热潮中的关键作用和重要价值。
[期刊] 情报学报
[作者]
唐雪梅 苏祺 王军 杨浩
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary (OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究更关注的是如何提高分词效果,忽视了分词任务中的一大挑战,即OOV问题。因此,本文提出了一种基于图卷积神经网络的古汉语分词框架,通过结合预训练语言模型和图卷积神经网络,将外部知识融合到神经网络模型中来提高分词性能并缓解OOV问题。在《左传》《战国策》和《儒林外史》 3个古汉语分词数据集上的研究结果显示,本文模型提高了3个数据集的分词表现。进一步的研究分析证明,本文模型能够有效地融合词典和N-gram信息;特别是N-gram有助于缓解OOV问题。
[期刊] 中国高等教育
[作者]
刘国强 洪历建
全球语境下的大学汉语教学国际研讨会于2010年10月29日在澳大利亚墨尔本市迪肯大学召开。来自国内和墨尔本各高校汉语教学领域的专家、学者20余人共济一堂,重点就全球语境下高校对外汉语教学及汉语作为第二语言教学在海外教学中的一些重大议题展开了讨论和交流。此次研讨会由澳大利亚高校汉语教师学会主办,得到国家汉办资助及中国驻墨尔本总领事馆教育组支持,教育组负责人郭晓娟及王云彤领事与会。
[期刊] 民族教育研究
[作者]
哈琴
蒙古族汉语课程从无到有、由初级到高级,经历了一个不断发展完善的过程;汉语课程与教学研究也随之兴起,呈现出勃勃生机;对汉语教师的研究初见端倪。对蒙古族学校汉语课程与教学研究总体态势进行尽可能详细的梳理,总结其中的经验与不足,可为今后的有关研究提供参考资料。
关键词:
蒙古族学校 汉语课程 教学研究
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除