标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(4489)
2023(6541)
2022(5596)
2021(5357)
2020(4540)
2019(10465)
2018(10285)
2017(20221)
2016(10462)
2015(11665)
2014(11154)
2013(10702)
2012(9379)
2011(8034)
2010(7410)
2009(6339)
2008(5584)
2007(4158)
2006(2994)
2005(2141)
作者
(25268)
(21280)
(21115)
(20142)
(13443)
(10140)
(9664)
(8420)
(8281)
(7313)
(7225)
(6985)
(6660)
(6409)
(6398)
(6299)
(6252)
(6138)
(6136)
(5949)
(4984)
(4936)
(4918)
(4893)
(4815)
(4797)
(4435)
(4352)
(4245)
(4216)
学科
(41955)
经济(41920)
管理(30126)
(28888)
方法(24662)
(24215)
企业(24215)
数学(22828)
数学方法(22466)
(11144)
(10066)
中国(9171)
业经(8195)
(7612)
财务(7579)
财务管理(7563)
(7324)
贸易(7323)
企业财务(7213)
(7048)
地方(7046)
技术(6839)
农业(6745)
环境(6182)
(5960)
(5805)
理论(5693)
(5569)
(5412)
(4776)
机构
大学(133465)
学院(133083)
管理(58669)
(56773)
经济(55919)
理学(52672)
理学院(52209)
管理学(51267)
管理学院(51009)
研究(36493)
中国(26793)
(25067)
(24132)
科学(21216)
财经(20722)
业大(19611)
(19222)
中心(18952)
经济学(18184)
(17604)
(16832)
经济学院(16685)
财经大学(15896)
经济管理(15852)
(15714)
师范(15546)
商学(15471)
商学院(15335)
(15066)
北京(14339)
基金
项目(104089)
科学(84473)
基金(79248)
研究(75566)
(68261)
国家(67762)
科学基金(60775)
社会(50499)
社会科(48121)
社会科学(48109)
基金项目(42554)
自然(40036)
(39907)
自然科(39207)
自然科学(39199)
自然科学基金(38479)
教育(35654)
(33523)
资助(31710)
编号(29554)
(23873)
重点(22947)
(22655)
国家社会(21781)
(21630)
成果(21364)
教育部(21301)
创新(21188)
人文(21040)
科研(20810)
期刊
(49118)
经济(49118)
研究(31959)
管理(20639)
(19285)
学报(18282)
中国(18180)
科学(17380)
大学(15181)
学学(14474)
(14258)
技术(13537)
教育(10284)
农业(10052)
财经(9856)
(8535)
金融(8535)
(8432)
业经(8392)
经济研究(8078)
问题(6981)
统计(6656)
理论(6553)
技术经济(6539)
财会(6411)
(6142)
(6106)
实践(6073)
(6073)
科技(5940)
共检索到168704条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报学报  [作者] 郭祥昊  钟义信  杨丽  
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
[期刊] 情报学报  [作者] 李家福  张亚非  
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
[期刊] 情报学报  [作者] 张民  李生  王海峰  赵铁军  王铁志  
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
[期刊] 数据分析与知识发现  [作者] 王晓玉  李斌  
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报  [作者] 尹锋  
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
[期刊] 民族教育研究  [作者] 冯凌宇  
留学生普遍反映汉语难学主要难在汉语字词难记,笔者认为,从事国际汉语词汇教学的老师应该有责任帮助留学生克服汉语词汇形义匹配记忆的障碍。汉语词汇教学,首先是词汇外形(即汉字形体)和意义的教学,其次才是词汇用法教学。由于汉语词汇形义具有高度关联特点,所以饱含中国文化的构词理据,就可成为帮助留学生记忆汉语词汇形义的助力器。本文作者通过对"扌"旁和"忄"旁两组目标词语进行"字形—词义"的教学行动研究,初步证明从文化理据角度切入的词语形义关联匹配教学,无论是在促进留学生词汇形义的匹配记忆上,还是在激发学生词汇学习的兴
[期刊] 中国图书馆学报  [作者] 熊回香  
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 图书情报工作  [作者] 熊回香  夏立新  
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 情报理论与实践  [作者] 杨建林  张国梁  
An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case ban...
[期刊] 情报学报  [作者] 唐雪梅  苏祺  王军  杨浩  
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary (OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究更关注的是如何提高分词效果,忽视了分词任务中的一大挑战,即OOV问题。因此,本文提出了一种基于图卷积神经网络的古汉语分词框架,通过结合预训练语言模型和图卷积神经网络,将外部知识融合到神经网络模型中来提高分词性能并缓解OOV问题。在《左传》《战国策》和《儒林外史》 3个古汉语分词数据集上的研究结果显示,本文模型提高了3个数据集的分词表现。进一步的研究分析证明,本文模型能够有效地融合词典和N-gram信息;特别是N-gram有助于缓解OOV问题。
[期刊] 中国特殊教育  [作者] 琚四化  钟经华  徐琴  施海燕  李圆梦  刘奕彤  梁惠燕  王炜杰  
分词连写能力影响盲文书写能力,事关盲生的语言文字运用能力。采用听写的方式,使用汉语盲文语料库中的语段对129名盲生的汉语盲文分词连写能力进行测验,结果发现:盲生盲文分词连写错误较多,分词连写能力偏低;小学高年级段、初中段和高中段三个学段的盲生之间没有显著差异;不同性别盲生之间没有显著差异。盲生分词连写错误集中于大类上的词组分词连写错误;集中在小类上的“结构助词”“副词+动词”等8小类错误。未来,应重视盲生的分词连写能力,加强盲校分词连写教学,完善分词连写规则。
[期刊] 中国特殊教育  [作者] 琚四化  鲁明辉  张居晓  刘春玲  徐琴  
分词连写规则是当前我国大陆地区书写汉语盲文时必须遵守的书写规范。针对分词连写规则,研究着重探讨了分词连写对汉语盲文阅读的促进作用,以及分词连写规则存在的条目过多、内容过度依赖汉语语法和部分规则内容不够明确三个方面的问题,并提出了调整、简化和取消三类改进措施。未来可展开针对分词连写功能的比较研究、针对分词连写规则问题的调查研究和针对具体改进措施的实验研究。
[期刊] 情报理论与实践  [作者] 王玮  刘丹  
详细分析了目前汉语文献自动分词存在的问题,即词法的复杂性、切分的模糊性和语法分析问题。然后提出了汉语文献自动分词的发展趋向。
[期刊] 中国图书馆学报  [作者] 朱毅华  侯汉清  沙印亭  
以词素为单位进行相似度计算 ,在许多方面解决了字面相似度算法中不合理的问题 ,但汉语分词、词义分解、词素分类体系及其编码问题又亟待解决。基于语义的词素相似度算法优于基于单汉字的字面相似度算法 ,是今后的研究重点。表 4。参考文献 9。
[期刊] 情报理论与实践  [作者] 王知津  
<正>由南京农业大学黄水清和王东波教授编写、南京大学出版社出版的《大规模现代汉语分词语料库构建及应用》一书正式问世了!该书以“新时代人民日报分词语料库”(New Era People’s Daily Segmented Corpus,以下简称NEPD)为研究对象。NEPD收录了2015年1—6月、2016年1月、2017年1月、2018年1月、2022年1月共10个月《人民日报》上刊发的全部文章,构建了迄今规模最大的精加工现代汉语通用分词语料库,超过3000万字符量,向全世界学术界开放供免费获取。在此之前的现代汉语通用语料库中,规模超百万字且为人工标注精加工的,只有1998月1月的北京大学人民日报语料库。NEPD既接续了北京大学1998年1月人民日报语料库,又弥补了北京大学人民日报语料库20多年没有更新以及在词汇的时效性、完备性和覆盖度方面存在的不足,以其高标准的原始语料、高质量的人工标注以及开放共享的理念,支持并促进了图书情报学、语言学、计算机科学等相关学科领域的研究与发展,赢得了学术界的广泛认同和赞誉。在NEPD的数据选取标准、加工流程、应用示范等方面,《大规模现代汉语分词语料库构建及应用》一书给出了至今最为详尽和全面的阐述。该书不仅介绍了NEPD构建的背景、缘由、目的、原则、过程、规范和应用,而且还展望了精标注语料库在当前以深度学习为标志的人工智能发展热潮中的关键作用和重要价值。
关键词:
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除