搜索文献-EPS

年份: 2024(5064); 2023(7139); 2022(6155); 2021(5749); 2020(4900); 2019(11253); 2018(10986); 2017(21532); 2016(10962); 2015(12337); 2014(11800); 2013(11352); 2012(9860); 2011(8427); 2010(7890); 2009(6819); 2008(6057); 2007(4694); 2006(3478); 2005(2511)

作者: 王(27519); 张(23084); 李(22875); 刘(21675); 陈(14489); 杨(10997); 晓(10492); 赵(9197); 周(8903); 吴(7874); 华(7844); 文(7618); 伟(7227); 孙(7004); 林(6893); 明(6800); 丽(6784); 志(6772); 黄(6577); 徐(6541); 军(5423); 玉(5400); 朱(5276); 平(5267); 郭(5208); 胡(5138); 建(4820); 红(4818); 艳(4619); 宇(4482)

学科: 济(45199); 经济(45157); 管理(35347); 业(34280); 企(29440); 企业(29440); 方法(27250); 数学(24748); 数学方法(24342); 财(11680); 农(10700); 中国(9342); 业经(9163); 务(8265); 财务(8228); 财务管理(8208); 贸(7876); 贸易(7874); 企业财务(7785); 易(7715); 供销(7501); 销(7501); 技术(7316); 学(6987); 农业(6877); 环境(6627); 和(6589); 地方(6520); 理论(6470); 划(5889)

机构: 学院(144362); 大学(143671); 管理(64630); 济(61361); 经济(60422); 理学(57821); 理学院(57334); 管理学(56307); 管理学院(56033); 研究(38699); 中国(29023); 京(27666); 财(25649); 科学(23018); 财经(22135); 业大(21301); 经(20409); 中心(20034); 经济学(19371); 农(18662); 江(18237); 经济学院(17757); 经济管理(17442); 财经大学(16953); 商学(16940); 商学院(16789); 范(16259); 所(16220); 师范(16090); 北京(15886)

基金: 项目(111899); 科学(90985); 基金(85173); 研究(80762); 家(73435); 国家(72899); 科学基金(65689); 社会(53906); 社会科(51454); 社会科学(51442); 基金项目(45136); 自然(43576); 省(43017); 自然科(42697); 自然科学(42688); 自然科学基金(41904); 教育(37686); 划(36063); 资助(34672); 编号(31590); 部(25352); 重点(24552); 创(24216); 国家社会(23269); 发(23159); 创新(22696); 教育部(22521); 成果(22455); 人文(22402); 科研(22343)

期刊: 济(52970); 经济(52970); 研究(34260); 管理(22885); 财(20320); 学报(19281); 中国(19059); 科学(18680); 大学(15894); 技术(15678); 学学(15214); 农(14992); 农业(10622); 财经(10253); 教育(10204); 业经(9585); 经济研究(9164); 融(8829); 金融(8829); 经(8783); 统计(8667); 技术经济(7819); 策(7666); 问题(7225); 理论(7110); 财会(7061); 决策(6972); 实践(6602); 践(6602); 商业(6601)

全选本页取消本页

共检索到181940条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

基于词链的自动分词方法

[期刊] 情报理论与实践 [作者] 杨建林张国梁

An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case ban...

关键词： automatic word extraction algorithm Chinese

基于EM算法的汉语自动分词方法

[期刊] 情报学报 [作者] 李家福张亚非

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。

关键词：分词汉语 EM算法语料库 HMM

自动抽词与自动分词

[期刊] 图书馆杂志 [作者] 张琪玉

自动抽词与自动分词既有紧密联系又有重大差别。自动抽词标引除编制题内关键词索引外,至今没有突破性进展,主要是检准率太低。本文指出自动抽词标引研究注重在各种更有效的算法的寻找,而忽视对相关问题的深入、系统的研究,是其进展缓慢的重要原因之一,并具体列举了一些相关问题。

关键词：自动抽词自动分词

三字歧义链自动分词方法

[期刊] 情报学报 [作者] 张翠英亢临生

歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种在最大匹配法基础上，根据大量的真实语料中出现的歧义现象，把可能产生歧义切分的词进行特性分类，对每类确定一组规则进行处理

关键词：歧义,分词特性,分词系统

基于HMM的楚辞自动分词标注研究

[期刊] 图书情报工作 [作者] 钱智勇周建忠童国平苏新宁

研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。

关键词：隐马尔科夫模型楚辞自动分词词性标注古文分词

基于CRFs和词典信息的中古汉语自动分词

[期刊] 数据分析与知识发现 [作者] 王晓玉李斌

【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词

关键词： CRFs模型分词一致性中古汉语自动分词

基于两字词簇的汉语快速自动分词算法

[期刊] 情报学报 [作者] 郭祥昊钟义信杨丽

本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占７５％的统计规律，提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理，也就是把长词的扫描范围限定在词汇量很小的词簇内，从而不仅提高了分词速度，而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外，本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现

关键词：自然语言处理,分词算法,切分歧义

基于N-gram复合分词的领域概念自动获取方法研究

[期刊] 情报理论与实践 [作者] 颜端武李兰彬曲美娟

文章提出一种基于N-gram复合分词的领域概念自动获取方法,在中文分词的基础上进行N元复合切分,通过建立一系列过滤规则,提取候选领域概念;然后以改进的TF-IDF作为衡量领域相关性的统计特征值,计算候选概念的领域相关性;最后进行人工辅助判断与筛选。以航空发动机领域语料为样本进行了实践探索,实验结果表明该方法能有效抽取专业领域概念,具有较强的实用性。

关键词：概念概念抽取复合分词领域相关性

基于λ-主动学习方法的中文微博分词

[期刊] 清华大学学报(自然科学版) [作者] 张婧黄德根黄锴宇刘壮孟祥主

由于面向中文微博的分词标注语料相对较少,导致基于传统方法和深度学习方法的中文分词系统在微博语料上的表现效果很差。针对此问题,该文提出一种主动学习方法,从大规模未标注语料中挑选更具标注价值的微博分词语料。根据微博语料的特点,在主动学习迭代过程中引入参数λ来控制所选的重复样例的个数,以确保所选样例的多样性;同时,根据样例中字标注结果的不确定性和上下文的多样性,采用Max、Avg和AvgMax这3种策略衡量样例整体的标注价值;此外,用于主动学习的初始分词器除使用当前字的上下文作为特征外,还利用字向量自动计算当前

关键词：文字信息处理中文分词主动学习样例多样性微博语料

基于词汇链的关键词自动标引方法

[期刊] 图书情报知识 [作者] 李纲戴强斌

关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。

关键词：语义相关词汇链关键词抽取自动标引

基于知识评价的快速汉语自动分词系统

[期刊] 情报学报 [作者] 张民李生王海峰赵铁军王铁志

汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个，一个是切分的速度，一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法，可大大提高系统的切分速度，而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后，本文对消歧提出了一些设想。

关键词：汉语自动分词,歧义,平价函数,词规则

基于神经网络的汉语自动分词系统的设计与分析

[期刊] 情报学报 [作者] 尹锋

应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手，阐述了基于神经网络的汉语自动分词系统的设计方法，较详细地介绍了该系统的实验结果，并给出了必要的分析。

关键词：神经网络,汉语分词

一个自动分词分类系统的实现

[期刊] 情报学报 [作者] 潘有能

本文介绍一个自动分词分类系统的实现过程。该系统采用“后控词表分词法” ,解决了词典分词法中词典构造困难、更新滞后的问题 ,提高了主题词标引的质量和效率 ,并通过对词表分类法的完善和优化 ,使自动分类的结果达到了实用水平

关键词： PDCS 后控词表分词法词表分类法

面向领域文献的无监督中文分词自动优化方法

[期刊] 数据分析与知识发现 [作者] 倪维健孙浩浩刘彤曾庆田

【目的】对现有中文分词方法在领域文献上的分词结果进行调整,以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析,以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差,并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验,结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果 F1值提升2%-3%,并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性,

关键词：领域文献中文分词分词优化词频偏差

基于N-gram的双向匹配中文分词方法

[期刊] 数理统计与管理 [作者] 凤丽洲杨贵军徐雪徐玉慧

针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法。充分挖掘训练语料的词频信息,给出一种组合词迭代切分方法,解决最大匹配分词中长词歧义切分问题,并基于N-gram语言模型,实现最优分词序列的选择。此外,为弥补准确率P这一评价指标受词条长度影响较大而不稳健的问题,在刻画分词方法性能时引入正确切分词条总字数这一因素,提出一个新的测评指标P_n,有效规避了词条长度对分词准确率评价的影响。最后在SIGHAN组织的国际中文自然语言处理竞赛的两个语料上进行实验表明,相较于传统N-gram中文分词方法,本文方法在保证分词效率的前提下,有效地提高了准确率P、召回率R、P_n和F_1值。

关键词： N-gram模型分词歧义评测指标双向匹配

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于词向量包的自动文摘方法全文检索中的汉语自动分词及其歧义处理汉语文献自动分词存在的问题及趋向基于机械分词与统计学的新词识别研究汉语文献自动分词与标引技术发展浅析数字人文视角下的非物质文化遗产文本自动分词及应用研究基于词句重要性的中文专利关键词自动抽取研究基于引用背景信息的关键词自动抽取方法研究基于全信息词典的自动文摘系统研究与实现基于支持向量机和核心特征词的科技文献自动标引研究