- 年份
- 2024(4611)
- 2023(6665)
- 2022(5745)
- 2021(5452)
- 2020(4620)
- 2019(10692)
- 2018(10472)
- 2017(20615)
- 2016(10640)
- 2015(11900)
- 2014(11447)
- 2013(10954)
- 2012(9630)
- 2011(8292)
- 2010(7694)
- 2009(6634)
- 2008(5902)
- 2007(4571)
- 2006(3403)
- 2005(2461)
- 学科
- 济(43260)
- 经济(43220)
- 管理(30914)
- 业(29545)
- 方法(26344)
- 企(25025)
- 企业(25025)
- 数学(24045)
- 数学方法(23635)
- 财(11395)
- 农(9898)
- 中国(8957)
- 业经(8263)
- 务(7986)
- 财务(7952)
- 财务管理(7933)
- 企业财务(7558)
- 贸(7114)
- 贸易(7112)
- 技术(7058)
- 学(7021)
- 易(6955)
- 地方(6668)
- 农业(6663)
- 环境(6354)
- 和(6240)
- 理论(6230)
- 划(5623)
- 制(5565)
- 融(4870)
- 机构
- 大学(138739)
- 学院(138291)
- 管理(60649)
- 济(57837)
- 经济(56905)
- 理学(54335)
- 理学院(53844)
- 管理学(52804)
- 管理学院(52547)
- 研究(37955)
- 中国(28247)
- 京(26584)
- 财(24748)
- 科学(22754)
- 财经(21350)
- 业大(20580)
- 经(19752)
- 中心(19681)
- 经济学(18465)
- 农(18378)
- 江(17613)
- 经济学院(16955)
- 范(16451)
- 财经大学(16365)
- 师范(16283)
- 经济管理(16263)
- 所(16026)
- 商学(15802)
- 商学院(15662)
- 北京(15364)
- 基金
- 项目(107168)
- 科学(86781)
- 基金(81378)
- 研究(77342)
- 家(70359)
- 国家(69836)
- 科学基金(62513)
- 社会(51306)
- 社会科(48915)
- 社会科学(48903)
- 基金项目(43575)
- 自然(41411)
- 省(40854)
- 自然科(40563)
- 自然科学(40554)
- 自然科学基金(39807)
- 教育(36363)
- 划(34603)
- 资助(32893)
- 编号(30335)
- 部(24457)
- 重点(23696)
- 创(23087)
- 国家社会(22173)
- 成果(22080)
- 发(22062)
- 教育部(21667)
- 创新(21611)
- 科研(21471)
- 人文(21393)
共检索到175399条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
付国宏 王晓龙
本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数,本模型不仅反映了词形统计构词规律,而且在一定程度上体现了长词优先的切分原则。初步测试表明,本方法的切分准确率和消歧率分别可达996%和9344%。
关键词:
汉语分词,词形概率,整合系数,词形网格
[期刊] 情报学报
[作者]
薛翠芳 郭炳炎
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。
关键词:
特征词 加权函数 自动文摘
[期刊] 情报学报
[作者]
苏新宁
作者从实际应用的角度对汉语文献自动标引的两种算法进行了改进。提出将非用字后缀表法改进为,考察相邻三字之间的联系关系,实现一次扫描完成分词;还提出了首字直接匹配法对单字标引的检索进行改进
关键词:
汉语,信息处理,自动标引
[期刊] 民族教育研究
[作者]
白立元
汉语字词误用的规律及辨析方法,在民族院校汉语文教学中重视程度不够,对此方面的深入探索与研究对学生规范运用汉语言文字无疑具有很好的作用。汉语字词的辨析可以从汉字结构、字形特点、字形演变、偏旁部首等汉语字词的构成规律以及字词关系、词义构成、字形表义方式等词义规律着手,从而总结汉语字词误用规律、找出汉语字词误用的根源。本文初步总结的汉语字词的辨误方法主要有因义辨形、字形辨异等字形辨析法和互文见义、义素分析、语义搭配、词义辨异等词义辨析法两类。
关键词:
汉语 字词 构成规律 辨误方法
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 情报理论与实践
[作者]
欧金森
论述一种采用字处理方式用计算机从汉语文献中抽词的方法。该方法从目标词的外部着手,利用语法关系去掉目标词外围的词和字,同时注意区分去留字和词间的切分点,从而提高抽词效果。这种字处理运行机制的算法,为汉语主题抽调提出了新方法,并可与位控赋词并联运行,构成一整套字处理取词系统。
[期刊] 情报学报
[作者]
薛翠芳 郭炳炎
本文试图运用向量空间模型来确定文本段落之间内容的相关性 ,从而实现文本主题的自动分析 ,找出构成文本大主题的各个小主题 ,从这些小主题入手来实现自动文摘 ,可为自动文摘技术探索一条新途径。另一方面 ,通过文本结构的自动分析 ,可确定文本结构的类型 ,也为全文检索等信息处理技术提供一些有用的信息
关键词:
文本结构 向量空间模型 自动文摘
[期刊] 情报学报
[作者]
刘永丹
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。
[期刊] 河北经贸大学学报(综合版)
[作者]
李莉斌 葛文词
汉语文化负载词是中华民族语言的精粹,蕴含着丰富的民族文化及历史沉淀,在对外传播中起着不可忽视的作用。在国家提倡文化"走出去"的背景下,汉语文化负载词的准确翻译是中华民族文化成功对外传播并为世界人民所了解和接受的前提。因此,克服跨文化交流过程中的文化障碍,避免语用失误是中华文化成功走出去的有力保证。
[期刊] 情报理论与实践
[作者]
王玮 刘丹
详细分析了目前汉语文献自动分词存在的问题,即词法的复杂性、切分的模糊性和语法分析问题。然后提出了汉语文献自动分词的发展趋向。
关键词:
汉语文献,自动分词,文献标引
[期刊] 情报学报
[作者]
林春实 方燕 全吉成
本文将汉语自动分词与标引技术的研究归结为机械分词、语义分词和基于神经网络的智能分词三大系列,分析了阻碍汉语自动分词研究发展的问题,并确认了自动分词研究的发展方向。
关键词:
自动分词,自动标引
[期刊] 情报理论与实践
[作者]
吴思竹 钱庆 李丹亚 李军莲 胡铁军
文章根据英文超级科技叙词表构建需要,对三种词形还原工具进行评估。主要选取理、工、农三个领域的数据,将词形变形数量比较、工具间处理结果差异比较、抽样评估三种方法相结合,评估3种词形还原工具对领域专业词汇的词形还原效果。
关键词:
词形还原 领域数据 评估
[期刊] 情报学报
[作者]
牛耘 朱献有
针对目前汉语自动分词系统中切分歧义的难点,本文提出利用神经网络模式识别的方法帮助消歧。介绍了所建立的实验系统,并进行了实验分析。
关键词:
切分歧义,神经网络,模式识别
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除