- 年份
- 2024(6554)
- 2023(9645)
- 2022(8709)
- 2021(8388)
- 2020(7003)
- 2019(16289)
- 2018(16311)
- 2017(31559)
- 2016(17303)
- 2015(19756)
- 2014(19784)
- 2013(19463)
- 2012(17887)
- 2011(16023)
- 2010(15840)
- 2009(14489)
- 2008(14173)
- 2007(12317)
- 2006(10684)
- 2005(9180)
- 学科
- 济(65902)
- 经济(65823)
- 管理(49997)
- 业(46259)
- 企(39573)
- 企业(39573)
- 方法(32763)
- 数学(27976)
- 数学方法(27517)
- 农(16921)
- 中国(16336)
- 学(16266)
- 财(16016)
- 业经(14524)
- 地方(13218)
- 理论(12637)
- 贸(11582)
- 贸易(11576)
- 和(11552)
- 易(11220)
- 农业(11175)
- 制(11163)
- 技术(10683)
- 务(10614)
- 财务(10549)
- 财务管理(10527)
- 环境(10289)
- 教育(10094)
- 企业财务(9965)
- 划(9567)
- 机构
- 大学(246531)
- 学院(243245)
- 管理(99425)
- 济(89006)
- 经济(86801)
- 理学(86610)
- 理学院(85640)
- 管理学(83942)
- 管理学院(83522)
- 研究(78740)
- 中国(57318)
- 京(53367)
- 科学(51906)
- 财(40028)
- 所(39671)
- 农(38595)
- 业大(38155)
- 研究所(36380)
- 中心(35775)
- 江(34277)
- 北京(33804)
- 范(33165)
- 师范(32864)
- 财经(32668)
- 农业(30364)
- 经(29640)
- 院(28771)
- 州(28621)
- 师范大学(26624)
- 技术(26519)
- 基金
- 项目(170534)
- 科学(132938)
- 研究(123844)
- 基金(122740)
- 家(106948)
- 国家(106045)
- 科学基金(90976)
- 社会(74954)
- 社会科(70822)
- 社会科学(70801)
- 省(66448)
- 基金项目(65817)
- 自然(61030)
- 自然科(59605)
- 自然科学(59593)
- 自然科学基金(58486)
- 教育(56815)
- 划(56190)
- 编号(51394)
- 资助(51210)
- 成果(41847)
- 重点(37484)
- 部(36842)
- 发(35212)
- 创(34867)
- 课题(34775)
- 科研(32708)
- 创新(32417)
- 项目编号(32118)
- 大学(31835)
共检索到346473条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
白振田 侯汉清
本文借鉴了关键词轮排原理,结合相关统计模型,从正反两个方面对原始抽词词典进行压缩和优选,以达到降维和准确表达主题的目的;并基于海量新闻文本进行了自动分类测试,结果表明该约简算法在构造核心关键词词典方面是可行的。
关键词:
抽词词典 关键词轮排 自动分类 算法
[期刊] 情报理论与实践
[作者]
史伟
在大多数与观点挖掘和情感分析相关的任务中,都必须计算某些观点表达的语义倾向(比如正面或负面评价)。最近的一些研究表明语义倾向依赖于应用领域,文章认为语义倾向更依赖于特定的目标——特征。介绍了一种以半监督方式在特定领域中构建特征级观点词词典的方法:从一小部分已标注的文档开始归纳词汇,然后使用一种新的基于排序算法(极性等级法)的图,从更大部分未标注的文档中自动将观点词词典进行扩展。选择了两个不同领域(手机和婚纱摄影)的评论集进行了构建方法的效果评估。最后得到的方法仅使用少量已标注的文档,产生的特征级的观点词词典领域独立,并具有更好的查准率和查全率。
[期刊] 情报学报
[作者]
刘永丹
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。
[期刊] 情报学报
[作者]
杨晓兰 钟义信
本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析,填充预定的文摘框架,最后生成风格一致的文摘。基于上述理论的研究,设计并实现了计算机病毒领域的自动文摘实验系统,其效果较为理想。
[期刊] 情报理论与实践
[作者]
徐红姣 王惠临 章成志
双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。
关键词:
跨语言 信息检索 翻译词典
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
刘小虎 吴葳 李生 赵铁军 蔡萌 鞠英杰
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。实践证明该方法是行之有效的
关键词:
语料库,词汇级对齐,共现概率
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 图书情报工作
[作者]
何琳 常颖聪 周百超 杨波
采用以《中国图书馆分类法》为中介词典的兼容映射思想,根据向量空间模型原理构造映射函数,分别对当当网、卓越亚马逊、京东商城三个网上书店的网络图书分类体系与《中国图书馆分类法》进行类目相似度的映射,并根据类目相似值制订详细的类目映射关系规则。通过对映射关系进行横向及纵向分析,为未来的网络分类体系构建提出建议,最后指出本研究的不足及下一步需要改进的工作。
[期刊] 情报理论与实践
[作者]
岑咏华
本文在已有研究基础上,针对中文粗分词,设计了多重哈希词典结构,以提高分词的词典匹配效率,同时基于删除算法改进了中科院ICTCLAS分词系统的K-最短路径搜索思想。最后,论文对所研究技术方案进行了系统实现。系统实验结果表明,对于大规模文本,论文所提出的粗分词方案体现出了很好的性能。
关键词:
哈希词典 算法 中文分词
[期刊] 清华大学学报(自然科学版)
[作者]
阿不都萨拉木·达吾提 于斯音·于苏普 艾斯卡尔·艾木都拉
该文在类别区分词特征选择方法的基础上,针对维吾尔文中的生气、高兴、难过、惊讶等句子的情感类别提出了类别区分词与情感词典相结合的方法,进行了句子情感分类研究。结合维吾尔语文本句子中的情感表达特点,利用类别区分词特征选择方法,提取了最有类别区分能力的特征词,并进行了情感分类。通过人工抽取方法收集了维吾尔文句子中能表达情感的关键词,并建立了一个基础情感词典。将该词典与类别区分词结合在一起作为特征,对维吾尔文句子的情感类型有效地进行了分类。实验结果表明类别区分词与情感词典相结合方法的分类效率优于只用类别区分词特征
[期刊] 图书馆论坛
[作者]
崔新蕊 刘少武
列举《中图法》(第四版)词典类目的设置情况,对各类词典的分类标引作出详细举例说明,并对由于理解的差异而导致有关词典归类的分歧问题进行分析探讨。
关键词:
中图法 词典 类目设置 分类标引
[期刊] 图书情报工作
[作者]
俞琰 赵乃瑄
[目的 /意义]针对专利文本主题建模中领域停用词自动选取尚未有充分研究的问题,提出一种新的领域停用词自动选取方法,用于专利文本主题模型分析,以提高专利主题模型的区分度与建模质量。[方法 /过程]领域停用词本质上是信息比较少,在不同类别专利文本中区分度低的词。因此,引入辅助专利文本集,使用类别熵衡量词的分布情况,然后依据词的类别熵进行排序,选取类别熵最大的若干词作为领域停用词。[结果 /结论]实验通过专利文本数据,验证了该方法的可行性与有效性,能够有效地提高专利主题模型的区分度。
关键词:
专利文本 主题建模 领域停用词 自动选取
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除