- 年份
- 2024(6429)
- 2023(9337)
- 2022(8325)
- 2021(7921)
- 2020(6648)
- 2019(15474)
- 2018(15517)
- 2017(29906)
- 2016(16405)
- 2015(18541)
- 2014(18391)
- 2013(18248)
- 2012(16550)
- 2011(14709)
- 2010(14380)
- 2009(12852)
- 2008(12236)
- 2007(10371)
- 2006(8867)
- 2005(7420)
- 学科
- 济(60530)
- 经济(60460)
- 管理(45558)
- 业(43056)
- 企(36446)
- 企业(36446)
- 方法(30709)
- 数学(26449)
- 数学方法(26124)
- 农(15345)
- 学(15304)
- 中国(15036)
- 财(14825)
- 业经(13495)
- 地方(12800)
- 理论(11019)
- 和(10777)
- 贸(10433)
- 贸易(10426)
- 农业(10315)
- 环境(10112)
- 易(10089)
- 技术(10067)
- 务(9995)
- 财务(9937)
- 财务管理(9921)
- 企业财务(9406)
- 制(9366)
- 划(8865)
- 教育(8860)
- 机构
- 大学(227547)
- 学院(225083)
- 管理(92836)
- 济(82692)
- 理学(81664)
- 经济(80769)
- 理学院(80738)
- 管理学(79245)
- 管理学院(78859)
- 研究(72886)
- 中国(51715)
- 科学(49075)
- 京(48399)
- 农(37393)
- 业大(36630)
- 所(36587)
- 财(36315)
- 研究所(33875)
- 中心(32716)
- 江(30854)
- 北京(30228)
- 范(30158)
- 财经(29998)
- 师范(29829)
- 农业(29586)
- 经(27304)
- 院(26794)
- 州(25635)
- 技术(24831)
- 师范大学(24232)
- 基金
- 项目(164050)
- 科学(128564)
- 基金(118938)
- 研究(118106)
- 家(103994)
- 国家(103143)
- 科学基金(88780)
- 社会(71616)
- 社会科(67802)
- 社会科学(67783)
- 省(64770)
- 基金项目(64530)
- 自然(60275)
- 自然科(58854)
- 自然科学(58844)
- 自然科学基金(57746)
- 划(54688)
- 教育(53774)
- 编号(48566)
- 资助(48430)
- 成果(38663)
- 重点(36283)
- 部(35213)
- 发(34310)
- 创(34290)
- 课题(32804)
- 创新(31899)
- 科研(31883)
- 计划(30493)
- 项目编号(30467)
共检索到310524条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
官琴 邓三鸿 王昊
【目的】通过实验对比分析,比较不同停用词表对于不同类型的文本数据的作用效果,对停用词表的构建与使用提供参考意见。【方法】选取百度停用词表、哈尔滨工业大学停用词表以及四川大学机器智能实验室停用词表,基于三个不同语料库运用汉语分词技术、TF-IDF特征评估函数以及VSM模型进行文本处理,并且采用Java编写的K-means算法进行聚类实验,通过准确率P、召回率R和F1三个评价指标对不同聚类结果进行效果评估。【结果】不同停用词表对于不同类型的文本数据作用效果差异明显,词表的长度、内容结构是影响作用效果的直接因素
关键词:
文本聚类 停用词 K-means
[期刊] 图书情报工作
[作者]
俞琰 赵乃瑄
[目的 /意义]针对专利文本主题建模中领域停用词自动选取尚未有充分研究的问题,提出一种新的领域停用词自动选取方法,用于专利文本主题模型分析,以提高专利主题模型的区分度与建模质量。[方法 /过程]领域停用词本质上是信息比较少,在不同类别专利文本中区分度低的词。因此,引入辅助专利文本集,使用类别熵衡量词的分布情况,然后依据词的类别熵进行排序,选取类别熵最大的若干词作为领域停用词。[结果 /结论]实验通过专利文本数据,验证了该方法的可行性与有效性,能够有效地提高专利主题模型的区分度。
关键词:
专利文本 主题建模 领域停用词 自动选取
[期刊] 情报理论与实践
[作者]
于双成 逢大欣 李占兵
MEDLARS与EMBASE所用词表的比较研究于双成逢大欣李占兵(白求恩医科大学吉林130021)AbstractThroughthecomparativestudyofthetwotypicalthesaurus-MeSHandFMTREEavai...
[期刊] 图书馆建设
[作者]
王彦侨 翟军
《中国分类主题词表》和《中文主题词表》是中国大陆和台湾地区广泛使用的标引工具,二者在功能、修订、发展过程、结构、版本、增词原则、主题词选用等方面均有所不同。从发展的眼光看,《中国分类主题词表》还需继续完善,以适应数量庞大、类型多样、内容广泛的文献标引的实际需要。
[期刊] 教育学报
[作者]
近日,《国家通用手语常用词表》和《国家通用盲文方案》日前由国家语言文字工作委员会规范标准审定委员会审定,经中国残疾人联合会、教育部、国家语言文字工作委员会同意,作为语言文字规范发布,自2018年7月1日起实施。该词表由教育部、国家语委、中国残联与北京师范大学共建的国家手语和盲文研究中心
关键词:
听力残疾人 国家语言文字工作委员会
[期刊] 中国特殊教育
[作者]
王滔 杨娟 郑璇
每个单纯的手语词由4个视觉要素构成,即手形、位置、运动和方向。各种自然手语表达方式的差异,均是因这4个要素的不同而产生,这些差异受到手语词使用频率的影响。通过分析西部地区7名聋人大学生表达的195个常用词的手语录像视频资料,结果发现:日常生活中使用频率越高的词汇,在自然手语的表达上越趋于相同,尤其是手形和方向要素的差异明显随词汇使用频率的增加而减小。
关键词:
自然手语 常用词 趋同度 要素 使用频率
[期刊] 情报理论与实践
[作者]
杜坤 刘怀亮 王帮金
[目的/意义]在基于向量空间模型的文本聚类中,文本相似度计算忽略特征项间语义关联,针对此问题,提出一种改进的语义文本相似度计算方法。[方法/过程]新方法利用维基百科知识库计算语义相关度,结合特征项在文本中的表示权重,构造文本相似度语义加权因子,并进行K-means文本聚类实验。[结果/结论]与传统的余弦相似度相比,改进后的语义文本相似度应用在文本聚类上,能有效提高聚类的准确度。[局限]语义相关度的计算没有对词语进行消歧处理。
[期刊] 图书馆论坛
[作者]
张琳 牟向伟
随着互联网的发展,网络电子文本的数量急剧增加,这给人们快速高效地从海量数据中挖掘所需要的信息带来了巨大挑战。文本聚类是解决这个问题的一种可行方法。本文在文本聚类的过程中,针对K-means算法在聚类时需要事先指定簇的个数k和k个初始中心点这两方面的不足,采用Canopy+K-means的聚类算法进行中文文本聚类。也就是为了提高K-means的聚类效果,先使用Canopy算法对数据进行“粗”聚类,在得到k值和聚类中心后再使用K-means算法进行“细”聚类。另外,在聚类过程中,为了避免“维灾难”现象,本文基
[期刊] 情报理论与实践
[作者]
韩普 王东波 路高飞
词干化、词形还原是英文文本处理中的一个重要步骤。本文利用3种聚类算法对两个Stemming算法和一个Lemmatization算法进行较为全面的实验。结果表明,Stemming和Lemmatization都可以提高英文文本聚类的聚类效果和效率,但对聚类结果的影响并不显著。相比于Snowball Stemmer和Stanford Lemmatizer,Porter Stemmer方法在Entropy和Pu-rity表现上更好,也更为稳定。
关键词:
词干化 词形还原 文本聚类 信息检索
[期刊] 情报理论与实践
[作者]
袁旭 常春 朱明
以语义相关度的计算为切入点,选取"关键词—题名—摘要"共现方法,以图书馆学情报学领域作为研究对象,分6个步骤构建该领域叙词间相关关系。引入感知器算法,计算叙词间相关关系的强度大小。从疏松关系、等级关系和等同关系的排除3个方面检验构建效果,验证得出使用文中的词汇共现方法可以构建专业叙词表的相关关系并取得较好效果。最后从切词、词距、对语料库的依赖和语料库的容量4个方面对实验进行了讨论。
关键词:
词汇共现 叙词表 语义相似度 相关度
[期刊] 图书情报工作
[作者]
欧石燕
[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法 /过程]以《汉语主题词表》为例,对中文叙词表的语义化表示、验证和关联数据发布进行探索。首先,制定基于SKOS、SKOS-XL和SKOS扩展的叙词表语义化表示方案,实现对叙词表的无损语义描述,开发基于N-Triples格式的词表语义化转换程序,使大规模词表的语义化转换更加简单高效;其次,采用新兴的SPIN框架对语义化词表的完整性进行验证,为SKOS词表的正确性与合法性提供保证;最后,采用"Jena TDB+Fuseki+Pubb...
[期刊] 图书情报工作
[作者]
欧石燕
[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法/过程]以《汉语主题词表》为例,对中文叙词表的语义化表示、验证和关联数据发布进行探索。首先,制定基于SKOS、SKOS?XL和SKOS扩展的叙词表语义化表示方案,实现对叙词表的无损语义描述,开发基于N?Triples格式的词表语义化转换程序,使大规模词表的语义化转换更加简单高效;其次,采用新兴的SPIN框架对语义化词表的完整性进行验证,为SKOS词表的正确性与合法性提供保证;最后,采用“JenaTDB+Fuseki+Pubby”...
[期刊] 中南林业科技大学学报
[作者]
何岸 胡伟刚
为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。
关键词:
文本分块 汉字结构 鲁棒性
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除