- 年份
- 2024(6119)
- 2023(8785)
- 2022(7528)
- 2021(6996)
- 2020(6094)
- 2019(14028)
- 2018(13688)
- 2017(26450)
- 2016(13587)
- 2015(15068)
- 2014(14551)
- 2013(14124)
- 2012(12690)
- 2011(11232)
- 2010(10715)
- 2009(9308)
- 2008(8692)
- 2007(7222)
- 2006(5910)
- 2005(4901)
- 学科
- 济(56778)
- 经济(56725)
- 管理(40992)
- 业(40524)
- 企(34508)
- 企业(34508)
- 方法(30783)
- 数学(27494)
- 数学方法(27027)
- 技术(15128)
- 财(13741)
- 农(13128)
- 中国(12625)
- 学(11387)
- 业经(10882)
- 贸(9610)
- 贸易(9606)
- 易(9384)
- 务(9193)
- 财务(9144)
- 财务管理(9124)
- 农业(9058)
- 理论(9003)
- 地方(8722)
- 企业财务(8699)
- 和(8634)
- 技术管理(8630)
- 环境(7768)
- 制(7564)
- 划(7241)
- 机构
- 大学(184996)
- 学院(182530)
- 管理(76417)
- 济(75989)
- 经济(74659)
- 理学(67277)
- 理学院(66652)
- 管理学(65290)
- 管理学院(64946)
- 研究(57299)
- 中国(42021)
- 京(37916)
- 科学(35273)
- 财(32327)
- 业大(28895)
- 农(28485)
- 中心(27736)
- 所(26987)
- 财经(26966)
- 江(25692)
- 研究所(24912)
- 经(24821)
- 经济学(23759)
- 北京(22909)
- 农业(22300)
- 范(22258)
- 师范(22010)
- 院(21832)
- 经济学院(21661)
- 技术(20685)
- 基金
- 项目(136161)
- 科学(108721)
- 基金(101401)
- 研究(97468)
- 家(89217)
- 国家(88576)
- 科学基金(77366)
- 社会(63302)
- 社会科(60352)
- 社会科学(60335)
- 基金项目(53714)
- 省(52381)
- 自然(51085)
- 自然科(50031)
- 自然科学(50017)
- 自然科学基金(49106)
- 教育(45540)
- 划(44391)
- 资助(41370)
- 编号(37956)
- 部(30709)
- 重点(30639)
- 创(29526)
- 成果(28668)
- 发(28366)
- 创新(27699)
- 国家社会(27360)
- 科研(26876)
- 教育部(26662)
- 人文(25907)
共检索到253694条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
何浩 杨海棠
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 情报学报
[作者]
王永成 张坤
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。
[期刊] 情报学报
[作者]
叶新明
本文通过对现有中文自动分词算法的分析,提出了适于中文文献自动分类的自动分词算法。该算法通过建立机读词表,以《中图法》作为分类标准,对中文文献实现了自动分类。通过对财政金融类文献的测试,其准确率可达79%。
[期刊] 数理统计与管理
[作者]
凤丽洲 杨贵军 徐雪 徐玉慧
针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法。充分挖掘训练语料的词频信息,给出一种组合词迭代切分方法,解决最大匹配分词中长词歧义切分问题,并基于N-gram语言模型,实现最优分词序列的选择。此外,为弥补准确率P这一评价指标受词条长度影响较大而不稳健的问题,在刻画分词方法性能时引入正确切分词条总字数这一因素,提出一个新的测评指标P_n,有效规避了词条长度对分词准确率评价的影响。最后在SIGHAN组织的国际中文自然语言处理竞赛的两个语料上进行实验表明,相较于传统N-gram中文分词方法,本文方法在保证分词效率的前提下,有效地提高了准确率P、召回率R、P_n和F_1值。
[期刊] 情报理论与实践
[作者]
颜端武 李兰彬 曲美娟
文章提出一种基于N-gram复合分词的领域概念自动获取方法,在中文分词的基础上进行N元复合切分,通过建立一系列过滤规则,提取候选领域概念;然后以改进的TF-IDF作为衡量领域相关性的统计特征值,计算候选概念的领域相关性;最后进行人工辅助判断与筛选。以航空发动机领域语料为样本进行了实践探索,实验结果表明该方法能有效抽取专业领域概念,具有较强的实用性。
关键词:
概念 概念抽取 复合分词 领域相关性
[期刊] 情报理论与实践
[作者]
叶新明
概要性地论述了中文文献自动分类的问题,提出了中文文献自动分类的一般模式, 同时也分析了要实现中文文献自动分类目前所面临的一些实际问题。
关键词:
自动分类 自动抽词 自动标引
[期刊] 湖南农业大学学报(自然科学版)
[作者]
刘楚达 孙海涛
为开发出实现容易、成本低、实用性强的计算机中文自动文摘系统 ,经过研究 ,设计了一个基于统计的中文自动文摘系统模型 ,提出了一种新的特征词加权函数和一种新的句子重要性加权函数 ,该系统能对任意领域、任意体裁、任意长度的文章以任意比例提取文摘 .
[期刊] 情报学报
[作者]
王永成 顾晓明 王丽霞
本文介绍了上海交通大学电脑应用技术研究所开发的中文文献主题自动标引系统CSAIS2.1的主要思路、基本算法及其基本结构
关键词:
自动标引,中文文献,主题词
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 情报学报
[作者]
刁倩 张惠惠 王永成 何骥
本文阐述了自动分类中的仿人思想 ,并用分类域模型来描述中文信息自动分类中的分类法 ,通过计算类别特征项在分类域中的Hamming距离 ,对类别特征项依据其在分类域中的类别分布进行聚类 ,从而实现对向量分类法中的特征向量维数的压缩 ,并进一步构造用于中文自动分类的知识库。
关键词:
自动分类 知识库 特征向量 仿人算法
[期刊] 情报学报
[作者]
王永成 许慧敏
本文概括地介绍了研究与开发中文文献自动摘要系统的必要性、突破口的选择、发展进化的简史、已达到的最新水平以及实现的诀窍
关键词:
中文,自动摘要,技术诀窍,最新水平
[期刊] 情报理论与实践
[作者]
颜端武 陶志恒 李兰彬
文章研究了一种基于HDP主题模型的主题文献自动推荐方法,并将其应用于专题情报服务领域知识库构建平台系统的开发。该方法在中文分词和词性标注的基础上,进行文献特征的预筛选获得特征词频分布矩阵,通过HDP主题模型生成各文献与文献集的主题分布矩阵,利用余弦相似度计算与时间阈值加权,生成每篇文献的相关文献集并进行主题文献自动推荐。选取雷达领域语料为样本,在面向专题情报服务的领域知识库构建平台系统中进行了主题文献推荐的模块设计和实际应用。
[期刊] 情报学报
[作者]
王梦云 曹素青
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除