- 年份
- 2024(6703)
- 2023(9850)
- 2022(8868)
- 2021(8380)
- 2020(7104)
- 2019(16824)
- 2018(16715)
- 2017(32481)
- 2016(17491)
- 2015(19705)
- 2014(19568)
- 2013(19414)
- 2012(17617)
- 2011(15849)
- 2010(15658)
- 2009(14193)
- 2008(13698)
- 2007(11767)
- 2006(10232)
- 2005(8854)
- 学科
- 济(68416)
- 经济(68344)
- 管理(48780)
- 业(45536)
- 企(38935)
- 企业(38935)
- 方法(33732)
- 数学(28963)
- 数学方法(28480)
- 学(17012)
- 农(16608)
- 中国(16443)
- 财(15980)
- 业经(14431)
- 地方(13611)
- 理论(12562)
- 和(11575)
- 贸(11459)
- 贸易(11452)
- 易(11088)
- 农业(11086)
- 技术(10683)
- 制(10615)
- 务(10470)
- 财务(10401)
- 财务管理(10381)
- 环境(10294)
- 企业财务(9833)
- 教育(9745)
- 划(9484)
- 机构
- 大学(246151)
- 学院(242058)
- 管理(99544)
- 济(90454)
- 经济(88323)
- 理学(86920)
- 理学院(85957)
- 管理学(84224)
- 管理学院(83798)
- 研究(80358)
- 中国(57890)
- 京(53441)
- 科学(52621)
- 所(40568)
- 财(40257)
- 农(39054)
- 业大(38661)
- 研究所(37300)
- 中心(35796)
- 江(34166)
- 北京(33993)
- 财经(32887)
- 范(32419)
- 师范(32138)
- 农业(30618)
- 院(29903)
- 经(29891)
- 州(28160)
- 技术(26339)
- 师范大学(26191)
- 基金
- 项目(172816)
- 科学(134864)
- 基金(124785)
- 研究(124702)
- 家(109297)
- 国家(108420)
- 科学基金(92844)
- 社会(75856)
- 社会科(71827)
- 社会科学(71805)
- 省(67198)
- 基金项目(66635)
- 自然(62495)
- 自然科(61051)
- 自然科学(61038)
- 自然科学基金(59896)
- 教育(57030)
- 划(56991)
- 资助(52359)
- 编号(51091)
- 成果(41448)
- 重点(38241)
- 部(37481)
- 发(35719)
- 创(35423)
- 课题(34965)
- 科研(33425)
- 创新(32948)
- 大学(32071)
- 项目编号(31951)
共检索到345087条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 情报学报
[作者]
何浩 杨海棠
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 情报学报
[作者]
王永成 张坤
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。
[期刊] 情报学报
[作者]
曹素青 曾伏虎 曹焕光
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类模型。该模型采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方拟合(LinearLeastSquareFit,LLSF)技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字———类别两个向量空间的映射函数,并用该函数对测试文本进行分类。
[期刊] 情报学报
[作者]
王梦云 曹素青
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
[期刊] 情报理论与实践
[作者]
李秀霞 邵作运 郑春厚
为进一步提高文本分类的准确率和鲁棒性,在元样本稀疏表示分类算法的基础上,提出一种迭代加权的元样本稀疏表示文本分类算法,该算法在每一步迭代中依据一定的规则有监督地对权系数进行调整,使目标函数值被限定在较小的范围内,逐步逼近最优拉格朗日乘子,以得到更加稀疏的样本表示系数。实验结果表明,与经典的文本分类算法KNN、SVM及非加权的MSRC算法相比,提出的文本分类算法具有较高的准确率和较好的鲁棒性。
关键词:
文本分类 元样本 分类算法
[期刊] 湖南农业大学学报(自然科学版)
[作者]
刘楚达 孙海涛
为开发出实现容易、成本低、实用性强的计算机中文自动文摘系统 ,经过研究 ,设计了一个基于统计的中文自动文摘系统模型 ,提出了一种新的特征词加权函数和一种新的句子重要性加权函数 ,该系统能对任意领域、任意体裁、任意长度的文章以任意比例提取文摘 .
[期刊] 情报理论与实践
[作者]
叶新明
概要性地论述了中文文献自动分类的问题,提出了中文文献自动分类的一般模式, 同时也分析了要实现中文文献自动分类目前所面临的一些实际问题。
关键词:
自动分类 自动抽词 自动标引
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 情报学报
[作者]
韩客松 王永成 滕伟
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。
关键词:
Web页面文本 主题抽取 加权
[期刊] 图书情报工作
[作者]
赵辉 刘怀亮
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
关键词:
短文本分类 维基百科 词义消歧 特征扩展
[期刊] 情报学报
[作者]
叶新明
本文通过对现有中文自动分词算法的分析,提出了适于中文文献自动分类的自动分词算法。该算法通过建立机读词表,以《中图法》作为分类标准,对中文文献实现了自动分类。通过对财政金融类文献的测试,其准确率可达79%。
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除