- 年份
- 2024(8441)
- 2023(12221)
- 2022(10865)
- 2021(10248)
- 2020(8546)
- 2019(19919)
- 2018(19722)
- 2017(38709)
- 2016(20694)
- 2015(23274)
- 2014(23062)
- 2013(22417)
- 2012(20254)
- 2011(17970)
- 2010(17391)
- 2009(15485)
- 2008(14522)
- 2007(12158)
- 2006(10196)
- 2005(8260)
- 学科
- 济(80375)
- 经济(80291)
- 管理(59621)
- 业(56359)
- 企(47507)
- 企业(47507)
- 方法(42569)
- 数学(37410)
- 数学方法(36888)
- 农(20645)
- 财(20183)
- 中国(19533)
- 业经(17579)
- 学(16889)
- 地方(15348)
- 贸(14146)
- 贸易(14142)
- 农业(13920)
- 易(13744)
- 理论(13592)
- 务(13580)
- 财务(13512)
- 财务管理(13485)
- 技术(13228)
- 和(12985)
- 企业财务(12770)
- 环境(12763)
- 制(12082)
- 划(11247)
- 银(10178)
- 机构
- 大学(283273)
- 学院(281735)
- 管理(119158)
- 济(109605)
- 经济(107313)
- 理学(105269)
- 理学院(104197)
- 管理学(102242)
- 管理学院(101742)
- 研究(86264)
- 中国(62007)
- 京(58470)
- 科学(54855)
- 财(47968)
- 业大(43348)
- 农(41923)
- 所(40840)
- 财经(40304)
- 中心(40213)
- 研究所(37827)
- 江(37794)
- 经(36841)
- 范(36514)
- 师范(36181)
- 北京(35911)
- 农业(32848)
- 经济学(32504)
- 院(32165)
- 州(31178)
- 经济管理(30657)
- 基金
- 项目(207484)
- 科学(164079)
- 基金(151800)
- 研究(151359)
- 家(131533)
- 国家(130475)
- 科学基金(113901)
- 社会(95107)
- 社会科(90194)
- 社会科学(90170)
- 基金项目(81626)
- 省(80839)
- 自然(75492)
- 自然科(73776)
- 自然科学(73759)
- 自然科学基金(72396)
- 教育(70012)
- 划(67904)
- 资助(62280)
- 编号(62051)
- 成果(48014)
- 部(45753)
- 重点(45708)
- 创(43428)
- 发(43162)
- 课题(41227)
- 创新(40449)
- 科研(40125)
- 教育部(39662)
- 大学(39164)
- 期刊
- 济(107506)
- 经济(107506)
- 研究(77102)
- 中国(43827)
- 学报(43567)
- 管理(41121)
- 科学(40205)
- 农(36506)
- 财(35217)
- 大学(33681)
- 学学(31672)
- 教育(29608)
- 农业(26090)
- 技术(25635)
- 业经(18809)
- 财经(18261)
- 融(18205)
- 金融(18205)
- 经济研究(17083)
- 图书(15842)
- 经(15435)
- 统计(15003)
- 问题(14221)
- 科技(14030)
- 理论(14011)
- 技术经济(13434)
- 实践(13124)
- 践(13124)
- 策(12851)
- 业(12708)
共检索到380276条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 马志辉 孙蕾
本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。
关键词:
支持向量机 文本分类 实证研究
[期刊] 情报理论与实践
[作者]
范少萍 李迎迎 郑春厚
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
关键词:
流形学习 文本分类 算法
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
[期刊] 情报学报
[作者]
王梦云 曹素青
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 图书情报工作
[作者]
王文娟 马建霞 陈春 张凌波
[目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。
关键词:
引文文本分类 引文内容分析 引文分析
[期刊] 情报学报
[作者]
王永成 张坤
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。
[期刊] 情报理论与实践
[作者]
李秀霞 邵作运 郑春厚
为进一步提高文本分类的准确率和鲁棒性,在元样本稀疏表示分类算法的基础上,提出一种迭代加权的元样本稀疏表示文本分类算法,该算法在每一步迭代中依据一定的规则有监督地对权系数进行调整,使目标函数值被限定在较小的范围内,逐步逼近最优拉格朗日乘子,以得到更加稀疏的样本表示系数。实验结果表明,与经典的文本分类算法KNN、SVM及非加权的MSRC算法相比,提出的文本分类算法具有较高的准确率和较好的鲁棒性。
关键词:
文本分类 元样本 分类算法
[期刊] 图书情报工作
[作者]
赵登鹏 熊回香 田丰收 李昕然
[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。
[期刊] 情报理论与实践
[作者]
杜坤 刘怀亮 王帮金
[目的/意义]在基于向量空间模型的文本聚类中,文本相似度计算忽略特征项间语义关联,针对此问题,提出一种改进的语义文本相似度计算方法。[方法/过程]新方法利用维基百科知识库计算语义相关度,结合特征项在文本中的表示权重,构造文本相似度语义加权因子,并进行K-means文本聚类实验。[结果/结论]与传统的余弦相似度相比,改进后的语义文本相似度应用在文本聚类上,能有效提高聚类的准确度。[局限]语义相关度的计算没有对词语进行消歧处理。
[期刊] 中南林业科技大学学报
[作者]
何岸 胡伟刚
为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。
关键词:
文本分块 汉字结构 鲁棒性
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除