搜索文献-EPS

年份: 2024(7761); 2023(10823); 2022(8871); 2021(8017); 2020(6392); 2019(14715); 2018(14685); 2017(28524); 2016(15400); 2015(17420); 2014(17395); 2013(17170); 2012(15546); 2011(13933); 2010(13602); 2009(12227); 2008(11669); 2007(9867); 2006(8461); 2005(7143)

作者: 王(44959); 张(37038); 李(36735); 刘(34939); 陈(23477); 杨(17708); 晓(16680); 赵(14716); 周(14071); 华(13014); 吴(12783); 文(12207); 明(11500); 林(11465); 伟(11410); 丽(11124); 孙(11037); 志(10991); 黄(10504); 徐(10355); 玉(9154); 平(8883); 军(8718); 朱(8330); 郭(8303); 红(8137); 建(8114); 胡(8075); 春(7351); 艳(7338)

学科: 济(63807); 经济(63743); 管理(45620); 业(42795); 企(36352); 企业(36352); 方法(29803); 数学(25801); 数学方法(25462); 业经(18378); 农(15735); 中国(15461); 财(14428); 学(13454); 地方(12198); 产业(11702); 农业(10745); 理论(10683); 信息(10610); 和(10557); 贸(10552); 贸易(10548); 技术(10274); 易(10229); 环境(9890); 务(9615); 财务(9556); 财务管理(9541); 总论(9504); 信息产业(9368)

机构: 大学(220908); 学院(218487); 管理(92942); 济(82268); 理学(81730); 理学院(80874); 经济(80387); 管理学(79515); 管理学院(79128); 研究(68821); 中国(49088); 京(46789); 科学(44515); 财(35921); 业大(33529); 所(33286); 农(32309); 中心(31120); 研究所(30783); 财经(29831); 北京(29439); 江(29307); 范(29196); 师范(28958); 经(27195); 院(25536); 农业(25348); 州(24794); 师范大学(23570); 经济学(23514)

基金: 项目(159472); 科学(125387); 研究(117428); 基金(115566); 家(99993); 国家(99163); 科学基金(86115); 社会(72791); 社会科(68995); 社会科学(68977); 省(62273); 基金项目(61961); 自然(56462); 自然科(55128); 自然科学(55118); 自然科学基金(54096); 教育(52803); 划(52135); 编号(48806); 资助(46897); 成果(38704); 重点(34708); 部(34146); 发(33336); 创(33311); 课题(32370); 创新(30926); 项目编号(30683); 科研(30459); 大学(29581)

期刊: 济(84509); 经济(84509); 研究(61446); 中国(35606); 学报(34754); 管理(32522); 科学(31626); 农(28708); 大学(26083); 财(25054); 教育(24446); 学学(24236); 农业(20811); 技术(18996); 图书(15762); 融(14594); 金融(14594); 业经(14592); 财经(13250); 经济研究(13217); 理论(12037); 科技(11585); 实践(11424); 践(11424); 情报(11307); 经(11061); 问题(10832); 技术经济(10572); 书馆(10229); 图书馆(10229)

全选本页取消本页

共检索到299600条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

中文文本数字水印算法的研究

[期刊] 中南林业科技大学学报 [作者] 何岸胡伟刚

为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。

关键词：文本分块汉字结构鲁棒性

基于序列比对算法的中文文本相似度计算研究

[期刊] 图书情报工作 [作者] 赵登鹏熊回香田丰收李昕然

[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。

关键词： CRF 模型词性标注 Word2Vec 序列比对局部比对文本相似度

基于局部线性判别嵌入算法的中文文本分类研究

[期刊] 情报理论与实践 [作者] 范少萍李迎迎郑春厚

流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。

关键词：流形学习文本分类算法

教育质性研究中人机协同文本挖掘技术的运用——以某高校教学评估中文文本数据为例

[期刊] 清华大学教育研究 [作者] 王金羽詹逸思冯起李曼丽

信息时代海量增长的文本资料成为质性研究者开展研究的数据宝藏，但未得到充分研究，其原因在于针对海量中文文本数据的有效分析方法尚待突破。文章率先在质性研究范式中使用了以结构主题模型(STM)为代表的人机协同方法，对某大学在线教学效果评估的课堂观察记录数据展开文本挖掘。以教学评估研究数据分析为例，完整呈现了在教育质性研究中应用STM进行数据挖掘的四个步骤，并分析了其在挖掘海量中文文本资料方面的独特优势。研究表明，跨学科研究方法的尝试有助于解决教育学科甚至人文社科领域内海量中文文本在质性分析上的固有难题。

关键词：结构主题模型(STM) 超大文本挖掘教育质性研究

融合领域本体的中文文本语义特征提取算法研究

[期刊] 情报理论与实践 [作者] 何超张玉峰

针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。

关键词：文本语义特征领域本体算法

DCT域数字水印算法

[期刊] 情报理论与实践 [作者] 李思静杨小帆黄松彭求明

数字水印是用于网络环境下保护数字媒体版权的一种有效技术 ,而对DCT域的数字水印算法的研究又是其中的热点。本文详细介绍了这其中的两种典型策略。

关键词：多媒体版权/数字水印

中文文本分类反馈学习研究

[期刊] 情报理论与实践 [作者] 刘怀亮张治国赵捧未

本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。

关键词：反馈学习支持向量机文本分类

基于统计的中文文本分类研究

[期刊] 情报理论与实践 [作者] 姚兴山

本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。

关键词：文本分词特征选取文本分类

一种中文文本自动分类方法的研究

[期刊] 情报理论与实践 [作者] 尹桂秀

This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.

关键词： text mining data mining automatic classificatin

一种基于语义的中文文本分类算法

[期刊] 情报理论与实践 [作者] 赵辉刘怀亮范云杰左晓飞

针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。

关键词：文本分类语义向量空间向量空间模型语义相似度算法

基于Canopy+K-means的中文文本聚类算法

[期刊] 图书馆论坛 [作者] 张琳牟向伟

随着互联网的发展,网络电子文本的数量急剧增加,这给人们快速高效地从海量数据中挖掘所需要的信息带来了巨大挑战。文本聚类是解决这个问题的一种可行方法。本文在文本聚类的过程中,针对K-means算法在聚类时需要事先指定簇的个数k和k个初始中心点这两方面的不足,采用Canopy+K-means的聚类算法进行中文文本聚类。也就是为了提高K-means的聚类效果,先使用Canopy算法对数据进行“粗”聚类,在得到k值和聚类中心后再使用K-means算法进行“细”聚类。另外,在聚类过程中,为了避免“维灾难”现象,本文基

关键词： K-means Canopy 文本聚类 Word2vec

基于语义网络社团划分的中文文本分类研究

[期刊] 图书情报工作 [作者] 尹丽英赵捧未

为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。

关键词：语义网络词义消歧社团结构文本分类

Web页面中文文本主题的自动提取研究

[期刊] 情报学报 [作者] 韩客松王永成滕伟

Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。

关键词： Web页面文本主题抽取　加权

基于SVM与KNN的中文文本分类比较实证研究

[期刊] 情报理论与实践 [作者] 刘怀亮张治国马志辉孙蕾

本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。

关键词：支持向量机文本分类实证研究

面向新闻领域的中文文本分类研究综述

[期刊] 图书情报工作 [作者] 薛春香张玉芳

在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。

关键词：新闻分类文本分类机器学习中文信息处理

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

语法规则和改进关联规则的中文文本非等级关系提取研究基于语义相关度的中文文本聚类方法研究中文文本聚类常用停用词表对比研究一种迭代加权的元样本稀疏表示中文文本分类算法数字式中文全文文献格式的设计与研究面向领域中文文本信息处理的术语识别与抽取研究综述中文文本知识元的构建及其现实意义中文文本中两词语关联规律分析统计模型在中文文本挖掘中的应用基于多特征融合的中文文本关键词提取方法