- 年份
- 2024(7761)
- 2023(10823)
- 2022(8871)
- 2021(8017)
- 2020(6392)
- 2019(14715)
- 2018(14685)
- 2017(28524)
- 2016(15400)
- 2015(17420)
- 2014(17395)
- 2013(17170)
- 2012(15546)
- 2011(13933)
- 2010(13602)
- 2009(12227)
- 2008(11669)
- 2007(9867)
- 2006(8461)
- 2005(7143)
- 学科
- 济(63807)
- 经济(63743)
- 管理(45620)
- 业(42795)
- 企(36352)
- 企业(36352)
- 方法(29803)
- 数学(25801)
- 数学方法(25462)
- 业经(18378)
- 农(15735)
- 中国(15461)
- 财(14428)
- 学(13454)
- 地方(12198)
- 产业(11702)
- 农业(10745)
- 理论(10683)
- 信息(10610)
- 和(10557)
- 贸(10552)
- 贸易(10548)
- 技术(10274)
- 易(10229)
- 环境(9890)
- 务(9615)
- 财务(9556)
- 财务管理(9541)
- 总论(9504)
- 信息产业(9368)
- 机构
- 大学(220908)
- 学院(218487)
- 管理(92942)
- 济(82268)
- 理学(81730)
- 理学院(80874)
- 经济(80387)
- 管理学(79515)
- 管理学院(79128)
- 研究(68821)
- 中国(49088)
- 京(46789)
- 科学(44515)
- 财(35921)
- 业大(33529)
- 所(33286)
- 农(32309)
- 中心(31120)
- 研究所(30783)
- 财经(29831)
- 北京(29439)
- 江(29307)
- 范(29196)
- 师范(28958)
- 经(27195)
- 院(25536)
- 农业(25348)
- 州(24794)
- 师范大学(23570)
- 经济学(23514)
- 基金
- 项目(159472)
- 科学(125387)
- 研究(117428)
- 基金(115566)
- 家(99993)
- 国家(99163)
- 科学基金(86115)
- 社会(72791)
- 社会科(68995)
- 社会科学(68977)
- 省(62273)
- 基金项目(61961)
- 自然(56462)
- 自然科(55128)
- 自然科学(55118)
- 自然科学基金(54096)
- 教育(52803)
- 划(52135)
- 编号(48806)
- 资助(46897)
- 成果(38704)
- 重点(34708)
- 部(34146)
- 发(33336)
- 创(33311)
- 课题(32370)
- 创新(30926)
- 项目编号(30683)
- 科研(30459)
- 大学(29581)
- 期刊
- 济(84509)
- 经济(84509)
- 研究(61446)
- 中国(35606)
- 学报(34754)
- 管理(32522)
- 科学(31626)
- 农(28708)
- 大学(26083)
- 财(25054)
- 教育(24446)
- 学学(24236)
- 农业(20811)
- 技术(18996)
- 图书(15762)
- 融(14594)
- 金融(14594)
- 业经(14592)
- 财经(13250)
- 经济研究(13217)
- 理论(12037)
- 科技(11585)
- 实践(11424)
- 践(11424)
- 情报(11307)
- 经(11061)
- 问题(10832)
- 技术经济(10572)
- 书馆(10229)
- 图书馆(10229)
共检索到299600条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 中南林业科技大学学报
[作者]
何岸 胡伟刚
为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。
关键词:
文本分块 汉字结构 鲁棒性
[期刊] 图书情报工作
[作者]
赵登鹏 熊回香 田丰收 李昕然
[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。
[期刊] 情报理论与实践
[作者]
范少萍 李迎迎 郑春厚
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
关键词:
流形学习 文本分类 算法
[期刊] 清华大学教育研究
[作者]
王金羽 詹逸思 冯起 李曼丽
信息时代海量增长的文本资料成为质性研究者开展研究的数据宝藏,但未得到充分研究,其原因在于针对海量中文文本数据的有效分析方法尚待突破。文章率先在质性研究范式中使用了以结构主题模型(STM)为代表的人机协同方法,对某大学在线教学效果评估的课堂观察记录数据展开文本挖掘。以教学评估研究数据分析为例,完整呈现了在教育质性研究中应用STM进行数据挖掘的四个步骤,并分析了其在挖掘海量中文文本资料方面的独特优势。研究表明,跨学科研究方法的尝试有助于解决教育学科甚至人文社科领域内海量中文文本在质性分析上的固有难题。
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 情报理论与实践
[作者]
李思静 杨小帆 黄松 彭求明
数字水印是用于网络环境下保护数字媒体版权的一种有效技术 ,而对DCT域的数字水印算法的研究又是其中的热点。本文详细介绍了这其中的两种典型策略。
关键词:
多媒体 版权/数字水印
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 赵捧未
本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。
关键词:
反馈学习 支持向量机 文本分类
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 图书馆论坛
[作者]
张琳 牟向伟
随着互联网的发展,网络电子文本的数量急剧增加,这给人们快速高效地从海量数据中挖掘所需要的信息带来了巨大挑战。文本聚类是解决这个问题的一种可行方法。本文在文本聚类的过程中,针对K-means算法在聚类时需要事先指定簇的个数k和k个初始中心点这两方面的不足,采用Canopy+K-means的聚类算法进行中文文本聚类。也就是为了提高K-means的聚类效果,先使用Canopy算法对数据进行“粗”聚类,在得到k值和聚类中心后再使用K-means算法进行“细”聚类。另外,在聚类过程中,为了避免“维灾难”现象,本文基
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
[期刊] 情报学报
[作者]
韩客松 王永成 滕伟
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。
关键词:
Web页面文本 主题抽取 加权
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 马志辉 孙蕾
本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。
关键词:
支持向量机 文本分类 实证研究
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除