- 年份
- 2024(11283)
- 2023(16530)
- 2022(14589)
- 2021(13686)
- 2020(11772)
- 2019(27612)
- 2018(27533)
- 2017(53282)
- 2016(29281)
- 2015(33435)
- 2014(33628)
- 2013(33261)
- 2012(30550)
- 2011(27545)
- 2010(27577)
- 2009(25396)
- 2008(24920)
- 2007(22202)
- 2006(18987)
- 2005(16430)
- 学科
- 济(117154)
- 经济(117023)
- 管理(83124)
- 业(79530)
- 企(66400)
- 企业(66400)
- 方法(59678)
- 数学(52487)
- 数学方法(51660)
- 农(30996)
- 财(29523)
- 中国(28437)
- 学(27302)
- 业经(24842)
- 地方(22676)
- 贸(21029)
- 贸易(21020)
- 理论(20708)
- 农业(20646)
- 易(20385)
- 制(19767)
- 务(19255)
- 财务(19165)
- 财务管理(19119)
- 和(18540)
- 企业财务(18052)
- 技术(17748)
- 环境(17405)
- 银(16144)
- 银行(16073)
- 机构
- 大学(420581)
- 学院(420232)
- 管理(164962)
- 济(161003)
- 经济(157358)
- 理学(143770)
- 理学院(142155)
- 管理学(139088)
- 管理学院(138368)
- 研究(137949)
- 中国(100699)
- 科学(90827)
- 京(89580)
- 农(75013)
- 财(71794)
- 所(71052)
- 业大(68458)
- 研究所(65321)
- 中心(63234)
- 江(61226)
- 农业(59561)
- 财经(58371)
- 北京(56206)
- 范(54867)
- 师范(54207)
- 经(52918)
- 院(50129)
- 州(49661)
- 经济学(47739)
- 技术(47045)
- 基金
- 项目(291336)
- 科学(226577)
- 基金(209212)
- 研究(206371)
- 家(184488)
- 国家(182974)
- 科学基金(155761)
- 社会(125858)
- 社会科(119097)
- 社会科学(119059)
- 省(115794)
- 基金项目(110911)
- 自然(105518)
- 自然科(103054)
- 自然科学(103021)
- 自然科学基金(101120)
- 划(97742)
- 教育(96753)
- 资助(88497)
- 编号(84874)
- 成果(68032)
- 重点(65710)
- 部(63291)
- 发(61401)
- 创(59992)
- 课题(58754)
- 科研(56773)
- 创新(55979)
- 计划(55075)
- 大学(53917)
- 期刊
- 济(169079)
- 经济(169079)
- 研究(114876)
- 中国(75324)
- 学报(73227)
- 农(66665)
- 科学(64974)
- 管理(58182)
- 财(55403)
- 大学(54281)
- 学学(51241)
- 教育(46640)
- 农业(46074)
- 技术(38715)
- 融(30614)
- 金融(30614)
- 业经(28620)
- 财经(27607)
- 经济研究(27281)
- 业(24432)
- 经(23477)
- 问题(22189)
- 图书(21950)
- 版(21061)
- 技术经济(20891)
- 统计(20880)
- 科技(20261)
- 理论(19430)
- 业大(19013)
- 商业(18723)
共检索到593216条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
张玉峰 何超
为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
[期刊] 情报理论与实践
[作者]
张玉峰 何超
为了提高文本分类的准确性和效率,提出了一种基于潜在语义分析和超球支持向量机的文本分类模型。针对SVM对大规模文本分类时收敛速度较慢这一缺点,本文将超球支持向量机应用于文本分类,采用基于增量学习的超球支持向量机分类学习算法进行训练和分类。实验结果表明,超球支持向量机是一种解决SVM问题的有效方法,在文本分类应用中具有与SVM相当的精度,但是明显降低了模型复杂度和训练时间。
关键词:
文本分类 潜在语义分析 支持向量机
[期刊] 统计与决策
[作者]
刘苗 谢邦昌
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
[期刊] 图书情报工作
[作者]
唐晓波 王洪艳
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 情报理论与实践
[作者]
刘秀松
SVM是一种新的分类工具,可是其核函数在数学上必须满足Mercer条件,使得具有良好全局分类性能的Sigmoid函数在SVM中应用受到限制。本文将Sigmoid核函数与云模型相结合,提出一种简单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时间。
关键词:
云模型 支持向量机 文本分类
[期刊] 情报学报
[作者]
牛奉高 张亚宇
实现数字图书馆资源聚合的知识发现离不开对知识的有效表示。作为经典的文本表示模型,向量空间模型(VSM)及其衍生模型在信息检索以及知识发现等研究中都有着重要的地位,但依然存在不足。共现潜在语义向量空间模型(CLSVSM)作为新的文本表示模型,与VSM相比明显提高了文本聚类的精度。然而,面对文本大数据的应用,共现矩阵维度往往较高,致使模型的计算复杂度也较大。因此,本文在CLSVSM基础上构建了语义核(CLSVSM_K),构建的原理是基于潜在语义分析(LSA)的思想。CLSVSM_K不仅降低了共现矩阵的维度,而
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 情报杂志
[作者]
牛奉高 李星
[目的/意义]文献的向量表示是文献聚类的首要任务。共现潜在语义向量空间模型(CLSVSM)通过共现分析挖掘特征词对间的最大潜在语义信息对向量空间模型(VSM)进行了语义补充,与向量空间模型相比明显提高了中文文献的聚类性能。然而,对该模型的研究还有待深入:该模型对英文文献的聚类适用性尚需检验;是否可以考虑利用除max统计量以外的其它统计量构建模型?聚类效果又会如何?面对大量的文献数据,模型的维度往往较高,运算成本大,所以有必要对模型进行优化处理。[方法/过程]首先将CLSVSM用于对英文文献集(数据来源于W
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 马志辉 孙蕾
本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。
关键词:
支持向量机 文本分类 实证研究
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 现代情报
[作者]
廖列法 勒孚刚 朱亚兰
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。
[期刊] 中南林业科技大学学报
[作者]
陈宇 许莉薇
为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
[期刊] 林业科学
[作者]
郭飞龙 徐刚标 卢孟柱 孟艺宏 袁承志 郭恺琦
【目的】胡杨是干旱区的主要建群种,对维持干旱地区的生态环境稳定具有重要意义。探讨限制胡杨分布的主导环境变量,模拟胡杨潜在适宜分布区,可为胡杨资源保护与恢复提供理论依据。【方法】基于全球胡杨226个现有居群分布地理信息以及4类综合环境变量(气候、地形、土壤、水文),采用MaxEnt模型,模拟胡杨潜在适宜分布区;综合使用受试者工作特征曲线、刀切法、环境变量贡献率及置换重要值,分析MaxEnt模型可信度,比较采用单一气候变量与4类综合环境变量模拟结果的准确性,探讨制约胡杨地理分布的环境变量。【结果】1)受试者工作特征曲线下的面积(AUC值)显示,基于气候变量与4类综合环境变量的MaxEnt模型训练集分别为0. 983±0. 002、0. 982±0. 001,验证集分别为0. 980±0. 006、0. 967±0. 009,表明2种不同变量参数的数据集对AUC值影响较小,模拟效果好,可信度高。2)基于环境变量贡献率、置换重要值以及刀切法检验的结果,采用4类综合环境变量进行MaxEnt模型模拟,可挖掘影响胡杨分布的更多有效环境变量,胡杨地理分布主要受最干月份降水量、最热季节降水量、10~40 cm土壤含水量、根部土壤湿度、土壤水分蒸发量等4类综合环境变量影响; 3)基于气候变量模拟的胡杨适宜分布面积是4类综合环境变量模拟结果的4. 33倍,4类综合环境变量模拟的胡杨适宜分布区能够体现胡杨沿河岸分布的细节特征。4)基于MaxEnt模型模拟的胡杨适宜分布面积远大于胡杨的实际分布面积,暗示着胡杨人工林具有较大的发展潜力。【结论】胡杨地理分布受多种环境变量影响,仅以气候变量模拟的胡杨适宜分布区与实际分布范围存在较大偏差。4类综合环境变量模拟的结果,更能反映胡杨现实居群的分布特征。本研究结果可为退化的胡杨林保护、修复提供理论参考。
关键词:
胡杨 MaxEnt 环境变量 适宜分布区
[期刊] 情报学报
[作者]
吴鹏 李婷 仝冲 沈思
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除