标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(9026)
2023(13128)
2022(11584)
2021(10832)
2020(9112)
2019(21063)
2018(20812)
2017(40564)
2016(21681)
2015(24437)
2014(24117)
2013(23485)
2012(21181)
2011(18746)
2010(18271)
2009(16164)
2008(15274)
2007(12756)
2006(10697)
2005(8688)
作者
(60324)
(50231)
(49828)
(47496)
(31888)
(24151)
(22678)
(20006)
(19140)
(17495)
(17281)
(16726)
(15714)
(15587)
(15553)
(15108)
(15052)
(14979)
(14265)
(14232)
(12366)
(12076)
(12066)
(11470)
(11197)
(11034)
(10946)
(10884)
(9961)
(9943)
学科
(82606)
经济(82517)
管理(61597)
(58228)
(49008)
企业(49008)
方法(43005)
数学(37979)
数学方法(37438)
(21521)
(20955)
中国(19765)
(18876)
业经(18200)
地方(15969)
农业(14494)
(14199)
贸易(14194)
理论(14032)
(13963)
技术(13922)
财务(13894)
财务管理(13867)
(13768)
(13464)
环境(13292)
企业财务(13154)
(12664)
(11545)
(10638)
机构
大学(297228)
学院(295583)
管理(123024)
(113276)
经济(110836)
理学(108484)
理学院(107343)
管理学(105273)
管理学院(104759)
研究(93190)
中国(67031)
(61667)
科学(60368)
(49771)
业大(46469)
(45936)
(44822)
中心(43367)
研究所(41677)
财经(41604)
(40068)
(38887)
师范(38489)
(38137)
北京(37940)
农业(36129)
(35030)
经济学(33543)
(32892)
财经大学(31516)
基金
项目(219151)
科学(173163)
基金(160414)
研究(157966)
(140261)
国家(139158)
科学基金(120735)
社会(98610)
社会科(93455)
社会科学(93430)
基金项目(86441)
(85321)
自然(81061)
自然科(79203)
自然科学(79185)
自然科学基金(77723)
教育(72841)
(72246)
资助(65429)
编号(64408)
成果(49777)
重点(48959)
(48004)
(45891)
(45814)
课题(43034)
科研(42745)
创新(42728)
教育部(41220)
大学(40961)
期刊
(111770)
经济(111770)
研究(79931)
学报(47968)
中国(47134)
科学(44304)
管理(42717)
(39954)
大学(36705)
(36570)
学学(34629)
教育(30791)
农业(28407)
技术(26625)
业经(19331)
(18978)
金融(18978)
财经(18852)
经济研究(17818)
图书(16094)
(15938)
科技(15212)
问题(14693)
理论(14419)
(14171)
资源(14112)
技术经济(13781)
(13723)
实践(13481)
(13481)
共检索到398919条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 数据分析与知识发现  [作者] 贾杉杉  刘畅  孙连英  刘小安  彭涛  
【目的】为了准确地给专利申请书分配IPC分类号,本文提出一种基于多特征多分类器集成的专利自动分类方法。【方法】使用从专利申请书中提取的全词典TFIDF特征、信息增益词典TFIDF特征、段落向量特征、主题模型向量特征,分别训练朴素贝叶斯、支持向量机、AdaBoost分类器,以此构建特征–类别矩阵,并结合F1权重矩阵集成,获得最终IPC预测分类号。【结果】对2014年–2016年"发动机或泵"领域的10个小类进行分类,使用Top Prediction、All Categories和Two Guesses三种评
[期刊] 西南农业学报  [作者] 李金朝  买买提·沙吾提  
【目的】将多种分类器的优点融合,以便提升遥感影像作物信息提取的精度。【方法】以渭库绿洲为研究区,利用国产高分2号(GF-2)数据和野外调查数据,基于提取的遥感识别特征制定不同分类方案,采用马氏距离(MsDC)、最小距离(MDC)、最大似然(MLC)、神经网络(NNC)、支持向量机(SVM)5种传统机器学习方法分别对6种特征组合方案的影像进行分类,然后选择基分类器,并应用多数投票法和保守投票法两种多分类器集成算法,对研究区农作物进行精细分类提取。【结果】①辅助特征的加入对于子分类器的精度提高明显。5种分类器中除了MLC,其余4种分类器都是在加入NDVI和纹理特征后取得了最高精度。②基分类器中精度最高的是NNC-4(人工神经网络的第4种特征组合方案),OA达到83.54%,Kappa系数为0.77。③相比基分类器,多分类器集成方法能够在制图精度和用户精度两方面提高农作物的提取精度。并且保守投票法优于多数投票法,OA为85.89%,Kappa系数为0.80。④集成分类结果中除了棉花的识别精度与最优基分类器NNC-4相等,达到94.94%外,其他的农作物如套种棉花、玉米、套种玉米、核桃园的识别精度都高于NNC-4,其中套种玉米与核桃园的提取效果较好,精度分别达到86.05%、79.09%;对于套种棉花的提取较差,只有63.86%;玉米的提取最差,只有12.17%。【结论】本文应用GF-2数据,基于多分类器集成方法对复杂背景下的多种作物及种植结构进行精细提取研究,拓展了作物信息提取的方向和GF-2数据的应用领域。
[期刊] 图书情报工作  [作者] 乔建忠  
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。
[期刊] 统计与决策  [作者] 曹玉茹  高洋洋  
在回归问题中,惩罚特征即正则化是特征处理的常用方式。但在集成分类问题中,惩罚特征以改善训练效果的研究较少。文章提出一种基于GBDT模型训练的SHAP值对各样本特征惩罚加权,进而提升分类精度的集成模型;其中,对于测试样本的SHAP值估计,通过其与训练集的样本距离权重结合训练集的SHAP矩阵近似得到。实验结果表明:选择GBDT_SHAP值惩罚特征后,模型的预测精度均有显著提升,验证了该算法的有效性。以GBDT_SHAP_GBDT模型为例,其在多组经典数据集上的分类效果良好,且在不平衡数据集上性能突出;若干组仿真实验表明,该方法能使模型快速达到较优且较为稳定的拟合效果,鲁棒性较强。
[期刊] 情报理论与实践  [作者] 蒋雨肖  丁晟春  吴鹏  
信息传播正逐渐从文本、图像、音频、视频等单模态形式过渡到相互融合的多模态形式,且数据量飞速扩张。大规模数据需要庞大的存储空间,如何对海量的文本、图像等多模态数据进行有效分类变得至关重要。文章提出一种基于深度学习的多模态语义特征分类模型,解决图像文本形式的多模态数据的分类问题。在该模型中,利用BiLSTM(双向长短期记忆模型)设计文本特征提取模型,利用VGG16卷积神经网络设计图像特征提取模型,将两类深度神经网络提取出的文本特征与图像特征进行特征融合,进而实现多模态信息的分类。在NUS-WIDE公开数据集上的实验结果证明了该方法的有效性。
[期刊] 数据分析与知识发现  [作者] 杨爽  陈芬  
【目的】为更精确地识别网民态度,监测网络舆情,提出一种基于SVM多特征融合的情感5级分类方法。【方法】从词性特征、情感特征、句式特征、语义特征4个方面,提取动词、名词、情感词、否定词等14个特征,运用SVM方法对微博情感进行5级分类。【结果】实验结果表明,该方法对情感5级分类的准确率为82.40%,召回率为81.91%,F值为82.10%。【局限】训练语料的规模有待进一步提高。【结论】该方法在情感5级分类方面取得较好的效果。
[期刊] 图书情报工作  [作者] 甘小红  张兆年  
提出一种具有特征级别的领域特征集合的情感资源挖掘方法,将基于HowNet词典的分类法构建的情感特征与基于机器学习的特征分类方法中的无内容特征以及领域特征相融合,并将该集合放入支持向量机中进行情感分类实验,实验结果表明,使用抽取模式以及多特征融合的分类方法,可增强中文情感分类效果,验证两种分类方法综合研究的正确性与有效性,弥补目前特征级别的中文情感分类研究的不足。
[期刊] 管理评论  [作者] 张婷婷  贺昌政  肖进  
在管理决策的制定中,分类已经成为一种十分重要的方法和技术。由于现实客户数据常常是不完整的,因此,研究不完整数据的客户分类问题具有重要意义。通过分析以往分类过程中对不完整数据的处理方法,提出了一种基于动态分类器集成选择的不完整数据分类方法DCES-ID。分别在UCI客户分类数据集以及某券商客户数据集上进行分类的实验和实证分析。结果表明,与已有的6种分类算法相比,DCES-ID算法具有更高的分类准确性及稳定性,能够更有效地进行客户分类。
[期刊] 统计与决策  [作者] 宋磊  
为了解决支持向量机算法在大样本处理的"过学习"现象,文章设计出在并行系统中使用的多分类器支持向量机算法,应用多支持向量机分类器系统代替单一分类器,解决了大样本数据集上学习内存开销大、训练速度慢的缺点;同时,提出了一种自组织选择性融合算法,根据终止法则找到最优复杂度的融合模型,自主更新各分类器并调整其分类性能,把各分类器的分类结果融合为最终的分类,有效解决了大样本多分类器融合受子样本分布状态影响、各分类器学习能力相差过大的缺点,从而提高了训练效率和分类效率。
[期刊] 情报理论与实践  [作者] 缪建明  贾广威  张运良  
随着我国专利申请数量的迅猛发展,对受理专利实现快速分类的需求也越来越迫切。作为专业性知识极强的科技文献,专利自动分类的正确率远高于普通文本的分类效果。基于专利摘要进行快速自动分类的方法,充分考虑专利类别的层次结构特性,建立不同层次的类别特征中心向量,采用经典的类中心向量分类算法实现专利的快速自动分类。实验结果表明:该方法在专利不同层次上的分类效果明显,时效性大大提高,能够满足专利快速分类的实际需求。
[期刊] 预测  [作者] 肖进  贺昌政  
目前大多数客户流失预测研究常采用单一预测模型。因此,本文将动态分类器组合与自组织数据挖掘理论(SODM)相结合,提出了基于SODM的动态分类器集成方法。以国内、国外电信公司客户流失预测数据为例,并与单一的预测模型以及已有的动态分类器组合方法进行了详细对比,发现该方法能在很大程度上提高客户流失预测的准确率、命中率以及提升系数,是进行客户流失预测的有效工具。
[期刊] 情报学报  [作者] 刘开瑛  郑家恒  刘静  
本文介绍基于《中国档案分类法金融档案分类表》(以下简称《金融档案分类表》)的中文文本自动分类算法。提出了类别词概念,介绍了类别词库和分类规则词库建造法以及自动分类的三维加权算法等内容。经过对真实金融档案文本测试,自动分类正确率可达81%以上。
[期刊] 情报理论与实践  [作者] 王昊  邓三鸿  苏新宁  
关键词:
[期刊] 情报理论与实践  [作者] 包翔  刘桂锋  杨国立  
[目的/意义]为了满足对海量专利数据进行自动分类的需求,提出了一种基于多示例学习框架的专利文本分类方法。[方法/过程]将专利文本当作包,专利文本的标题和摘要分别作为两个示例,通过数学建模将专利文本映射成无向图,构建基于无向图的高斯核函数,运用SVM方法训练分类器,完成对无标记专利文本的预测。[结果/结论]实验结果表明,该方法相较于传统的SVM、KNN方法能更加有效准确地预测未标记专利文本的分类,为文本挖掘领域相关方向的研究提供新的视角。[局限]实验样本数量有待进一步丰富。
[期刊] 林业科学  [作者] 周小成  郑磊  黄洪宇  
【目的】以无人机可见光遥感影像为数据源实现竹林、针叶林和阔叶林的分类识别,扩展无人机可见光遥感数据在森林资源调查中的应用范围。【方法】利用无人机获取仅包含红、绿、蓝3个波段光谱信息的航拍影像,经预处理生成空间分辨率为0.1 m的数字正射影像图(DOM)和数字表面模型(DSM),从DSM和DOM中提取包括高度特征、光谱特征、常见的可见光植被指数、HSV颜色分量、HSV颜色分量基础上提取的纹理特征以及扩展的形态学多属性剖面(EMAPs) 6类特征;采用递归特征消除随机森林算法(RF_RFE)优选特征子集,根据不同类型特征和优选特征子集设置8组试验,使用随机森林分类器(RFC)进行林分类型分类,运用目视解译获得的地面真实影像建立混淆矩阵评价分类结果。【结果】1)单独利用光谱特征进行林分类型分类效果不理想,总体精度为65.68%,Kappa系数为0.53;以光谱特征为基础单独引入其他特征进行林分类型分类,除植被指数外,其他特征均可提高总体分类精度; 2)采用递归特征消除随机森林算法优选出11个特征,包括5个EMAPs特征、3个HSV纹理特征、1个高度特征、1个植被指数和1个HSV颜色分量,11个特征组合获得8组试验中最高分类精度,总体精度为81.05%,Kappa系数为0.73; 3)将多特征优选方法应用于不同分辨率的可见光无人机影像上均取得较好分类结果,其中分辨率为0.3 m时分类精度最高,总体精度为82.46%,Kappa系数为0.75。【结论】递归特征消除随机森林算法综合多类型特征中最有利于林分类型分类的特征,从而提高分类精度,研究结果可为无人机可见光遥感数据在森林资源调查中林分类型信息的提取提供参考。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除