- 年份
- 2024(5323)
- 2023(7790)
- 2022(6616)
- 2021(6252)
- 2020(5334)
- 2019(12191)
- 2018(11946)
- 2017(23344)
- 2016(12210)
- 2015(13683)
- 2014(13078)
- 2013(12547)
- 2012(11152)
- 2011(9653)
- 2010(9078)
- 2009(7826)
- 2008(7221)
- 2007(5734)
- 2006(4519)
- 2005(3393)
- 学科
- 济(47812)
- 经济(47771)
- 管理(33826)
- 业(33277)
- 企(27603)
- 企业(27603)
- 方法(26927)
- 数学(24754)
- 数学方法(24355)
- 财(12751)
- 农(12169)
- 中国(10644)
- 学(9829)
- 业经(9559)
- 务(8638)
- 财务(8602)
- 财务管理(8586)
- 企业财务(8203)
- 农业(8198)
- 贸(8075)
- 贸易(8072)
- 地方(8069)
- 易(7880)
- 技术(7659)
- 环境(7252)
- 制(7056)
- 和(6873)
- 理论(6580)
- 划(6256)
- 银(5976)
- 机构
- 大学(160133)
- 学院(159864)
- 管理(68045)
- 济(66933)
- 经济(65865)
- 理学(60583)
- 理学院(60035)
- 管理学(58875)
- 管理学院(58583)
- 研究(48475)
- 中国(35932)
- 京(31625)
- 科学(30370)
- 财(29291)
- 业大(25576)
- 财经(24792)
- 中心(24118)
- 农(23933)
- 经(22908)
- 所(22030)
- 江(21297)
- 经济学(20974)
- 研究所(20698)
- 院(19301)
- 范(19237)
- 经济学院(19198)
- 财经大学(19049)
- 师范(19020)
- 经济管理(18876)
- 北京(18870)
- 基金
- 项目(124357)
- 科学(100252)
- 基金(93889)
- 研究(88219)
- 家(82799)
- 国家(82209)
- 科学基金(72157)
- 社会(57761)
- 社会科(54971)
- 社会科学(54958)
- 基金项目(50387)
- 自然(48567)
- 省(47626)
- 自然科(47490)
- 自然科学(47481)
- 自然科学基金(46621)
- 教育(40986)
- 划(40588)
- 资助(37872)
- 编号(34047)
- 重点(28359)
- 部(27952)
- 创(26395)
- 发(26115)
- 科研(25148)
- 国家社会(24736)
- 创新(24731)
- 成果(24728)
- 教育部(24436)
- 人文(23757)
共检索到207271条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
徐少成 李东喜
文章提出了一种基于随机森林的加权特征选择算法WRFFS。算法以随机森林为基础,以分类精度作为筛选特征子集的标准,通过在数据集上构造多棵决策树,采用交叉验证的方式进行特征的重要性度量,各决策树的权重和特征重要性度量加权求和决定了最终的特征重要性排序,然后再采用序列后向选择法(Se-quential backward selection,SBS)进行特征的筛选,其中决策树的权重由该决策树与预测结果的相符程度来决定。最后,通过对比实验表明该方法WRFFS比已有文献中方法具有更好的分类性能。
关键词:
高维数据 随机森林 加权特征选择 封装式
[期刊] 统计与决策
[作者]
吴辰文 梁靖涵 王伟 李长生
基于随机森林算法中的相关预测因子进行变量选择,在高维回归或分类框架中,变量选择是一项艰巨的任务,甚至在高度相关的预测中变得更加具有挑战性,文章提供了在回归模型上置换重要性测量的理论研究,这使我们能够描述相关性预测和排名的重要性之间的影响。相比于原始随机森林算法使用重要性排名做变量选择,研究结果使用了递归特征消除(RFE)方法做变量选择。通过实验证明了RFE-RF方法对机器学习算法的正确预测有很大的帮助。
[期刊] 数量经济技术经济研究
[作者]
马晓君 董碧滢 王常欣
研究目标:根据企业财务比率数据,将企业经营状况通过评级机构所公布的信用级别反映出来。研究方法:本文针对传统随机森林模型在投票机制中存在的弊端,通过改进指标选取、重要性排序及算法优化三个方面,创新性地将PSO算法运用于基于加权随机森林模型的企业信用评级中,并对2016年2840家中国上市企业的财务数据进行应用分析。研究发现:采用PSO优化加权随机森林模型的上市公司信用评级准确率有所提高;其评级准确率普遍优于传统的决策树、支持向量机和随机森林模型;制造业企业信用评级状况不佳,被标记为财务危险的企业占比较多。研究创新:在企业信用评级领域提出一种基于PSO优化加权随机森林模型。研究价值:为完善企业信用评级体系提供新思路。
[期刊] 会计之友
[作者]
朱卫东 苏剑 武子豪
当前关于高管特征与真实盈余管理的研究大部分聚焦于高管某一特征与真实盈余管理的关联,缺乏对高管特征全面的研究;此外,当前主要是基于因果关系的推断式研究,鲜有从预测角度进行定量研究。文章以2010—2020年A股上市公司为样本,用随机森林以更加全面的视角研究高管特征对真实盈余管理的预测作用,并进一步分析对真实盈余管理预测能力影响较强的高管特征及其预测模式。研究发现:高管特征对真实盈余管理有预测作用,但其作用弱于公司自身特征;分企业性质看,民营企业高管特征比国有企业高管特征预测真实盈余管理的能力更强;在众多高管特征中,高管薪酬对真实盈余管理预测能力的影响最强,且与真实盈余管理呈现负相关关系。文章研究结论对监管真实盈余管理行为具有一定的实践意义。
关键词:
高管特征 真实盈余管理 随机森林
[期刊] 中国科学技术大学学报
[作者]
文泽波 康宇 曹洋 魏梦 宋卫国
利用随机森林算法,提出了一种基于随机森林特征选择的视频烟雾检测方法.首先,提取四种表征烟雾的特征:RGB颜色特征,小波变换高频子图,多尺度局部最大饱和度,多尺度暗通道;其次,根据烟雾图像信息模型利用无烟图片合成烟雾图片并分块得到随机森林训练样本;第三,训练随机森林进行特征选择并通过训练支持向量机得到识别烟雾块和非烟雾块的分类器,并由此得到视频图像帧的疑似烟雾区域;最后通过视频烟雾区域的凸形度和增长率分析,得到烟雾检测的结果。实验结果表明,该方法能够及时的预警烟雾同时降低火灾预警的误报率.
[期刊] 首都经济贸易大学学报
[作者]
曹正凤 纪宏 谢邦昌
文章通过比较分析价值策略和成长策略,提出了以价值成长投资策略(GARP)理念为基础的选股模型指标体系,选用了2012年1月至2013年2月间360多支股票的4406个样本数据,通过等频算法对数据进行离散化预处理后,使用随机森林算法实现了较高正确率的股票分类,投资者可以据此判断是否继续持有股票。通过分析优选后的股票在行业平均收益、最值方面的实际表现,验证了该量化选股模型性能优异。
[期刊] 中南林业科技大学学报
[作者]
熊向阳 杨小周 赵银超 李伟坡
【目的】准确地估测森林地上生物量(above ground biomass,AGB)对大区域森林资源调查和管理至关重要,机器学习算法能实现森林AGB高精度估测,但超参数的设置能直接影响模型效果。为了提升模型的构建效率和预测精度,研究通过构建超参数优化的机器学习算法进行森林AGB估测,并比较不同超参数下的模型误差变化。【方法】以西藏自治区江达县天然林为研究对象,利用森林资源调查数据提取实测森林AGB数据,结合Sentinel-2多光谱影像提取遥感变量。采用逐步回归法和Boruta法分别进行遥感变量筛选,构建多元线性回归模型、支持向量机模型和随机森林模型进行森林AGB反演。此外,对支持向量机模型和随机森林模型进行超参数优化,以提高模型反演精度。【结果】1)随机森林模型在所有反演模型中实现了最佳的估测精度,模型决定系数达到了0.63,同时实现了最低的均方根误差和相对均方根误差,分别为28.06 t/hm~2和23.03%。均方根误差相比多元线性回归模型和支持向量机模型分别降低了22.2%和12.1%。2)超参数优化可以有效地提高模型估测精度。通过分析不同参数组合下的误差变化趋势,确定最佳的参数组合,能有效地降低模型估测误差。3)较高的森林AGB值主要分布在东部、南部和东南部地区,中部地区和北部部分地区森林AGB值较小。超参数优化的随机森林模型森林AGB反演结果与研究区实际森林分布情况具有较好的一致性,整体反演效果较好。【结论】利用超参数优化的随机森林模型结合Sentinel-2遥感影像能实现较好的森林AGB反演效果,能为森林资源动态监测提供有效参考。
[期刊] 资源科学
[作者]
何云 黄翀 李贺 刘庆生 刘高焕 周振超 张晨晨
中南半岛地处热带、亚热带地区,由于水热条件适宜,植被生长旺盛,土地利用强度高,地表覆盖类型的光谱特征时空变异复杂,使用传统的基于光谱特征的遥感分类精度难以保证。Sentinel-2A卫星遥感数据具有较丰富的光谱波段和较高的空间分辨率,为土地覆盖遥感分类提供了多维特征空间。但多维特征参与分类容易造成信息冗余,从而导致分类速度和精度降低。因此,如何充分利用Sentinel-2A数据丰富的光谱和空间信息,并通过高维特征空间降维进行特征优选对于提高分类精度具有重要意义。本文以中南半岛典型地区土地覆盖分类为例,利用Sentinel-2A多波段光谱特征,归一化植被指数(NDVI)、比值植被指数(RVI)、差值植被指数(DVI)、归一化水体指数(NDWI)等指数特征以及对比度、相关性、能量、均值、熵等纹理特征,在随机森林模型框架下,采用平均不纯度减少方法对不同特征在土地覆盖分类中的重要程度进行识别;利用袋外(OOB)误差方法,对重要特征组合进行了优选;利用优选特征进行随机森林土地覆盖分类,并与原始随机森林分类结果进行对比。结果表明:Sentinel-2A影像的光谱特征和纹理特征在土地覆盖分类中具有较为重要的作用,光谱特征中短波红外、可见光、植被红边波段重要性较大,纹理特征中均值、能量法重要性较高。选择重要性列前9位的特征参与分类时,OOB精度达到最高;继续增加特征会使模型复杂度过高,容易发生过拟合而使得分类精度不增反降。通过特征优选高效利用了Sentinel-2A丰富的光谱和纹理信息,其总体分类精度达87.53%,Kappa系数达0.8461,优于原始随机森林方法,一定程度上提高了热带亚热带地区复杂土地覆盖分类精度。
[期刊] 中南林业科技大学学报
[作者]
卫格冉 李明泽 全迎 王斌 刘建阳 明烺
【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导意义。【方法】以黑龙江省小兴安岭、长白山地区森林植被碳储量为研究对象,基于2015年森林资源连续清查数据和Landsat8-OLI影像,采用普通最小二乘(Ordinary least squares,OLS)、随机森林(Random forest,RF)模型、地理加权回归(Geographically weighted regression,GWR)模型以及地理加权随机森林模型分别构建不同林型及总体(不分林型)的森林碳储量估测模型,比较是否区分林分类型时,不同模型预测精度之间的差异,实现对研究区森林碳储量的精准反演。【结果】1)各个模型在区分林型时的预测精度均高于总体(不分林型)情况,以GWRF模型精度最优,其中针叶林精度最高(R2=0.58,RMSE=15.97 t/hm2);阔叶林次之(R2=0.46,RMSE=17.66 t/hm2);针阔混交林随后(R2=0.45,RMSE=19.51 t/hm2);总体(不分林型)最低(R2=0.40,RMSE=20.22 t/hm2)。2)4种模型的检验精度GWRF>RF>GWR>OLS。与OLS相比,GWRF在针叶林、阔叶林、针阔混交林和总体(不分林型)中提升的ΔR2分别为0.15、0.09、0.16和0.04;降低的ΔRMSE分别为2.09、1.35、3.47和0.89 t/hm2;与RF相比,GWRF提升的ΔR2分别为针叶林0.14、阔叶林0.06、针阔混交林0.04、总体(不分林型)0.02;降低的ΔRMSE分别为针叶林1.95 t/hm2、阔叶林0.86 t/hm2、针阔混交林0.67 t/hm2、总体(不分林型)0.29 t/hm2。3)研究区森林碳储量密度最高预测值为77.08 t/hm2,最低值为5.24 t/hm2,平均值为41.07 t/hm2,总量为552.04 Tg;从空间上看,森林碳储量高值分布在小兴安岭东南部、张广财岭等地区,呈现斑状不均匀性分布。【结论】相比于其他3种模型,GWRF作为局部模型,考虑到空间异质性,在区域尺度范围内估测森林碳储量有较好的应用前景。区分林分类型能提高预测精度,在今后对森林生物量或碳储量的研究中,应考虑区分林分类型建模。本研究的模型和方法有一定适应性,可为森林资源的快速和精准监测提供方法借鉴。
[期刊] 物流技术
[作者]
杨从亚 陈占伟 徐海峰
以智能终端为研究对象,将动态定位作为研究目标,根据数据获取、预处理、特征提取和选择,分类器设计与分类决策等五个方面提出了基于随机森林的定位模型和算法,详细论述了算法的执行流程,并通过用户测试数据仿真对模型进行了验证,结果表明该模型的定位算法结果准确率在90%左右。
关键词:
随机森林 智能终端 定位 算法
[期刊] 统计与决策
[作者]
曹桃云
对随机森林做修剪的目的就是要把随机森林中重要的分类器找到,使得修剪后得到的子森林不仅具有可解释性,而且能充分利用数据的信息量。文章提出一种新的修剪随机森林方法,基于样本的边缘函数,采用逐步向后算法,得到嵌套子森林,采用1-se法则挑选最优子森林。在两份实际数据中和已有随机森林的修剪方法做了对比,结果表明,所提出的方法,在修剪后子森林预测率的分布和子森林中分类器个数的分布,以及选出的解释变量三个指标上均具有优势。
[期刊] 华中农业大学学报
[作者]
周紫燕 黄魏 许伟 傅佩红 望陈运
以湖北省黄冈市红安县华家河镇滠水河流域为研究区,利用随机森林算法(random forest,RF)结合多源环境变量,对研究区原有的土壤图斑进行分解制图,将混合多种土壤类型的复合土壤图斑进行细化,在土壤多边形内部画出新的边界来代表单一土壤类型,并通过373个实地采样点验证更新后的土壤图。结果显示,更新后的土壤图其制图精度从原有的63%提高到了76%,展现了更为详细的空间细节和空间变化信息,表明利用随机森林算法进行数字土壤制图的可行性和可靠性。
[期刊] 华中农业大学学报(社会科学版)
[作者]
罗丽
扶贫对象的精准识别是实现精准扶贫的重要条件。实现贫困数据的精准分类与识别以及贫困识别由定性到定量、由单维瞄准向多维瞄准的转变是精准扶贫的重要基础。精准识别可以采用大数据分析中的分类算法实现。本文基于可持续生计分析框架,从人力资本、社会资本、自然资本、物质资本、金融资本和生计环境六个方面建立了多维贫困指标体系,运用随机森林算法构建了精准识别模型,并采用中国家庭追踪调查数据(CFPS),对扶贫对象精准识别模型的分类及识别效果进行了评价,结果表明模型效果良好。
[期刊] 林业科学
[作者]
梁慧玲 林玉蕊 杨光 苏漳文 王文辉 郭福涛
[目的]应用逻辑斯蒂回归模型和随机森林算法建立大兴安岭塔河地区林火发生的预测模型并对比模型预测精度,判断随机森林算法在该地区林火预测中的适应性,为该地区林火管理工作提供技术支持。[方法]利用1974—2008年大兴安岭塔河地区森林火灾发生数据,分别运用二项逻辑斯蒂回归模型和随机森林算法,对塔河地区林火发生与气象因子之间的关系进行实证分析。为减少训练样本分布对试验结果的影响,将全样本数据随机分成60%的训练样本和40%的测试样本,并且进行5次重复,建立5个中间模型(样本组)。选择在5个中间模型中的3个及以上的显著变量(因子)对全样本数据进行分析并分别比较2种模型算法在5个中间模型和全样本模型中的...
[期刊] 统计与决策
[作者]
赵浩 鲁亚军 高洁 张汝飞
针对企业财务风险研究指标数据中常常存在不平衡现象造成模型算法预测精度较差的问题,文章通过构造基于指导性正则化随机森林的SMOTEBoost算法分析企业财务风险因素,以此提升企业财务风险预测准确性,同时筛选出显著影响企业发生财务风险的特征变量。数值模拟结果发现SMOTEBoost-GRRF算法预测精度好于其他算法,且具有较优的特征变量筛选能力。实证研究结果发现每股资本公积金、营运资金、营业总成本/营业总收入、每股收益增长率四种指标是最能显著影响企业发生财务风险的因素。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除