- 年份
- 2024(2367)
- 2023(3278)
- 2022(2800)
- 2021(2551)
- 2020(2258)
- 2019(5242)
- 2018(5147)
- 2017(9615)
- 2016(5298)
- 2015(5842)
- 2014(5592)
- 2013(5527)
- 2012(5041)
- 2011(4575)
- 2010(4596)
- 2009(4181)
- 2008(4161)
- 2007(3697)
- 2006(3300)
- 2005(2871)
- 学科
- 济(23738)
- 经济(23724)
- 管理(16371)
- 方法(14218)
- 数学(12848)
- 数学方法(12572)
- 业(12436)
- 企(9807)
- 企业(9807)
- 中国(5377)
- 资源(5370)
- 财(5369)
- 学(5362)
- 农(4711)
- 和(4636)
- 业经(4195)
- 环境(4107)
- 地方(3507)
- 农业(3466)
- 务(3414)
- 财务(3397)
- 财务管理(3388)
- 企业财务(3264)
- 发(3155)
- 理论(3145)
- 制(3064)
- 技术(3045)
- 人事(3033)
- 人事管理(3032)
- 信息(3002)
- 机构
- 大学(77191)
- 学院(74843)
- 管理(30268)
- 济(29944)
- 经济(29290)
- 理学(26140)
- 理学院(25855)
- 研究(25163)
- 管理学(25063)
- 管理学院(24928)
- 中国(20015)
- 科学(17304)
- 京(17302)
- 财(13268)
- 所(13085)
- 中心(12809)
- 农(12588)
- 研究所(12085)
- 业大(11817)
- 财经(11226)
- 北京(10811)
- 江(10645)
- 经(10236)
- 农业(10085)
- 经济学(9645)
- 范(9395)
- 师范(9317)
- 院(9187)
- 经济学院(8824)
- 州(8691)
- 基金
- 项目(55179)
- 科学(43297)
- 基金(41269)
- 研究(37159)
- 家(37086)
- 国家(36869)
- 科学基金(31669)
- 社会(23979)
- 社会科(22974)
- 社会科学(22966)
- 自然(21381)
- 基金项目(20937)
- 自然科(20825)
- 自然科学(20821)
- 自然科学基金(20401)
- 省(20025)
- 资助(18231)
- 划(17380)
- 教育(16412)
- 编号(15044)
- 重点(12292)
- 部(12181)
- 成果(11887)
- 发(11180)
- 国家社会(11032)
- 科研(11011)
- 创(10622)
- 计划(10427)
- 教育部(10123)
- 创新(10048)
共检索到108038条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
张峰 宋晓娜 薛惠锋 王海宁
可靠完整的水资源消耗历史时序数据是对其进行准确预测的基本前提。文章在参考现有数据异常值检测与缺失值处理方法的基础上,选取偏最小二乘法提取水资源消耗及社会经济相关指标数据主成分,并绘制其累计贡献度的Q2椭圆图辨识其存在的异常值,利用最小残差回归法对含有实际突变的时序数据进行预测分析,再构建基于粒子群优化的最小二乘支持向量机模型对其缺失数据进行填补。结果表明,通过偏最小二乘测算出主成分累计贡献度及绘制Q2椭圆图方法可借助异常值对整体数据的拉伸效应实现对异常点的检测;基于最小残差回归法对含有水资源消耗突变数据序列的预测要比传统最小二乘回归具有更高的精度;而运用粒子群优化的最小二乘支持向量机可进一步提升数据拟合效果,实现对水资源消耗缺失数据的合理填补。
[期刊] 林业科学
[作者]
宋维 高超 赵玥 赵燕东
【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据,分别使用插值方法、RNN神经网络、LSTM神经网络对缺失部分进行填补,填补结果与原始数据比对并分析结果。基于神经网络预测值误差随预测时刻推后而增大的误差分布情况,本文提出了在神经网络预测值基础上加入对数据后期处理的方法:从缺失数据的正向和反向进行预测,将2个方向的预测值各自乘以一组按照预测时刻递减的权重值并相加,结合2个预测方向的优势,进一步提高预测准确度。【结果】3种方法中,RNN与LSTM神经网络方法较传统的插值方法优势明显:插值方法准确度在缺失值增多时迅速下降;神经网络方法下降速度较慢。当填补值与真实值误差在2%以内作为准确时,插值方法的填补准确率不足50%,RNN方法达到50%且不足60%,LSTM方法达到80%以上;当填补值与真实值误差在4%以内作为准确时,插值方法填补准确率为60%,RNN方法准确度最高达到90%,LSTM方法准确率在95%以上。在此基础上加入权重处理,对LSTM预测结果处理后误差在2%以内准确率达到97%,误差在3%以内准确率达到100%。选取一组测试数据代入模型,预测结果比训练数据预测结果精度有所下降,但双向预测方式优势更加明显。【结论】采用基于LSTM模型的双向综合预测法,可显著减小长期预测中的累计误差对预测结果的影响,提升了预测数据的准确度。与其他两类数据填补方法相比,基于LSTM神经网络的数据填补方法在长期缺失的时间序列数据填补上有较大优势。
[期刊] 统计与决策
[作者]
郑智泉 陈妍 王孟孟 田维琦
为了研究数据缺失填补算法的准确性和稳定性,文章基于完全随机缺失对完整数据集按不同缺失率进行挖空处理,然后使用6种算法对缺失数据进行填补,并重复执行多次,对比分析其准确性和稳定性,给出相应的置信区间。结果表明,混合迭代填补法准确性优于K近邻、缺失森林、加权K近邻等算法,其稳定性仅次于缺失森林;随着缺失率的增大,该算法准确性高的优势更加显著;当缺失率小于5%时,该算法的准确性和稳定性达到最佳。
[期刊] 统计与决策
[作者]
潘莹丽 刘展 宋广雨
异常值检测方法研究是当今数据分析领域的一个热门问题。传统的基于模型的异常值检测方法,往往是先对模型中的参数进行估计,再检测异常值,但是异常值的存在会影响参数估计值,从而使得异常值检测结果不可靠。文章基于线性回归模型,引入异常值识别变量,提出线性均值漂移模型。在进行低维数据异常值检测时,对漂移项施加SCAD惩罚,利用坐标下降算法同时进行参数估计和异常值检测;在进行高维数据异常值检测时,对模型参数和异常值识别变量分别施加SCAD惩罚,利用坐标下降算法同时进行参数估计、变量选择和异常值检测。基于线性均值漂移模型,采用SCAD惩罚回归的思想设计坐标下降算法,消除了低维和高维数据中异常值的存在对参数估计带来的不利影响。
[期刊] 统计与决策
[作者]
庞新生
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。
[期刊] 统计与决策
[作者]
庞新生
本文在比较单一插补法与多重插补法的基础上,对多重插补处理方法的理论基础做了深入探讨,并介绍了多重插补法处理缺失数据的基本思想。
关键词:
缺失数据 多重插补 贝叶斯理论
[期刊] 浙江农林大学学报
[作者]
杨强 李鑫豪 杜韬
【目的】分析比较不同插补方法对生态系统潜热通量(F_(LE))缺失值的插补精度。【方法】利用涡度相关法于2019年对北京市松山国家级自然保护区典型天然落叶阔叶林生态系统F_(LE)与环境要素进行原位连续监测,通过3种插补方法(边缘分布抽样法、线性回归法、人工神经网络法)对F_(LE)缺失数据(0.5 h数据中随机剔除)进行插补,分析实测F_(LE)、插补F_(LE)与环境因子间的关系。【结果】3种插补结果均低估了实测F_(LE),其中人工神经网络插补值最接近实测值(决定系数R~2=0.40)。实测F_(LE)与空气温度(T_a)、饱和水汽压差(D_(VP))间均呈指数关系。边缘分布抽样法插补F_(LE)与T_a、D_(VP)间的关系最接近实测F_(LE),然而3种插补方法都不同程度改变了F_(LE)对T_a和D_(VP)的敏感性。【结论】人工神经网络法的插补结果与实测值最接近,边缘分布抽样法的结果与环境因子间的关系最接近实测值与环境因子间的关系,因此未来研究应依据研究目的选取合适的插补方法。图5表1参41
关键词:
涡度相关 潜热通量 数据插补 落叶阔叶林
[期刊] 统计与决策
[作者]
王斌会,陈一非
多元数据由于其复杂性而使其中的异常值检测问题成为一个研究难点。传统的多元统计方法由于受异常值影响使结果产生不稳定性。本文提出一种基于稳健马氏距离的异常值检测方法,并与其它一般的传统办法进行比较说明其优良性。
关键词:
异常值 杠杆值 稳健杠杆值 稳健马氏距离
[期刊] 统计与决策
[作者]
王志坚 王斌会
文章分析了基于假设检验的时间序列IO型异常值检测方法的不稳健性,提出了一种改进的方法,并利用R语言对异常值的个数分四种情况进行模拟研究,模拟结果表明:改进后的检测法检测能力显著提高。
关键词:
时间序列 异常值检测 IO R语言
[期刊] 统计与决策
[作者]
陈一非,王斌会
计量经济学中,数据异常的问题一直是人们研究的重点,因为少量的异常值就会对模型拟合产生很大的影响。本文着重讨论了异常值对线性回归模型造成的影响及其检测方法,并通过自由软件R进行了三类异常值的模拟和检测。
关键词:
线性回归 异常值 自由软件R
[期刊] 财经问题研究
[作者]
冯恭祺
珍惜自然资源确立“递耗资产”填补财会空白冯恭祺“递耗资产”是指矿藏、油井、森林、淡水等天然形成的可供人类利用的而又不断耗竭的自然资源。很早以前,西方国家就将矿藏、油井、森林等列为采掘、采伐企业的固定资产组成部分而加以管理,会计上单独设置“递耗资产”(...
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 地理科学进展
[作者]
游松财 孙朝阳
本文对中国地区SRTM90m分辨率的数字高程数据的空值区域做了提取和分析,在此基础上尝试了4种内插填补的方法。并对各种处理方法的过程及结果做了比较,从而确定先从SRTM90m数据中直接提取等高线.再内插生成DEM,用内插出来的值填补原始数据的方法在目前较为适用。此外本文还提出了一些后期处理方法以完善数据。
关键词:
SRTM 空值区域 等高线 内插
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除