- 年份
- 2024(6590)
- 2023(9483)
- 2022(8645)
- 2021(8142)
- 2020(6906)
- 2019(16177)
- 2018(16191)
- 2017(31679)
- 2016(17259)
- 2015(19301)
- 2014(19115)
- 2013(18853)
- 2012(17052)
- 2011(15080)
- 2010(14811)
- 2009(13286)
- 2008(12872)
- 2007(10901)
- 2006(9217)
- 2005(7821)
- 学科
- 济(65592)
- 经济(65526)
- 管理(49781)
- 业(46132)
- 企(38949)
- 企业(38949)
- 方法(33605)
- 数学(29196)
- 数学方法(28844)
- 财(17287)
- 农(16531)
- 中国(15818)
- 业经(14813)
- 学(14544)
- 地方(12953)
- 务(11714)
- 财务(11655)
- 财务管理(11640)
- 贸(11163)
- 贸易(11159)
- 农业(11154)
- 理论(11108)
- 企业财务(10960)
- 和(10915)
- 易(10826)
- 技术(10551)
- 环境(10313)
- 制(10116)
- 划(9085)
- 教育(8974)
- 机构
- 大学(236190)
- 学院(233978)
- 管理(97678)
- 济(88226)
- 经济(86218)
- 理学(85687)
- 理学院(84775)
- 管理学(83174)
- 管理学院(82769)
- 研究(73727)
- 中国(53585)
- 京(50314)
- 科学(47993)
- 财(39282)
- 业大(36549)
- 所(36450)
- 农(36044)
- 中心(33816)
- 研究所(33427)
- 财经(32418)
- 江(32051)
- 北京(31550)
- 范(30584)
- 师范(30324)
- 经(29491)
- 农业(28269)
- 院(27032)
- 州(26683)
- 经济学(25402)
- 商学(24780)
- 基金
- 项目(168508)
- 科学(131624)
- 研究(123111)
- 基金(121975)
- 家(105836)
- 国家(104976)
- 科学基金(90484)
- 社会(75681)
- 社会科(71694)
- 社会科学(71675)
- 基金项目(65844)
- 省(65484)
- 自然(60030)
- 自然科(58619)
- 自然科学(58608)
- 自然科学基金(57508)
- 教育(55793)
- 划(55104)
- 编号(51273)
- 资助(50231)
- 成果(40830)
- 重点(36802)
- 部(36590)
- 创(35003)
- 发(34872)
- 课题(33766)
- 科研(32602)
- 创新(32570)
- 项目编号(32220)
- 大学(31537)
共检索到323817条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 统计与决策
[作者]
庞新生
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。
[期刊] 统计与决策
[作者]
庞新生
本文在比较单一插补法与多重插补法的基础上,对多重插补处理方法的理论基础做了深入探讨,并介绍了多重插补法处理缺失数据的基本思想。
关键词:
缺失数据 多重插补 贝叶斯理论
[期刊] 统计与决策
[作者]
彭海艳 李意芝 孟利军
文章通过多重插补方法对不同缺失率和缺失模式的多变量缺失样本进行插补,研究了多重插补误差与缺失率和缺失模式的依赖关系。结果表明,当缺失率为0~15%时,多重插补误差与缺失率呈线性关系;当缺失率大于15%时,两者呈偏离线性关系。多重插补误差与缺失模式的方差均值比呈正相关性,当方差均值比越大时,误差也越大。
[期刊] 浙江农林大学学报
[作者]
杨强 李鑫豪 杜韬
【目的】分析比较不同插补方法对生态系统潜热通量(F_(LE))缺失值的插补精度。【方法】利用涡度相关法于2019年对北京市松山国家级自然保护区典型天然落叶阔叶林生态系统F_(LE)与环境要素进行原位连续监测,通过3种插补方法(边缘分布抽样法、线性回归法、人工神经网络法)对F_(LE)缺失数据(0.5 h数据中随机剔除)进行插补,分析实测F_(LE)、插补F_(LE)与环境因子间的关系。【结果】3种插补结果均低估了实测F_(LE),其中人工神经网络插补值最接近实测值(决定系数R~2=0.40)。实测F_(LE)与空气温度(T_a)、饱和水汽压差(D_(VP))间均呈指数关系。边缘分布抽样法插补F_(LE)与T_a、D_(VP)间的关系最接近实测F_(LE),然而3种插补方法都不同程度改变了F_(LE)对T_a和D_(VP)的敏感性。【结论】人工神经网络法的插补结果与实测值最接近,边缘分布抽样法的结果与环境因子间的关系最接近实测值与环境因子间的关系,因此未来研究应依据研究目的选取合适的插补方法。图5表1参41
关键词:
涡度相关 潜热通量 数据插补 落叶阔叶林
[期刊] 统计与决策
[作者]
潘传快 韩京芳 熊巍 祁春节
农业经济调查缺失数据是一个很常见而又很容易被忽略的问题。在一般缺失模式下,文章利用多元正态模型下的联合分布法对其进行多重插补,拥有很好的估计检验效果。模拟分析显示,根据该方法多重插补后的汇总估计量跟完整数据的估计量非常接近,只是由于数据缺失造成的误差增加使检验显著性下降。跟成列删除后数据的估计检验结果相比,其估计准确性和检验显著性都更高。
[期刊] 调研世界
[作者]
褚刚
推理插补是一类基于调查数据的已知信息,通过分析缺失项目与相关项目的逻辑关系,合理推断项目缺失值的插补方法。该方法无须对缺失机制、模式以及缺失值的分布做过多假设,极大地降低了插补方法的使用成本。本文以2013年中国综合社会调查数据为例,分别展示了分类变量和连续变量的插补过程,并通过模拟分析比较了不同插补方法的处理效果,希望借此引起学界对推理插补的重视,逐步将其应用到实际研究当中。
[期刊] 统计与决策
[作者]
熊巍 潘传快 祁春节
响应和数据缺失是农业经济调查数据中普遍存在的问题,可以分别采取贝叶斯法和Bootstrap法进行多重插补以完成模型构建。文章通过对柑橘主产区种植户调查的缺失数据的实证分析发现,根据两者处理后的农业经济计量模型都有较好的估计检验效果,贝叶斯法有更显著的检验统计量和更精确的区间估计,而Bootstrap法更易于操作。
[期刊] 统计与决策
[作者]
郑智泉 陈妍 王孟孟 田维琦
为了研究数据缺失填补算法的准确性和稳定性,文章基于完全随机缺失对完整数据集按不同缺失率进行挖空处理,然后使用6种算法对缺失数据进行填补,并重复执行多次,对比分析其准确性和稳定性,给出相应的置信区间。结果表明,混合迭代填补法准确性优于K近邻、缺失森林、加权K近邻等算法,其稳定性仅次于缺失森林;随着缺失率的增大,该算法准确性高的优势更加显著;当缺失率小于5%时,该算法的准确性和稳定性达到最佳。
[期刊] 统计与决策
[作者]
潘传快 祁春节 李思璇
缺失值是调查中普遍存在的问题,对缺失值进行插补是处理缺失值的较好方法。如果变量之间存在相关关系,可以通过正态线形模型利用不存在缺失值的变量对有存在缺失值的变量进行插补。较之单一插补,多重插补更能有效地估计总体方差,因此更多地被使用。文章借助Bootstrap法,让模型的参数和残差来自完全观测的Bootstrap样本的最小平法估计,可进一步准确估计总体方差。通过大量模拟试验,发现Bootstrap多重插补较之单一插补和一般多重插补能构建更宽的置信区间从而有更准确的总体参数覆盖率,这点在数据缺失比重很大时优势
[期刊] 统计研究
[作者]
刘凤芹
在经济计量分析中收入变量的缺失值是一个普遍而又较难处理的问题。传统的处理方法往往导致分析结果具有系统偏差。本文提出利用基于链式方程的多重插补方法来处理收入变量的缺失值问题。文章将此方法应用到一个实际数据集,然后通过分析插补后的数据集讨论了此方法的性质,并和其他多重插补方法进行了比较。结果表明:基于链式方程的多重插补能在一定程度上纠正推断结果的系统偏差,并且给出恰当的标准差估计。
关键词:
基于链式方程的多重插补 缺失值 收入变量
[期刊] 统计与决策
[作者]
潘传快 祁春节 李思璇
缺失值是调查中普遍存在的问题,对缺失值进行插补是处理缺失值的较好方法。如果变量之间存在相关关系,可以通过正态线形模型利用不存在缺失值的变量对有存在缺失值的变量进行插补。较之单一插补,多重插补更能有效地估计总体方差,因此更多地被使用。文章借助Bootstrap法,让模型的参数和残差来自完全观测的Bootstrap样本的最小平法估计,可进一步准确估计总体方差。通过大量模拟试验,发现Bootstrap多重插补较之单一插补和一般多重插补能构建更宽的置信区间从而有更准确的总体参数覆盖率,这点在数据缺失比重很大时优势更明显。
[期刊] 北京林业大学学报
[作者]
冯新妍 贾昕 黄金泽 高圣杰 袁敏 刘甜甜 靳川
【目的】为提高净生态系统碳交换量(NEE)在长期缺失下的插补精度,利用人工神经网络(ANN)和双向长短期记忆网络(Bi-LSTM)将NEE的环境因子和时序特征相结合,提出了ANN-BiLSTM模型。【方法】以宁夏盐池观测站NEE数据及微气象数据为研究对象,通过随机剔除连续7、15、30、45和90 d的5类缺失情景来评估ANN-BiLSTM模型、随机森林(RF)、人工神经网络(ANN)、K最邻近(KNN)、支持向量回归(SVR)和边际分布采样法(MDS)在NEE长期缺失下的插值结果。【结果】当NEE缺失天数≤30 d时,各模型的插值精度相对可靠,ANN-BiLSTM模型的插值精度最高,决定系数(R~2)均值在0.48~0.56之间,均方根误差(RMSE)和平均绝对误差(MAE)分别在0.68~1.92μmol/(m~2·s)、0.45~1.30μmol/(m~2·s)之间。当数据缺失天数≥45 d时,MDS不能对缺失值进行处理,ANN-BiLSTM模型的插值精度明显高于机器学习模型,R~2均值> 0.45,RMSE和MAE分别在0.79~1.95μmol/(m~2·s)、0.50~1.32μmol/(m~2·s)之间。【结论】当温带荒漠灌丛生态系统的NEE数据缺失长度> 30 d时,建议应用ANN-BiLSTM模型对缺失数据进行插补,可以在一定程度上提高NEE长期插值结果的精度。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除