标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(3159)
2023(4760)
2022(4268)
2021(4170)
2020(3766)
2019(8789)
2018(9071)
2017(17605)
2016(9883)
2015(11526)
2014(11679)
2013(11266)
2012(10385)
2011(9263)
2010(9800)
2009(9170)
2008(9362)
2007(8461)
2006(7516)
2005(6704)
作者
(29792)
(24781)
(24647)
(23582)
(15975)
(12095)
(11315)
(9839)
(9432)
(9086)
(8663)
(8337)
(8114)
(8001)
(7771)
(7655)
(7483)
(7311)
(7281)
(7160)
(6277)
(6255)
(6137)
(5722)
(5649)
(5626)
(5578)
(5511)
(5188)
(5032)
学科
(41137)
经济(41090)
管理(27255)
(25026)
方法(23413)
(21949)
企业(21949)
数学(20546)
数学方法(19893)
(10202)
理论(9229)
中国(9173)
(8876)
(8313)
业经(7406)
(7187)
贸易(7179)
(6984)
(6703)
(6375)
地方(6189)
教学(6169)
技术(5919)
(5580)
农业(5471)
(5436)
(5425)
金融(5425)
银行(5423)
(5214)
机构
大学(144080)
学院(143245)
管理(54430)
(52298)
经济(50992)
理学(46867)
研究(46485)
理学院(46328)
管理学(44796)
管理学院(44565)
中国(35217)
(31746)
科学(31388)
(24861)
(24477)
(23534)
业大(22929)
研究所(22613)
(21866)
中心(21691)
北京(20284)
农业(19457)
(18961)
财经(18773)
师范(18719)
(17782)
技术(17578)
(16854)
(16599)
经济学(15404)
基金
项目(93951)
科学(72826)
基金(66753)
研究(65103)
(59323)
国家(58876)
科学基金(50077)
社会(38404)
(37362)
社会科(36344)
社会科学(36331)
自然(34843)
自然科(34156)
自然科学(34151)
基金项目(33954)
自然科学基金(33473)
教育(32008)
(31979)
资助(30603)
编号(26876)
成果(22432)
重点(21452)
(20140)
课题(19161)
(19101)
(19083)
计划(18409)
科研(18163)
创新(17825)
大学(17508)
期刊
(56316)
经济(56316)
研究(39152)
中国(29419)
学报(25129)
科学(22167)
(21928)
管理(21406)
教育(19906)
大学(18956)
(18281)
学学(17723)
技术(15720)
农业(15129)
统计(11623)
(10810)
金融(10810)
(10022)
决策(9305)
财经(9008)
经济研究(8905)
(8578)
业经(8446)
技术经济(8173)
图书(7926)
(7771)
(7523)
问题(6988)
业大(6889)
科技(6870)
共检索到212138条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 统计与决策  [作者] 庞新生  李萌  
数据缺失是在数据收集中普遍存在的现象,因而缺失数据的插补问题就成了数据分析领域的重要命题。插补法的优劣主要体现在插补模型对缺失值的模拟效果,文章对常用的参数插补模型、非参数插补模型以及半参数插补模型进行了介绍,并讨论了各种插补模型的优劣和使用条件。
[期刊] 统计与决策  [作者] 潘传快  祁春节  李思璇  
缺失值是调查中普遍存在的问题,对缺失值进行插补是处理缺失值的较好方法。如果变量之间存在相关关系,可以通过正态线形模型利用不存在缺失值的变量对有存在缺失值的变量进行插补。较之单一插补,多重插补更能有效地估计总体方差,因此更多地被使用。文章借助Bootstrap法,让模型的参数和残差来自完全观测的Bootstrap样本的最小平法估计,可进一步准确估计总体方差。通过大量模拟试验,发现Bootstrap多重插补较之单一插补和一般多重插补能构建更宽的置信区间从而有更准确的总体参数覆盖率,这点在数据缺失比重很大时优势
[期刊] 统计与决策  [作者] 潘传快  祁春节  李思璇  
缺失值是调查中普遍存在的问题,对缺失值进行插补是处理缺失值的较好方法。如果变量之间存在相关关系,可以通过正态线形模型利用不存在缺失值的变量对有存在缺失值的变量进行插补。较之单一插补,多重插补更能有效地估计总体方差,因此更多地被使用。文章借助Bootstrap法,让模型的参数和残差来自完全观测的Bootstrap样本的最小平法估计,可进一步准确估计总体方差。通过大量模拟试验,发现Bootstrap多重插补较之单一插补和一般多重插补能构建更宽的置信区间从而有更准确的总体参数覆盖率,这点在数据缺失比重很大时优势更明显。
[期刊] 统计与决策  [作者] 田兵  常秋胜  闫在在  
文章将Jackknife方法应用到新提出的比型插补方法中,得到了它们在简单随机不放回抽样下对应的Jackknife方差。通过蒙特卡罗模拟,比较比插补和比型插补方法的Jackknife方差。得出结论:Jackknife方法可以极大地提高插补的效率;新提出的三种插补与比插补有近似的精度。
[期刊] 数理统计与管理  [作者] 于力超  
大规模抽样调查常采用整群抽样、多阶段抽样等复杂抽样设计,得到的调查数据呈分层嵌套结构特征,其中不可避免会出现数据缺失的问题,本文将传统的对单一含缺失数据变量进行插补的方法推广到对多个含缺失数据变量进行插补,研究了两种基于分层模型的多元含缺失数据变量多重插补方法,即通过从一个多元分布中多次抽样,同时对所有含缺失值变量进行插补的联合模型法和通过一系列关于含缺失值变量的分布对各变量依次进行插补的完全条件法.本文针对分层结构含缺失调查数据集,给出了两种方法的插补步骤,通过理论推导和模拟实证,给出了两种方法的适用范围.
[期刊] 统计与决策  [作者] 孙玲莉  董世杰  杨贵军  
社会经济调查领域普遍存在无回答现象。目前处理无回答的常用方法是多重插补法。文章重点研究常用的六种多重插补法:PMM多重插补法、DA多重插补法、EMB多重插补法、普通线性回归多重插补法、贝叶斯线性回归多重插补法和自助线性回归多重插补法。首先,比较六种多重插补法理论性质。其次,重点模拟研究三种线性回归多重插补法对回归模型系数估计的影响。最后,对比分析六种多重插补法的应用条件,给出使用不同多重插补法的插补重数建议。
[期刊] 数量经济技术经济研究  [作者] 杨贵军  李静华  
在利用含无回答的经济数据建立线性回归模型之前,选择PMM多重插补法给出无回答的插补值。模拟结果显示,在任意无回答机制下,随着插补重数增大,系数估计量的偏差和均方误差减小不显著。对于任意无回答率,建议插补重数为5。在完全随机无回答机制下,随着无回答率增加,系数估计量的偏差或均方误差增大往往不显著。然而,在随机无回答机制下或在非随机无回答机制下,随着无回答率增加,系数估计量的偏差和均方误差增大往往显著。
[期刊] 数量经济技术经济研究  [作者] 杨贵军  孙玲莉  孟杰  
基于EMB多重插补法的线性模型系数估计量,分析其统计性质,并与PMM多重插补法以及DA插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更显著。在完全随机无回答机制或随机无回答机制下,建议插补重数为15。在依赖被解释变量的非随机无回答机制下,建议插补重数可适当增大。在依赖其他变量的非随机无回答机制下,估计量的均方误差和估计方差的差异大,使用EMB多重插补法要谨慎。
[期刊] 统计与决策  [作者] 庞新生  
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。
[期刊] 统计与决策  [作者] 张维群  段格格  
依据一定的抽样方法在动态总体中选定的样本,在前后两期调查中会出现部分样本丢失的情况,从而导致部分样本调查数据的缺失,如果直接忽视丢失样本信息,则会降低样本的有效性,影响总体参数估计的精度。文章针对动态总体分层抽样中前后两期样本出现丢失的情况,将前期样本信息在第二期内消亡和新生的样本视为不可观测样本,采用多重插补技术对丢失样本目标变量值进行估计,设计出基于多重插补技术的第二期分层样本的参数估计方法,并构造相应的估计量。实验表明,基于多重插补技术的分层抽样具有优良性,设计的参数估计量具有无偏性,且较为有效。
[期刊] 统计与决策  [作者] 庞新生  
本文在比较单一插补法与多重插补法的基础上,对多重插补处理方法的理论基础做了深入探讨,并介绍了多重插补法处理缺失数据的基本思想。
[期刊] 统计与决策  [作者] 庞新生  
文章讨论了基于多变量事后分层基础上的多重插补方法,分别就分层方法的选择、样本在各层的分配、插补模型的选择和参数估计进行了分析。
[期刊] 北京林业大学学报  [作者] 冯新妍   贾昕   黄金泽   高圣杰   袁敏   刘甜甜   靳川  
【目的】为提高净生态系统碳交换量(NEE)在长期缺失下的插补精度,利用人工神经网络(ANN)和双向长短期记忆网络(Bi-LSTM)将NEE的环境因子和时序特征相结合,提出了ANN-BiLSTM模型。【方法】以宁夏盐池观测站NEE数据及微气象数据为研究对象,通过随机剔除连续7、15、30、45和90 d的5类缺失情景来评估ANN-BiLSTM模型、随机森林(RF)、人工神经网络(ANN)、K最邻近(KNN)、支持向量回归(SVR)和边际分布采样法(MDS)在NEE长期缺失下的插值结果。【结果】当NEE缺失天数≤30 d时,各模型的插值精度相对可靠,ANN-BiLSTM模型的插值精度最高,决定系数(R~2)均值在0.48~0.56之间,均方根误差(RMSE)和平均绝对误差(MAE)分别在0.68~1.92μmol/(m~2·s)、0.45~1.30μmol/(m~2·s)之间。当数据缺失天数≥45 d时,MDS不能对缺失值进行处理,ANN-BiLSTM模型的插值精度明显高于机器学习模型,R~2均值> 0.45,RMSE和MAE分别在0.79~1.95μmol/(m~2·s)、0.50~1.32μmol/(m~2·s)之间。【结论】当温带荒漠灌丛生态系统的NEE数据缺失长度> 30 d时,建议应用ANN-BiLSTM模型对缺失数据进行插补,可以在一定程度上提高NEE长期插值结果的精度。
[期刊] 数量经济技术经济研究  [作者] 王璐  王飞  
在抽样调查中,经常会遇到调查问卷中没有回答或者是某些题目没有回答的情况,这就是缺失数据的问题。处理项目无回答的缺失数据,常用的方法是插补。根据Rao和J.Shao的结果采用普通的jackknife方差会低估插补后数据的方差。如果有严重的方差低估,那就会对统计量的区间估计造成很大的影响。本文采用Montecarlo模拟的方法对这一问题进行了实证的研究,并且给出了普通的jack-knife方差低估插补后数据方差的实际证据,同时支持了Rao和J.Shao提出的调整的jackknife方差。
[期刊] 浙江农林大学学报  [作者] 杨强   李鑫豪   杜韬  
【目的】分析比较不同插补方法对生态系统潜热通量(F_(LE))缺失值的插补精度。【方法】利用涡度相关法于2019年对北京市松山国家级自然保护区典型天然落叶阔叶林生态系统F_(LE)与环境要素进行原位连续监测,通过3种插补方法(边缘分布抽样法、线性回归法、人工神经网络法)对F_(LE)缺失数据(0.5 h数据中随机剔除)进行插补,分析实测F_(LE)、插补F_(LE)与环境因子间的关系。【结果】3种插补结果均低估了实测F_(LE),其中人工神经网络插补值最接近实测值(决定系数R~2=0.40)。实测F_(LE)与空气温度(T_a)、饱和水汽压差(D_(VP))间均呈指数关系。边缘分布抽样法插补F_(LE)与T_a、D_(VP)间的关系最接近实测F_(LE),然而3种插补方法都不同程度改变了F_(LE)对T_a和D_(VP)的敏感性。【结论】人工神经网络法的插补结果与实测值最接近,边缘分布抽样法的结果与环境因子间的关系最接近实测值与环境因子间的关系,因此未来研究应依据研究目的选取合适的插补方法。图5表1参41
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除