- 年份
- 2024(5450)
- 2023(7755)
- 2022(6708)
- 2021(6301)
- 2020(5409)
- 2019(12578)
- 2018(12347)
- 2017(24306)
- 2016(12593)
- 2015(14036)
- 2014(13610)
- 2013(12855)
- 2012(11400)
- 2011(9892)
- 2010(9242)
- 2009(8106)
- 2008(7469)
- 2007(6170)
- 2006(4774)
- 2005(3845)
- 学科
- 济(49260)
- 经济(49212)
- 管理(37729)
- 业(35649)
- 企(30505)
- 企业(30505)
- 方法(28915)
- 数学(25849)
- 数学方法(25373)
- 财(13871)
- 农(11726)
- 业经(10904)
- 中国(10610)
- 务(10025)
- 财务(9984)
- 财务管理(9964)
- 企业财务(9491)
- 贸(8815)
- 贸易(8813)
- 易(8625)
- 技术(8396)
- 学(8301)
- 理论(7841)
- 农业(7818)
- 和(7594)
- 地方(7539)
- 制(7398)
- 环境(6774)
- 划(6404)
- 产业(6280)
- 机构
- 大学(165068)
- 学院(164076)
- 管理(71786)
- 济(66547)
- 经济(65355)
- 理学(63588)
- 理学院(63012)
- 管理学(61741)
- 管理学院(61424)
- 研究(45769)
- 中国(35213)
- 京(32749)
- 财(29319)
- 科学(27899)
- 财经(24922)
- 中心(24820)
- 业大(24223)
- 经(22935)
- 江(22513)
- 农(22464)
- 经济学(20842)
- 所(19927)
- 范(19927)
- 师范(19727)
- 北京(19363)
- 经济学院(19070)
- 财经大学(19006)
- 经济管理(18691)
- 商学(18375)
- 研究所(18318)
- 基金
- 项目(124365)
- 科学(100455)
- 基金(94033)
- 研究(90082)
- 家(81365)
- 国家(80764)
- 科学基金(72076)
- 社会(59264)
- 社会科(56413)
- 社会科学(56400)
- 基金项目(49824)
- 自然(47639)
- 省(47347)
- 自然科(46678)
- 自然科学(46668)
- 自然科学基金(45813)
- 教育(42227)
- 划(40120)
- 资助(38238)
- 编号(36341)
- 部(28010)
- 成果(27655)
- 重点(27305)
- 创(26651)
- 国家社会(25631)
- 发(25149)
- 创新(24894)
- 科研(24838)
- 教育部(24814)
- 人文(24494)
共检索到218443条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 技术经济
[作者]
景亚萍 邵培基 李成刚
将最大期望值算法(EM)与朴素贝叶斯算法(NB)相结合,提出EM-NB算法来填补网络调查中的缺失数据。对比基于处理后的完备数据集的分类统计结果与基于纸质调查得到的分析结果,结果显示,利用EM-NB算法处理缺失数据后的网络调查问卷与纸质调查问卷可得到一致的调查结果。这表明EM-NB算法是一种有效的处理网络调查中缺失数据的方法。
[期刊] 统计与决策
[作者]
庞新生
文章简要介绍了常用的缺失数据处理方法,讨论了缺失数据的处理方法评价标准,并对各种缺失数据的处理方法的特点及适用情况进行了比较。
关键词:
缺失数据 处理方法 比较评价
[期刊] 统计研究
[作者]
方匡南 谢邦昌
本文提出了基于聚类和关联规则的缺失数据处理新方法,通过聚类方法将含有缺失数据的数据集相近的记录归到一类,然后利用改进后的关联规则方法对各子数据集挖掘变量间的关联性,并利用这种关联性来填补缺失数据。通过实例分析,发现该方法对缺失数据处理,尤其是对在先验辅助信息缺失情况下的海量数据集具有较好的效果。
关键词:
聚类 关联规则 缺失数据 插补
[期刊] 统计与决策
[作者]
张松兰 王鹏 徐子伟
针对数据库中存在缺失值的问题,文章建立了统计相关分析与机器学习相结合的缺失数据处理方法。首先利用统计相关性对原始数据进行分析,找出与缺失值属性相关度较大的属性,提取这些属性的已知值作为训练数据建立模型,再利用建立起来的模型估算缺失值。以UCI数据库真实的数据为例进行仿真,并对比分析了支持向量机、神经网络和决策树三种机器学习算法,实验结果表明利用相关度较大的已知属性值来训练学习,其估算值精度明显提高。
[期刊] 统计与决策
[作者]
庞新生
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。
[期刊] 统计与决策
[作者]
庞新生
本文在比较单一插补法与多重插补法的基础上,对多重插补处理方法的理论基础做了深入探讨,并介绍了多重插补法处理缺失数据的基本思想。
关键词:
缺失数据 多重插补 贝叶斯理论
[期刊] 统计与决策
[作者]
邓建新 单路宝 贺德强 唐锐
文章介绍了数据缺失的现象、概念、出现的领域以及产生的原因,总结了数据缺失机制和数据缺失模式;综述了目前缺失数据常用的处理方法:加权法、删除法、统计学插补法以及机器学习插补法,并综合比较了各种方法的适用范围和优缺点;最后提出了针对高维数据的缺失处理、复合缺失数据特征的处理、新领域的缺失数据处理将是未来缺失数据处理方法的研究方向。
[期刊] 职教论坛
[作者]
刘玉梅 孙传远
网络课程学习生态缺失的问题是目前学术界关注的一个热点,但绝大多数研究还局限于客观描述和理论探讨方面,尚未见到较为系统全面的实证分析报告。针对这一现实,文章以上海电视大学的远程学习者为研究对象,运用问卷调查的方法对网络课程学习生态缺失的现状进行了实证研究,并在实证分析的基础上得出若干结论与建议。
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 中国卫生经济
[作者]
宋若萌 郝军 云科 李汶檀 章溪妍 辛雨 吴昌金 蔡源益 吴华章 惠文
目的:文章系统探讨基于个体水平数据的卫生经济学评价中缺失值的系列问题,为实际研究中正确处理和报告缺失值提供参考。方法:在回顾一般缺失值问题的基础上,梳理基于个体水平数据的卫生经济学评价中数据缺失的原因、类型和处理方法等。结果:多重插补法是缺失值处理方法最常见的方法,在使用该方法时要注意合理选择插补具体方法、插补建模类型和插补模型的变量。结论:当前卫生经济学评价中关于缺失值的处理和报告还未形成已达成共识的质量规范,有待未来进一步探索。
[期刊] 统计与决策
[作者]
于力超
在不同时点对同一批受访者进行追踪调查称为纵向调查,由于受访者退出调查等原因,纵向调查中常出现数据缺失的现象,如处理不当,会造成参数估计效率降低,甚至会导致估计的偏倚。文章从缺失数据的事前预防和事后处理两个方面研究了预防和处理纵向调查中缺失数据问题的方法,针对缺失机制为随机缺失和非随机缺失两种情形,研究了插补方法和似然建模方法(包括EM算法、选择模型法和模式混合模型法)两类针对含缺失数据集的参数估计方法,并给出了各自的适用范围。
[期刊] 统计研究
[作者]
金勇进
Carryingoutanadditionalinvestigationtonon-esponseunitsisanimportant meanstosolveomissiondataproblemsinstatisticsinvestigation.Usuallythereex- isttwobasicforms:oneisrepeatinginquiries,theotherisdoingsecondsampling. However,evenadditionalinvestigationisemployed,non-responseproblemsareun- avoidable.Therefore,theadjustmentofdataisoftenneeded.Thepapermainly discussestheproblemsmentionedabove.
[期刊] 调研世界
[作者]
陈宏
数据缺失现象不仅干扰调查精度,也影响数据分析者后续工作的有效开展。由于种种原因,在针对规模以下服务业企业开展抽样调查时,数据缺失现象屡有发生。因此,为使规模以下服务业抽样调查取得更理想的结果,本文通过总结福州地区规模以下服务业调查实际操作经验,尝试对缺失数据进行有效补救,分析这些数据补救方法的适用性,进而判断在对规模以下服务业缺失数据进行补救时,需要结合实际回访企业中搜集到的各调查样本单位的具体情况与不同插补法的特点进行有效插补才能取得较好结果。
关键词:
规模以下服务业 数据缺失 数据插补法
[期刊] 林业科学
[作者]
宋维 高超 赵玥 赵燕东
【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据,分别使用插值方法、RNN神经网络、LSTM神经网络对缺失部分进行填补,填补结果与原始数据比对并分析结果。基于神经网络预测值误差随预测时刻推后而增大的误差分布情况,本文提出了在神经网络预测值基础上加入对数据后期处理的方法:从缺失数据的正向和反向进行预测,将2个方向的预测值各自乘以一组按照预测时刻递减的权重值并相加,结合2个预测方向的优势,进一步提高预测准确度。【结果】3种方法中,RNN与LSTM神经网络方法较传统的插值方法优势明显:插值方法准确度在缺失值增多时迅速下降;神经网络方法下降速度较慢。当填补值与真实值误差在2%以内作为准确时,插值方法的填补准确率不足50%,RNN方法达到50%且不足60%,LSTM方法达到80%以上;当填补值与真实值误差在4%以内作为准确时,插值方法填补准确率为60%,RNN方法准确度最高达到90%,LSTM方法准确率在95%以上。在此基础上加入权重处理,对LSTM预测结果处理后误差在2%以内准确率达到97%,误差在3%以内准确率达到100%。选取一组测试数据代入模型,预测结果比训练数据预测结果精度有所下降,但双向预测方式优势更加明显。【结论】采用基于LSTM模型的双向综合预测法,可显著减小长期预测中的累计误差对预测结果的影响,提升了预测数据的准确度。与其他两类数据填补方法相比,基于LSTM神经网络的数据填补方法在长期缺失的时间序列数据填补上有较大优势。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除