- 年份
- 2024(8951)
- 2023(12857)
- 2022(11462)
- 2021(10724)
- 2020(9013)
- 2019(21078)
- 2018(20783)
- 2017(40645)
- 2016(21865)
- 2015(24487)
- 2014(24195)
- 2013(23540)
- 2012(21279)
- 2011(18718)
- 2010(18189)
- 2009(16316)
- 2008(15516)
- 2007(13054)
- 2006(10898)
- 2005(8997)
- 学科
- 济(83675)
- 经济(83585)
- 管理(63548)
- 业(59703)
- 企(50644)
- 企业(50644)
- 方法(44187)
- 数学(38706)
- 数学方法(38159)
- 财(22693)
- 农(21150)
- 中国(20291)
- 业经(18667)
- 学(17798)
- 务(15700)
- 财务(15632)
- 地方(15624)
- 财务管理(15605)
- 企业财务(14803)
- 贸(14674)
- 贸易(14670)
- 易(14259)
- 农业(14239)
- 理论(14079)
- 技术(13572)
- 和(13468)
- 环境(13082)
- 制(12876)
- 划(11580)
- 银(11064)
- 机构
- 大学(296839)
- 学院(295842)
- 管理(123544)
- 济(114031)
- 经济(111611)
- 理学(108966)
- 理学院(107844)
- 管理学(105715)
- 管理学院(105190)
- 研究(91003)
- 中国(66226)
- 京(61584)
- 科学(58557)
- 财(51172)
- 业大(45996)
- 农(45416)
- 所(43754)
- 中心(42750)
- 财经(42598)
- 江(40378)
- 研究所(40293)
- 经(38869)
- 北京(37868)
- 范(37828)
- 师范(37445)
- 农业(35693)
- 经济学(33801)
- 院(33772)
- 州(33243)
- 财经大学(32110)
- 基金
- 项目(216219)
- 科学(170424)
- 基金(158013)
- 研究(156681)
- 家(137359)
- 国家(136272)
- 科学基金(118540)
- 社会(98058)
- 社会科(93020)
- 社会科学(92995)
- 基金项目(84644)
- 省(84399)
- 自然(78849)
- 自然科(77059)
- 自然科学(77041)
- 自然科学基金(75607)
- 教育(72160)
- 划(70921)
- 资助(65070)
- 编号(64391)
- 成果(50150)
- 重点(47641)
- 部(47291)
- 创(45129)
- 发(44773)
- 课题(42583)
- 创新(42058)
- 科研(41989)
- 教育部(40862)
- 大学(40622)
- 期刊
- 济(111754)
- 经济(111754)
- 研究(80432)
- 中国(47270)
- 学报(47037)
- 科学(42550)
- 管理(42539)
- 农(39522)
- 财(39432)
- 大学(35973)
- 学学(33916)
- 教育(30115)
- 农业(28111)
- 技术(26332)
- 融(19562)
- 金融(19562)
- 业经(19364)
- 财经(19314)
- 经济研究(17841)
- 图书(16741)
- 经(16338)
- 统计(16065)
- 理论(14713)
- 问题(14703)
- 科技(14605)
- 技术经济(13887)
- 业(13863)
- 实践(13766)
- 践(13766)
- 策(13743)
共检索到403003条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
张松兰 王鹏 徐子伟
针对数据库中存在缺失值的问题,文章建立了统计相关分析与机器学习相结合的缺失数据处理方法。首先利用统计相关性对原始数据进行分析,找出与缺失值属性相关度较大的属性,提取这些属性的已知值作为训练数据建立模型,再利用建立起来的模型估算缺失值。以UCI数据库真实的数据为例进行仿真,并对比分析了支持向量机、神经网络和决策树三种机器学习算法,实验结果表明利用相关度较大的已知属性值来训练学习,其估算值精度明显提高。
[期刊] 统计研究
[作者]
方匡南 谢邦昌
本文提出了基于聚类和关联规则的缺失数据处理新方法,通过聚类方法将含有缺失数据的数据集相近的记录归到一类,然后利用改进后的关联规则方法对各子数据集挖掘变量间的关联性,并利用这种关联性来填补缺失数据。通过实例分析,发现该方法对缺失数据处理,尤其是对在先验辅助信息缺失情况下的海量数据集具有较好的效果。
关键词:
聚类 关联规则 缺失数据 插补
[期刊] 统计与决策
[作者]
庞新生
文章简要介绍了常用的缺失数据处理方法,讨论了缺失数据的处理方法评价标准,并对各种缺失数据的处理方法的特点及适用情况进行了比较。
关键词:
缺失数据 处理方法 比较评价
[期刊] 技术经济
[作者]
景亚萍 邵培基 李成刚
将最大期望值算法(EM)与朴素贝叶斯算法(NB)相结合,提出EM-NB算法来填补网络调查中的缺失数据。对比基于处理后的完备数据集的分类统计结果与基于纸质调查得到的分析结果,结果显示,利用EM-NB算法处理缺失数据后的网络调查问卷与纸质调查问卷可得到一致的调查结果。这表明EM-NB算法是一种有效的处理网络调查中缺失数据的方法。
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 统计与决策
[作者]
庞新生
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。
[期刊] 统计与决策
[作者]
杨帆 庞新生
随着研究中对数据质量要求的提高,缺失数据相关问题也越来越受到重视。文章主要论述了处理缺失数据的方法之一——分数插补法的理论基础,并在此基础上研究了分数热卡插补法及其方差估计,同时使用模拟数据,对分数热卡插补法的实现过程做了模拟研究。通过对比实验,可以得到分数热卡插补法能够在保证原有数据分布的基础上,减少因插补造成的偏差,提供更加准确的插补结果。
[期刊] 中国卫生经济
[作者]
宋若萌 郝军 云科 李汶檀 章溪妍 辛雨 吴昌金 蔡源益 吴华章 惠文
目的:文章系统探讨基于个体水平数据的卫生经济学评价中缺失值的系列问题,为实际研究中正确处理和报告缺失值提供参考。方法:在回顾一般缺失值问题的基础上,梳理基于个体水平数据的卫生经济学评价中数据缺失的原因、类型和处理方法等。结果:多重插补法是缺失值处理方法最常见的方法,在使用该方法时要注意合理选择插补具体方法、插补建模类型和插补模型的变量。结论:当前卫生经济学评价中关于缺失值的处理和报告还未形成已达成共识的质量规范,有待未来进一步探索。
[期刊] 统计与决策
[作者]
吴桐雨 吴少雄
文章利用核主成分分析法对统计数据进行特征提取,将获得的主成分作为最小二乘支持向量机的特征向量建立支持向量机模型,应用粒子群算法对最小二乘支持向量机参数进行优化,并应用于福建省流通产业统计数据的缺失值插补。研究结果表明,应用核主成分分析与粒子群优化最小二乘支持向量机的方法具有较高的的精度,可以应用于统计数据缺失值的插补。
[期刊] 统计与决策
[作者]
彭海艳 李意芝 孟利军
文章通过多重插补方法对不同缺失率和缺失模式的多变量缺失样本进行插补,研究了多重插补误差与缺失率和缺失模式的依赖关系。结果表明,当缺失率为0~15%时,多重插补误差与缺失率呈线性关系;当缺失率大于15%时,两者呈偏离线性关系。多重插补误差与缺失模式的方差均值比呈正相关性,当方差均值比越大时,误差也越大。
[期刊] 统计研究
[作者]
金勇进
Carryingoutanadditionalinvestigationtonon-esponseunitsisanimportant meanstosolveomissiondataproblemsinstatisticsinvestigation.Usuallythereex- isttwobasicforms:oneisrepeatinginquiries,theotherisdoingsecondsampling. However,evenadditionalinvestigationisemployed,non-responseproblemsareun- avoidable.Therefore,theadjustmentofdataisoftenneeded.Thepapermainly discussestheproblemsmentionedabove.
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 冯嘉美 张志锋
大数据时代的到来伴随着海量数据,进而使得筛选出具有价值的信息成为大数据被广泛应用的核心步骤.在此情况下Apache Hadoop顺势而生,其通过简化数据密集、高度并行的分布式应用来应对大数据带来的挑战.由于目前基于Hadoop的大数据平台在多领域普遍使用,从而平台搭建成为进行大数据探索的第一步.而很多文章介绍的平台搭建是在虚拟机中完成,与真实情况存在相应差异.本文讨论以真实集群为基础搭建Hadoop平台的原因,Hadoop集群的强大功能,搭建平台所需设备、环境、安装、设置及测试过程.
关键词:
Hadoop 大数据 分布式应用
[期刊] 统计与决策
[作者]
龚辉锋
在实证分析中遇到缺失值是一个非常不幸但又非常普遍的问题,不完整的数据将会严重影响到分析结果的正确性和准确性,甚至是增加错误结果的风险,对缺失值的处理是一个不可避免而又富有挑战性的研究课题。牛顿搜索算法是一个优秀的数据设算法,不需要考虑数据的缺失状态,可充分利用已有数据对缺失值进行修补,在改善参数估计、减少标准误差、提高统计检验功效方面有良好效果。
关键词:
缺失值 多重设算 最大期望 牛顿法
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除