- 年份
- 2024(6847)
- 2023(9880)
- 2022(8146)
- 2021(7767)
- 2020(6638)
- 2019(15521)
- 2018(15352)
- 2017(29422)
- 2016(15523)
- 2015(17485)
- 2014(17034)
- 2013(16286)
- 2012(14386)
- 2011(12581)
- 2010(12298)
- 2009(10954)
- 2008(10235)
- 2007(8257)
- 2006(6702)
- 2005(5402)
- 学科
- 济(61664)
- 经济(61611)
- 管理(44561)
- 业(42138)
- 企(35880)
- 企业(35880)
- 方法(34649)
- 数学(31390)
- 数学方法(30709)
- 财(14944)
- 中国(14787)
- 农(14761)
- 业经(13215)
- 理论(10947)
- 学(10693)
- 贸(10267)
- 贸易(10261)
- 技术(10182)
- 地方(10104)
- 务(10080)
- 财务(10023)
- 财务管理(10002)
- 易(9878)
- 农业(9849)
- 企业财务(9477)
- 和(9230)
- 制(8902)
- 环境(8278)
- 划(8052)
- 银(7467)
- 机构
- 学院(205750)
- 大学(205590)
- 管理(86029)
- 济(82000)
- 经济(80469)
- 理学(76268)
- 理学院(75540)
- 管理学(73729)
- 管理学院(73353)
- 研究(61214)
- 中国(45725)
- 京(41401)
- 科学(37697)
- 财(35735)
- 业大(30789)
- 中心(30174)
- 财经(29817)
- 农(29699)
- 所(28347)
- 江(28163)
- 经(27462)
- 研究所(26196)
- 范(25596)
- 经济学(25314)
- 师范(25310)
- 北京(24941)
- 农业(23372)
- 经济学院(22993)
- 院(22950)
- 财经大学(22698)
- 基金
- 项目(152721)
- 科学(122369)
- 基金(113246)
- 研究(110133)
- 家(98947)
- 国家(98194)
- 科学基金(86415)
- 社会(70380)
- 社会科(66952)
- 社会科学(66935)
- 基金项目(59534)
- 省(59340)
- 自然(57715)
- 自然科(56520)
- 自然科学(56511)
- 自然科学基金(55451)
- 教育(52637)
- 划(50362)
- 资助(46874)
- 编号(44709)
- 重点(34269)
- 成果(34078)
- 部(33770)
- 创(32866)
- 发(31701)
- 创新(30610)
- 科研(30003)
- 国家社会(29774)
- 教育部(29575)
- 课题(29402)
共检索到277572条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数理统计与管理
[作者]
李莉莉 杜梅慧 张璇
随着大数据时代的到来,分布式存储系统被广泛应用,这使得数据的分析面临较大的挑战。本文主要基于文[1]提出的两步子抽样算法思想,提出分布式两步子抽样算法,利用该算法得到的参数估计量具有一致性和渐近正态性。采用数值模拟及真实数据预测,进一步对算法进行评估,结果表明,分布式两步子抽样算法与简单随机抽样算法相比精度更高,与全样本相比,在保证精度损失很小的基础上,节约了CPU运行时间,提高了算法效率。
[期刊] 数理统计与管理
[作者]
李莉莉 周楷贺 杜梅慧
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)~([1])提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。
关键词:
大数据 两步子抽样算法 广义线性模型
[期刊] 统计与决策
[作者]
韩潇 王明秋 赵胜利
大数据统计分析在有限的计算资源下面临一些挑战性问题,用子数据代替全数据进行统计分析成为一种选择。文章基于最小协方差行列式的稳健距离,为大数据Logistic回归模型提出了一种更高效的子数据选择算法。通过大量的数值模拟,在不同的标准下比较了所提算法与其他已有算法的性能。结果表明,所提算法具有较高的估计效率和计算效率,与全数据相比,计算时间显著减少。与其他算法相比,所提算法得到的子数据信息矩阵行列式的值更大。同时,当协变量之间存在高度相关性时,所提算法具有稳健性。最后,通过对实际数据集的分析,说明了所提算法的预测误差更小。
关键词:
最小协方差行列式 信息矩阵 最优子抽样
[期刊] 统计与决策
[作者]
蔡超 何馨怡 李丽
随着计算机技术的飞速发展,大规模数据不断涌现,数据间呈现复杂的非线性特征,这使得传统的回归分析方法难以奏效。鉴于此,文章提出了基于交互有效方法的分布式神经网络回归(CE-RNN)模型,通过优化基于交互有效方法构建的神经网络回归模型的替代损失函数来获得全局参数估计值的近似结果。该模型一方面采用分布式计算方法避免了单台机器难以处理大规模数据的难题,另一方面使用神经网络回归模型解决了非线性回归问题。数值模拟和应用研究的结果表明:CE-RNN模型的预测性能与全局神经网络回归模型基本一致,且优于基于单轮型方法的分布式神经网络回归模型。
[期刊] 统计研究
[作者]
罗幼喜 李翰芳 田茂再
文章讨论了含有随机效应的面板数据模型,利用非对称Laplace分布与分位回归之间的关系,文章建立了一种贝叶斯分层分位回归模型。通过对非对称Laplace分布的分解,文章给出了Gibbs抽样算法下模型参数的点估计及区间估计,模拟结果显示,在处理含随机效应的面板数据模型中,特别是在误差非正态的情况下,本文的方法优于传统的均值模型方法。文章最后利用新方法对我国各地区经济与就业面板数据进行了实证研究,得到了有利于宏观调控的有用信息。
[期刊] 中央财经大学学报
[作者]
张颖 傅强
本文将基于Gibbs抽样的MCMC算法引入GJR-CAViaR模型,实现模型的贝叶斯推断。GJR-CAViaR模型是含有递归形式的分位数回归方程,尚未有文献提出如何对其进行贝叶斯分析和MCMC估计。本文首先利用不对称拉普拉斯分布建立GJR-CAViaR模型的似然函数,并通过引入标准指数分布和标准正态分布的混合分布得到不对称拉普拉斯分布的参数解析的条件分布,然后讨论模型的Gibbs抽样过程以及算法实现。对上证综指日收益率数据建立GJR-CAViaR模型,并得到模型参数的贝叶斯估计值。在马尔科夫链收敛的前提下,发现中国证券市场VaR具有自回归性质,且呈现收益对风险的不对称特征。这一特征不会受到样本容量大小及置信水平的影响。
[期刊] 中央财经大学学报
[作者]
张颖 傅强
本文将基于Gibbs抽样的MCMC算法引入GJR-CAViaR模型,实现模型的贝叶斯推断。GJR-CAViaR模型是含有递归形式的分位数回归方程,尚未有文献提出如何对其进行贝叶斯分析和MCMC估计。本文首先利用不对称拉普拉斯分布建立GJR-CAViaR模型的似然函数,并通过引入标准指数分布和标准正态分布的混合分布得到不对称拉普拉斯分布的参数解析的条件分布,然后讨论模型的Gibbs抽样过程以及算法实现。对上证综指日收益率数据建立GJR-CAViaR模型,并得到模型参数的贝叶斯估计值。在马尔科夫链收敛的前提下
[期刊] 统计与决策
[作者]
徐礼文 廖丹
文章考虑了大样本下线性回归中同时进行快速估计和变量选择的问题,即针对一个存在稀疏解的大样本线性模型,根据重要性抽样分布从全数据集抽取少量子样本,对该子样本进行自适应Lasso估计。通过随机模拟研究,将该算法分别应用在几种不同的数据集中,并从模型预测精度和可解释性两个方面比较了四种子抽样方法在该算法下的表现。模拟结果表明,所提出的算法具有良好表现,在计算开销上也具有一定优势。
关键词:
大样本 数据降维 子抽样算法 变量选择
[期刊] 统计与决策
[作者]
杨丰凯 袁海静
与正态回归相比,学生t回归模型是一种对异常值较稳健的回归模型,通常用Gibbs抽样算法估计参数。而Gibbs抽样是一种迭代算法,所得样本不是独立样本,统计推断之前需判断其收敛性。文章探讨了一种基于逆贝叶斯公式的非迭代抽样算法,该算法利用t分布的正态混合表示,结合EM算法和重要再抽样算法,得到参数的独立同分布的后验样本,该样本可直接用于统计推断,从而避免了Gibbs抽样中的问题。
[期刊] 统计与决策
[作者]
杨丰凯 袁海静
文章讨论了用学生t线性回归模型估计回归系数变点位置的稳健Gibbs抽样算法。利用学生t分布的正态尺度混合表示,得到各参数的满条件后验分布,通过对满条件分布抽取样本,得到变点位置及其他参数的贝叶斯估计。模拟显示该算法能有效地估计变点位置,并且当数据呈现重尾现象时,该模型较正态变点模型要稳健。
[期刊] 统计与决策
[作者]
杨丰凯 袁海静
文章讨论了用学生t线性回归模型估计回归系数变点位置的稳健Gibbs抽样算法。利用学生t分布的正态尺度混合表示,得到各参数的满条件后验分布,通过对满条件分布抽取样本,得到变点位置及其他参数的贝叶斯估计。模拟显示该算法能有效地估计变点位置,并且当数据呈现重尾现象时,该模型较正态变点模型要稳健。
[期刊] 统计与决策
[作者]
杨丰凯 袁海静
与正态回归相比,学生t回归模型是一种对异常值较稳健的回归模型,通常用Gibbs抽样算法估计参数。而Gibbs抽样是一种迭代算法,所得样本不是独立样本,统计推断之前需判断其收敛性。文章探讨了一种基于逆贝叶斯公式的非迭代抽样算法,该算法利用t分布的正态混合表示,结合EM算法和重要再抽样算法,得到参数的独立同分布的后验样本,该样本可直接用于统计推断,从而避免了Gibbs抽样中的问题。
[期刊] 统计与决策
[作者]
朱霞 潘莹丽
文章针对高维尾期望回归模型的估计问题提出了一种在交互有效的替代损失(CSL)方法基础上进行优化函数改进的分布式估计方法,具体的改进步骤为:通过构建正则化的梯度增强型损失(GEL)函数,使所有Worker机器都能并行地优化各自对应的正则化GEL函数,并通过Master机器对计算结果进行更新。数值模拟和实证分析验证了该改进方法的估计误差收敛于基于所有数据的Centralize方法的估计误差,且相对于CSL方法,该方法具有较快的收敛速度。
[期刊] 统计与决策
[作者]
潘莹丽 刘飞 刘展 赵晓洛
大规模数据是需要新处理模式才能具有更强的洞察力和决策力的海量、高增长率和多样化的信息资产。分析海量数据的工作异常复杂,主要面临两个挑战:数据的难存储性和偏态性。基于此,文章主要研究以下两个问题:(1)将数据进行分布式存储,减轻单台机器的存储负担,采用尾期望回归分析偏态数据。(2)基于尾期望回归构造全局损失函数的一个交互有效的梯度增强型损失函数,为解决该损失函数的优化问题,提出修正的ADMM算法。模拟研究表明,在有限次主从机器之间交互次数下,提出的分布式计算方法得到的估计误差递减并趋于全局最优方法得到的估计误差。基于全国健康访谈调查(NHIS)数据的实证研究表明,提出的分布式计算方法对国民体重具有良好的预测性能。
[期刊] 统计研究
[作者]
王全众
本文主要结合具体例子,针对具有相关关系的分类数据的统计分析,介绍了两类Logistic回归模型,并分析了它们的联系与区别。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除