- 年份
- 2024(3982)
- 2023(5740)
- 2022(5095)
- 2021(4785)
- 2020(3962)
- 2019(8594)
- 2018(8729)
- 2017(16351)
- 2016(8867)
- 2015(9577)
- 2014(8852)
- 2013(8233)
- 2012(7333)
- 2011(6318)
- 2010(6408)
- 2009(6097)
- 2008(5674)
- 2007(5084)
- 2006(4560)
- 2005(4259)
- 学科
- 济(29842)
- 经济(29801)
- 管理(23688)
- 业(21304)
- 企(16830)
- 企业(16830)
- 方法(11888)
- 农(10345)
- 中国(10094)
- 数学(9836)
- 数学方法(9580)
- 财(9479)
- 业经(7846)
- 贸(7323)
- 贸易(7319)
- 易(7123)
- 制(7079)
- 农业(6808)
- 学(5935)
- 银(5900)
- 银行(5899)
- 地方(5807)
- 务(5747)
- 财务(5723)
- 财务管理(5708)
- 行(5570)
- 企业财务(5330)
- 理论(5321)
- 融(5074)
- 金融(5073)
- 机构
- 学院(111512)
- 大学(108642)
- 济(43455)
- 经济(42460)
- 管理(40791)
- 研究(35712)
- 理学(34304)
- 理学院(33968)
- 管理学(33076)
- 管理学院(32889)
- 中国(29341)
- 京(22844)
- 财(22432)
- 科学(21259)
- 中心(17753)
- 所(17721)
- 江(17457)
- 财经(17309)
- 农(15772)
- 研究所(15543)
- 经(15497)
- 范(15482)
- 师范(15372)
- 州(14477)
- 北京(14400)
- 业大(14259)
- 经济学(13224)
- 院(12995)
- 财经大学(12554)
- 技术(12200)
- 基金
- 项目(71337)
- 科学(56222)
- 研究(55869)
- 基金(50591)
- 家(43143)
- 国家(42767)
- 科学基金(36904)
- 社会(34969)
- 社会科(33148)
- 社会科学(33142)
- 省(28481)
- 基金项目(25992)
- 教育(25832)
- 编号(24675)
- 划(23439)
- 自然(22413)
- 自然科(21926)
- 自然科学(21923)
- 自然科学基金(21446)
- 资助(20673)
- 成果(20428)
- 课题(16413)
- 重点(16167)
- 发(15655)
- 项目编号(15468)
- 部(15067)
- 创(15032)
- 年(14630)
- 国家社会(14345)
- 性(14055)
共检索到175026条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计研究
[作者]
金勇进 刘展
利用大数据进行抽样,很多情况下由于抽样框的构造比较困难,使得抽取的样本属于非概率样本,传统的抽样推断理论难以应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,本文以基于样本匹配的样本选择为例探讨了具体解决方法。
关键词:
大数据 非概率抽样 统计推断
[期刊] 统计研究
[作者]
刘晓宇 金勇进 倪成
以互联网为媒介的调查数据采集具有成本低、速度快等优势,但这些样本通常属于非概率样本,存在覆盖误差和选择性偏差,不具有总体代表性,无法直接用于有限总体推断。基于概率-非概率样本的数据整合,可以综合两类样本的优势,处理这些非概率样本偏差。本文将非概率样本看作有限总体的不完全覆盖,在假定概率样本和非概率样本有重合的前提下,构造数据整合事后分层与校准估计。该假定是校准的基础,在此框架下考虑测量误差的校正,在概率样本或非概率样本存在测量误差的情况下,提出基于无偏误真值的校准和基于有偏误测量值修正的校准两种思路。此外,本文还提出基于Bagging决策树的半监督分类法,用于识别非概率样本和概率样本的重合部分,这在实际工作中具有较强的指导意义。
[期刊] 统计与决策
[作者]
高詹清 刘艺璇 贺建风
当前所获取的大数据并非都是总体数据,通常未能完全覆盖总体,因其多源异构的特性,致使传统的数据分析方法受阻。文章将抽样调查方法引入到大数据中,对大数据背景下应用多重抽样框的必要性进行剖析,并主要针对大数据中数据多源异构的难点,将每个来源数据作为一个抽样框进行处理,提出了大数据中多重抽样框的构建。进而根据大数据的数据特征进行分类,针对不同情况确定是否需要进行分阶段抽样设计,并提出运用SF估计量对基于多重抽样框的总体进行估计,此估计量较为符合大数据中多重抽样估计的需求,并能对总体有较好的估计。
关键词:
大数据 多重抽样框 多源数据 SF估计量
[期刊] 调研世界
[作者]
万舒晨
在大数据背景下,本文充分利用数据来源渠道丰富、网络调查较为便利等特点,从多重抽样框设计、利用辅助信息提升抽样推断精度、非概率抽样调查设计等角度入手,对小微企业抽样调查的研究思路进行了梳理,研究并总结了一些可以使用的办法。对于多重抽样框设计,本文在比较多重名录抽样框设计、多重名录抽样框和区域抽样框组合设计研究思路的基础上,得到了在一定调查费用限制下可优先选用重叠划分部分筛选法设计的结论;对于辅助信息的利用,本文总结了样本轮换有关模型,比较了多种设计的结果,得到了可优先选用轮换及保留样本单位均带辅助信息模型的结论;对于非概率抽样网络调查设计,本文研究了三种调查形式以及准随机、超总体模型、准随机与超总体模型结合三种抽样推断的思路,对于时效性要求较高的专项调查,可在候选者数据库抽取样本单位开展调查并进行非概率抽样推断。本文为大数据背景下小微企业抽样设计提供了科学依据,可结合实践进一步加强应用,提升小微企业抽样调查的效率。
[期刊] 数量经济技术经济研究
[作者]
万舒晨 金勇进
研究目标:通过多重抽样框有效控制小微企业政府统计中丢失目标总体的抽样框误差。研究方法:使用行政记录等多个大数据源形成的多重抽样框,设计基于抽样框重数的估计量,并考虑多重名录抽样框和区域抽样框的组合设计,利用优化方法引入调查中的费用函数。研究发现:多重抽样框能够弥补小微企业调查中抽样总体与目标总体不一致的缺陷,结合调查费用科学分配样本量,得到估计量的最小方差,并能比较不同抽样设计下估计量方差的大小。研究创新:利用多种大数据来源进行小微企业抽样调查的多重抽样框设计。研究价值:大数据背景下可结合调查费用选择合适的多重抽样框设计,提高小微企业政府统计的数据质量。
关键词:
小微企业 多重抽样框 抽样框误差 大数据
[期刊] 统计与决策
[作者]
刘展
文章针对具有嵌套结构数据的网络候选者数据库,提出基于倾向得分多层模型的非概率抽样推断方法:根据网络候选者数据库的调查样本和参考样本,构建多层回归模型对倾向得分进行估计,并将倾向得分估计的逆作为网络候选者数据库调查样本的调整权数来估计总体。结果显示,基于倾向得分多层回归模型的总体估计效果较好,比基于倾向得分Logistic模型的总体估计的偏差更小,效率更高。
[期刊] 统计与决策
[作者]
刘展 金勇进
文章针对非概率抽样统计推断问题,提出了一种解决方法:首先采用倾向得分匹配选择样本,然后采用倾向得分逆加权、加权组调整和事后分层调整三种方法对匹配样本进行加权调整来估计目标总体,并比较不同方法估计的效果。蒙特卡罗模拟与实证研究表明:当网络访问固定样本大小与目标样本大小的比率小于3时,三种加权方法估计的效果均比未加权时匹配样本的估计效果好;当网络访问固定样本大小与目标样本大小的比率不小于3时,倾向得分事后分层调整与未加权的匹配样本估计效果较好。
关键词:
倾向得分 匹配 加权调整 非概率
[期刊] 数理统计与管理
[作者]
李莉莉 周楷贺 杜梅慧
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)~([1])提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。
关键词:
大数据 两步子抽样算法 广义线性模型
[期刊] 统计研究
[作者]
周恒彤
近年来,我国的社会经济统计学工作者努力把数理统计学的理论与方法应用于解决社会经济统计学的各种研究课题,在这方面取得了许多有价值的成果。但也还有一些值得进一步探讨的问题。其中之一是,数理统计学有其特定的研究对象和研究任务。社会经济统计学中的课题,有的属于这种研究范畴,有的则不属于。对于前者,自然可以而且也应当用数理统
[期刊] 统计与决策
[作者]
曾宪初,张洁燕
[期刊] 数理统计与管理
[作者]
梁晋雯 田茂再
处理大规模数据集时,抽样是一种很受欢迎的有效方法。体积抽样作为一种联合抽样的方法,它是按照与矩阵平方的行列式成比例进行抽样。该方法在线性回归模型背景下能得到参数的无偏估计。然而也容易受到异常点的影响,本文感兴趣的是体积抽样受异常点影响的程度。基于数据删除模型和均值漂移模型构建统计量进行异常点诊断,结果发现体积抽样方法在某些情况下极易受异常点影响。但是在给定损失的条件下,比独立同分布抽样所需的子样本量更小,在此基础上,提出样本量的自适应选择方法。作为体积抽样的扩展,杠杆值体积抽样同样可以得到普通最小二乘线性模型参数的无偏估计,一个有趣的发现是使用杠杆值体积抽样,等权最小二乘估计结果比非等权最小二乘估计效果好。
关键词:
大数据 体积抽样 异常点 最小二乘估计
[期刊] 统计研究
[作者]
秦磊 熊巍 田茂再
大数据以其巨大的样本容量或超高的变量维度使得直接计算变得不再可能,如何有效地抽取一个合适的计算样本是值得思考的问题。本文借鉴Leverage重要性抽样的思想,提出了两种稳健的改进抽样算法,不仅有效地抽取了代表性高的计算样本进行回归估计,还规避了方差大和异质性导致协方差矩阵估计不准的问题。模拟数据的分析显示,相比于Ma(2015)的方法,本文提出的方法具有更为优良的估计结果。
[期刊] 财务与会计
[作者]
孙玥璠 宋迪
在大数据环境下,被审计单位的大量非财务数据可以被迅速获取、处理和分析,实际业务信息与企业财务信息天然存在的联系使得审计线索的发现成为可能。本文借助大数据技术筛选和拆分企业庞大的非财务信息数据集,分析财务数据和其他数据之间的内在逻辑关系,基于孤立点分析方法构建审计抽样模型,实现了快速确定可疑样本,进一步实施详细审计,从而提高审计效率、降低审计风险和节约审计成本。
关键词:
大数据 审计抽样 孤立点分析
[期刊] 云南民族大学学报(哲学社会科学版)
[作者]
杨健 刘方舟
"中国特色社会主义新时代"要求党建工作创新式、科学化发展,"全面提高党的建设科学化水平"是统领党建工作的核心目标。为了实现创新式的党建科学化目标,充分利用大量党建统计数据,结合信息处理技术的最新成果,对党建问题开展量化研究,提炼隐含性、规律性知识就显得十分必要。而党建数据的电子化则是开展这一研究过程的基础。采用关系数据库理论,结合大数据存储关键技术,提出"字段元数据表"和"列簇元数据表"的方法来解决党建统计数据电子化中遇到的障碍,使得统计数据能够转换为标准的关系模型。这种转换使得存储的电子化统计数据充分反映党建信息的数据特征,同时具有很强的可扩展性和适应性,符合后续党建问题量化研究和数据分析的需求。
关键词:
党的建设 数据电子化 大数据 关系数据库
[期刊] 统计研究
[作者]
刘展 潘莹丽
随着大数据和网络的不断发展,网络调查越来越广泛,大部分网络调查样本属于非概率样本,难以采用传统的抽样推断理论进行推断,如何解决网络调查样本的推断问题是大数据背景下网络调查发展的迫切需求。本文首次从建模的角度提出了解决该问题的基本思路:一是入样概率的建模推断,可以考虑构建基于机器学习与变量选择的倾向得分模型来估计入样概率推断总体;二是目标变量的建模推断,可以考虑直接对目标变量建立参数、非参数或半参数超总体模型进行估计;三是入样概率与目标变量的双重建模推断,可以考虑进行倾向得分模型与超总体模型的加权估计与混合推断。最后,以基于广义Boosted模型的入样概率建模推断为例演示了具体解决方法。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除