- 年份
- 2024(9380)
- 2023(13781)
- 2022(12336)
- 2021(11788)
- 2020(9975)
- 2019(23347)
- 2018(23411)
- 2017(45327)
- 2016(24776)
- 2015(27918)
- 2014(27896)
- 2013(27236)
- 2012(24912)
- 2011(22027)
- 2010(22260)
- 2009(20208)
- 2008(19432)
- 2007(16983)
- 2006(14834)
- 2005(13081)
- 学科
- 济(95511)
- 经济(95405)
- 管理(69062)
- 业(65284)
- 企(54050)
- 企业(54050)
- 方法(45920)
- 数学(39944)
- 数学方法(39161)
- 农(27278)
- 中国(24550)
- 财(22752)
- 业经(22062)
- 地方(20515)
- 学(20483)
- 农业(18193)
- 理论(17841)
- 贸(17426)
- 贸易(17417)
- 制(17013)
- 易(16888)
- 和(15404)
- 技术(15087)
- 务(14470)
- 财务(14386)
- 财务管理(14353)
- 环境(14205)
- 银(13546)
- 银行(13513)
- 企业财务(13440)
- 机构
- 大学(339648)
- 学院(339281)
- 管理(136827)
- 济(128032)
- 经济(124941)
- 理学(118523)
- 理学院(117183)
- 管理学(114671)
- 管理学院(114052)
- 研究(109084)
- 中国(82171)
- 京(73314)
- 科学(69822)
- 财(57802)
- 所(54440)
- 农(53383)
- 中心(51378)
- 业大(51311)
- 江(50234)
- 研究所(49495)
- 范(46969)
- 师范(46606)
- 北京(46501)
- 财经(46488)
- 经(42090)
- 州(41481)
- 农业(41415)
- 院(39953)
- 师范大学(37437)
- 技术(37098)
- 基金
- 项目(234689)
- 科学(184130)
- 研究(173302)
- 基金(168229)
- 家(145806)
- 国家(144555)
- 科学基金(124759)
- 社会(105965)
- 社会科(100163)
- 社会科学(100133)
- 省(92681)
- 基金项目(89803)
- 自然(82637)
- 教育(80969)
- 自然科(80735)
- 自然科学(80720)
- 自然科学基金(79174)
- 划(77856)
- 编号(73321)
- 资助(70212)
- 成果(59358)
- 重点(52095)
- 部(50976)
- 课题(49768)
- 发(49467)
- 创(48744)
- 创新(45274)
- 项目编号(44906)
- 科研(44864)
- 大学(44134)
- 期刊
- 济(139949)
- 经济(139949)
- 研究(97740)
- 中国(64082)
- 学报(52083)
- 管理(49017)
- 农(48436)
- 科学(48127)
- 教育(43732)
- 财(43393)
- 大学(39525)
- 学学(36541)
- 农业(33408)
- 技术(31699)
- 融(27653)
- 金融(27653)
- 业经(24424)
- 图书(22694)
- 经济研究(21382)
- 财经(21300)
- 问题(18569)
- 经(18076)
- 业(17004)
- 理论(16900)
- 科技(16524)
- 技术经济(16377)
- 统计(15697)
- 实践(15579)
- 践(15579)
- 资源(15444)
共检索到494069条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计研究
[作者]
刘展 潘莹丽
随着大数据和网络的不断发展,网络调查越来越广泛,大部分网络调查样本属于非概率样本,难以采用传统的抽样推断理论进行推断,如何解决网络调查样本的推断问题是大数据背景下网络调查发展的迫切需求。本文首次从建模的角度提出了解决该问题的基本思路:一是入样概率的建模推断,可以考虑构建基于机器学习与变量选择的倾向得分模型来估计入样概率推断总体;二是目标变量的建模推断,可以考虑直接对目标变量建立参数、非参数或半参数超总体模型进行估计;三是入样概率与目标变量的双重建模推断,可以考虑进行倾向得分模型与超总体模型的加权估计与混合推断。最后,以基于广义Boosted模型的入样概率建模推断为例演示了具体解决方法。
[期刊] 统计研究
[作者]
刘展 潘莹丽 金美玲
随着大数据与互联网技术的迅猛发展,网络调查的应用越来越广泛。本文提出网络调查样本的随机森林倾向得分模型推断方法,通过构建若干棵分类决策树组成随机森林,对网络调查样本单元的倾向得分进行估计,从而实现对总体的推断。模拟分析和实证研究结果表明:基于随机森林倾向得分模型的总体均值估计的相对偏差、方差与均方误差均比基于Logistic倾向得分模型的总体均值估计的相对偏差、方差与均方误差小,提出的方法估计效果更好。
[期刊] 统计研究
[作者]
刘展 潘莹丽 金美玲
随着大数据与互联网技术的迅猛发展,网络调查的应用越来越广泛。本文提出网络调查样本的随机森林倾向得分模型推断方法,通过构建若干棵分类决策树组成随机森林,对网络调查样本单元的倾向得分进行估计,从而实现对总体的推断。模拟分析和实证研究结果表明:基于随机森林倾向得分模型的总体均值估计的相对偏差、方差与均方误差均比基于Logistic倾向得分模型的总体均值估计的相对偏差、方差与均方误差小,提出的方法估计效果更好。
[期刊] 统计与决策
[作者]
刘展 潘莹丽 石寒
网络调查是大数据背景下一种重要的抽样调查方法,然而大多数网络调查样本属于非概率样本,其入样概率未知,需要进行建模估计。之前的研究大多通过构建Logistic倾向得分模型计算入样概率,但是Logistic倾向得分模型通常适用于协变量或混杂变量较少的情况,存在较多协变量或混杂变量时如何进行倾向得分建模推断是一个亟待解决的问题。针对此问题,文章充分考虑经典的变量选择方法Adaptive LASSO的降维特点,提出对网络调查样本建立Adaptive LASSO Logistic倾向得分模型估计倾向得分,进一步利用倾向得分逆加权、未加权与加权均值、未加权与加权中位数的分组调整方法,从而估计总体。研究表明:基于Adaptive LASSO Logistic倾向得分模型的总体均值估计的偏差、方差与均方误差都比基于Logistic倾向得分模型的总体均值估计的偏差、方差与均方误差小。
[期刊] 统计与决策
[作者]
刘展 郑俊博 刘洋 潘莹丽
大数据下的样本大多为非概率样本,其入样概率未知,同时可能面临着协变量较多甚至是高维的情况,那么如何对这种情况下的非概率样本进行推断值得探索。针对该问题,文章考虑到Model-X Knockoffs的降维特点,提出采用Model-X Knockoffs筛选出重要变量,建立Logistic倾向得分模型来估计非概率样本的入样概率或倾向得分,对总体进行推断,从而提高估计的精度,同时可控制变量选择的错误发现率与功效。模拟与实证研究结果表明:基于Model-X Knockoffs的Logistic倾向得分模型的总体均值估计相比一般的Logistic倾向得分模型和广义线性回归模型的总体均值估计,偏差更小、效率更高、估计效果更好,并且能很好地控制错误发现率的水平,功效值也接近1。
[期刊] 统计与决策
[作者]
刘展
文章针对具有嵌套结构数据的网络候选者数据库,提出基于倾向得分多层模型的非概率抽样推断方法:根据网络候选者数据库的调查样本和参考样本,构建多层回归模型对倾向得分进行估计,并将倾向得分估计的逆作为网络候选者数据库调查样本的调整权数来估计总体。结果显示,基于倾向得分多层回归模型的总体估计效果较好,比基于倾向得分Logistic模型的总体估计的偏差更小,效率更高。
[期刊] 现代情报
[作者]
夏一雪 兰月新 赵玉敏
[目的/意义]面向大数据研究网络舆情信息异化机理以及控制模型,是政府控制信息异化程度的关键,为政府应对和治理网络舆情提供理论参考依据。[方法/过程]定性分析大数据环境下网络舆情信息异化机理,将网络舆情演化机理模型拓展为信息异化控制模型,并在此基础上通过数值仿真研究政府控制信息异化的分类问题。[结论/结果]经过理论建模和实证分析得出本文构建的信息异化控制模型是可行的,以上理论研究可为政府准确把握大数据环境下网络舆情信息异化程度,制定网络舆情治理策略提供参考依据。
关键词:
大数据 网络舆情 信息异化 控制模型
[期刊] 统计与决策
[作者]
王俊 金勇进 司亚娟
文章介绍了倾向得分及其在网络便利样本推断中的应用,并基于最近邻方法将参照样本和网络便利样本进行合并以估计倾向得分,通过模拟研究比较不同样本合并方式下,估计出的倾向得分及对应的逆倾向得分加权估计量在网络便利样本推断中的效果。结果表明随着网络便利样本的样本量的增加,基于最近邻的样本合并方法得到的逆倾向得分加权估计量的偏差较低,且在实际应用中具有较强的可操作性。
关键词:
倾向得分 权数 参照样本 最近邻
[期刊] 数量经济技术经济研究
[作者]
裴丹 陈林 韩胜飞
中国铁塔股份有限公司的成立,是中国移动通信业的一次纵向分离式改革,也是国家对信息网络产业的“统一大市场”式改革。近期党的二十大报告提出加快建设数字中国、加快建设网络强国,而移动通信业正是“数字中国”和“网络强国”的基础设施领域之一,为考察其改革成效,并在“十四五”时期更好地指导数字信息基础设施建设,本文使用鲍莫尔(Baumol)的成本次可加方法实证测算铁塔设施的自然垄断属性,并剖析成本属性影响行业产出绩效的具体机理,然后在国内首次构建基于随机推断的小样本双重差分模型(Randomization Inference Differences-in-Differences, RI-DID)评估此次纵向分离改革的政策绩效。实证结果表明,信息基础网络上游环节的通讯铁塔设施有一定的非自然垄断属性,垄断式的经营因推高成本而导致下游运营商产出显著下降。从政策含义看,在网络型自然垄断产业或非自然垄断的网络环节,纵向分离改革需审慎推进。从方法论看,本文一是改良了成本次可加模型的数据选取方式,避免因不区分上下游业务环节及垄断利润过高造成自然垄断属性误判;二是引入随机推断法,在一定程度上控制了双重差分法的小样本学术难题,有助于双重差分模型在政策绩效评估中的进一步科学应用。
[期刊] 统计研究
[作者]
刘晓宇 金勇进 倪成
以互联网为媒介的调查数据采集具有成本低、速度快等优势,但这些样本通常属于非概率样本,存在覆盖误差和选择性偏差,不具有总体代表性,无法直接用于有限总体推断。基于概率-非概率样本的数据整合,可以综合两类样本的优势,处理这些非概率样本偏差。本文将非概率样本看作有限总体的不完全覆盖,在假定概率样本和非概率样本有重合的前提下,构造数据整合事后分层与校准估计。该假定是校准的基础,在此框架下考虑测量误差的校正,在概率样本或非概率样本存在测量误差的情况下,提出基于无偏误真值的校准和基于有偏误测量值修正的校准两种思路。此外,本文还提出基于Bagging决策树的半监督分类法,用于识别非概率样本和概率样本的重合部分,这在实际工作中具有较强的指导意义。
[期刊] 统计研究
[作者]
金勇进 刘展
利用大数据进行抽样,很多情况下由于抽样框的构造比较困难,使得抽取的样本属于非概率样本,传统的抽样推断理论难以应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,本文以基于样本匹配的样本选择为例探讨了具体解决方法。
关键词:
大数据 非概率抽样 统计推断
[期刊] 数理统计与管理
[作者]
沈寒蕾 张虎
本文提出了一种贝叶斯潜变量倾向得分半联合模型(BS_LVM_PSA),探讨了如何将潜变量纳入倾向得分分析,同时引入先验信息,利用半联合贝叶斯方法进行参数估计。通过两个数值模拟来测算BS_LVM_PSA在特定环境的性能,并将BS_LVM_PSA应用于实例数据。模拟研究显示:第一,潜变量能够降低预处理协变量测量误差,提高处理效应估计精度;第二,不同匹配方法下,贝叶斯方法相对于频率学派的处理效应估计精度更高;第三,在小样本中,贝叶斯方法相比非贝叶斯方法预测精度和稳定性更高;第四,有先验信息的处理效应估计精度高于无信息先验,且在适度的先验精度下,处理效应估计更加可靠。实例分析中,利用本文提出的BS_LVM_PSA研究了社区扶贫政策的减贫效应。
[期刊] 现代情报
[作者]
夏一雪 兰月新 刘冰月 瞿志凯
[目的/意义]面向大数据研究多个网络传播平台之间网络舆情信息交互模型,能够准确把握大数据环境下网络舆情演化趋势以及网络信息在多个平台之间的传播规律,为政府治理网络舆情提供参考依据。[方法/过程]定性分析大数据环境下网络舆情信息交互机理,通过定义交互系数,基于微分方程理论构建网络舆情信息交互模型,并应用差分回归法对各个媒体平台的网络舆情信息交互趋势开展预测。[结论/结果]经过理论建模和实证分析得出本文构建的信息交互模型及趋势预测方法是可行的,以上理论研究可为政府准确把握大数据环境下网络舆情演化规律,制定网络
[期刊] 统计与决策
[作者]
刘展 金勇进
文章针对非概率抽样统计推断问题,提出了一种解决方法:首先采用倾向得分匹配选择样本,然后采用倾向得分逆加权、加权组调整和事后分层调整三种方法对匹配样本进行加权调整来估计目标总体,并比较不同方法估计的效果。蒙特卡罗模拟与实证研究表明:当网络访问固定样本大小与目标样本大小的比率小于3时,三种加权方法估计的效果均比未加权时匹配样本的估计效果好;当网络访问固定样本大小与目标样本大小的比率不小于3时,倾向得分事后分层调整与未加权的匹配样本估计效果较好。
关键词:
倾向得分 匹配 加权调整 非概率
[期刊] 统计研究
[作者]
马键 胡毅 徐淑一
本文分析后定变量对处置效应模型估计的影响。在Rubin因果范式中引入后定变量,证明此时非混淆性假设失效,进而导致多组识别方程失效,倾向得分函数估计出现偏误。识别方程失效、倾向得分估计偏误导致多种基于倾向得分的处置效应估计非一致。进一步扩展到高维处置效应的情形,证明非混淆性假设蕴含条件外生性假设,引入后定变量会导致内生性问题,使得高维LASSO/PostLASSO估计出现偏误。蒙特卡洛模拟实验证实,后定变量将导致倾向得分估计与LASSO/Post-LASSO估计出现偏误。基于理论分析的结论,对Dickson等(2015)的实证案例进行分析。
关键词:
处置效应 后定变量 倾向得分 LASSO
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除