- 年份
- 2024(7407)
- 2023(10776)
- 2022(9737)
- 2021(9282)
- 2020(7882)
- 2019(18356)
- 2018(18222)
- 2017(35317)
- 2016(19320)
- 2015(21851)
- 2014(21661)
- 2013(21284)
- 2012(19554)
- 2011(17449)
- 2010(17242)
- 2009(15691)
- 2008(15387)
- 2007(13399)
- 2006(11717)
- 2005(10056)
- 学科
- 济(74435)
- 经济(74344)
- 管理(56607)
- 业(53281)
- 企(45254)
- 企业(45254)
- 方法(36666)
- 数学(31436)
- 数学方法(30990)
- 农(19353)
- 财(18986)
- 中国(18779)
- 学(17089)
- 业经(16833)
- 地方(14697)
- 理论(13425)
- 制(12986)
- 贸(12952)
- 贸易(12946)
- 农业(12928)
- 务(12580)
- 易(12566)
- 和(12551)
- 财务(12509)
- 财务管理(12486)
- 技术(12062)
- 企业财务(11854)
- 环境(11266)
- 划(10732)
- 教育(10633)
- 机构
- 大学(272151)
- 学院(268576)
- 管理(109764)
- 济(101643)
- 经济(99303)
- 理学(95834)
- 理学院(94809)
- 管理学(92953)
- 管理学院(92497)
- 研究(86702)
- 中国(63667)
- 京(58144)
- 科学(56009)
- 财(46308)
- 所(43364)
- 农(42254)
- 业大(41382)
- 中心(39801)
- 研究所(39745)
- 财经(37892)
- 江(37807)
- 北京(36590)
- 范(35854)
- 师范(35524)
- 经(34498)
- 农业(33152)
- 院(31518)
- 州(31321)
- 经济学(29399)
- 师范大学(28766)
- 基金
- 项目(188421)
- 科学(147295)
- 研究(137432)
- 基金(136379)
- 家(118638)
- 国家(117644)
- 科学基金(101136)
- 社会(84608)
- 社会科(80051)
- 社会科学(80030)
- 基金项目(73089)
- 省(73041)
- 自然(67024)
- 自然科(65498)
- 自然科学(65485)
- 自然科学基金(64275)
- 教育(63059)
- 划(61573)
- 编号(56925)
- 资助(56568)
- 成果(46316)
- 重点(41440)
- 部(41226)
- 发(38928)
- 创(38862)
- 课题(38144)
- 科研(36165)
- 创新(36135)
- 项目编号(35764)
- 教育部(35399)
- 期刊
- 济(108454)
- 经济(108454)
- 研究(77077)
- 中国(47385)
- 学报(44770)
- 科学(40343)
- 管理(39593)
- 农(38138)
- 财(34482)
- 大学(33849)
- 学学(31621)
- 教育(31264)
- 农业(26879)
- 技术(23327)
- 融(19980)
- 金融(19980)
- 财经(17932)
- 业经(17593)
- 图书(17156)
- 经济研究(16501)
- 经(15166)
- 理论(14300)
- 问题(14184)
- 科技(13522)
- 业(13497)
- 实践(13313)
- 践(13313)
- 技术经济(13057)
- 版(12711)
- 情报(12380)
共检索到382259条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
宋瑞琪 朱永忠 王新军
如何在高维数据空间中筛选有用变量,提取有用的信息,是大数据时代研究的热点之一。文章将变量选择的方法应用于高维数据,通过模拟仿真,引进敏感性与特异性,分析比较岭回归、Lasso、自适应Lasso以及Elastic Net回归等方法的适用领域,并指出变量选择方法的应用前景。
关键词:
大数据 系数压缩法 变量选择 高维数据
[期刊] 数理统计与管理
[作者]
曾津 周建军
变量选择是统计学知识结构中不可或缺的一部分。本文归纳梳理了近二十年多来的变量选择方法,着重介绍了处理高维数据以及超高维数据的变量选择方法。最后我们通过一个实例比较了不同变量选择方法的差异性。
[期刊] 数理统计与管理
[作者]
曾津 周建军
变量选择是统计学知识结构中不可或缺的一部分。本文归纳梳理了近二十年多来的变量选择方法,着重介绍了处理高维数据以及超高维数据的变量选择方法。最后我们通过一个实例比较了不同变量选择方法的差异性。
[期刊] 统计与决策
[作者]
白玥 田茂再
变量选择一直是建立回归模型中的一个重要问题。文章基于线性模型对lasso、adaptive-lasso、SCAD、elastic net、group lasso和group SCAD等方法进行了较为系统的比较分析,通过进行无分组变量和有分组变量的模拟实验,比较了几种方法之间的优缺点和相关联系。分析了在不同自变量相关系数以及在不同误差项方差的情况下,各种方法的模型误差的变化趋势以及相互之间的差异比较。
[期刊] 数理统计与管理
[作者]
冷薇 李俊鹏 张崇岐
变量选择是统计建模中重要的问题。当试验数据维数很高时,传统变量选择方法的应用受到了很多制约。本文以高维混料试验为基础,比较了AIC准则和LASSO在变量选择问题上的优良性。通过实例验证,LASSO可以快速且准确地对高维混料模型中的变量进行筛选,从而得出最优模型,达到降低成本、提高利益的目的。
关键词:
高维混料模型 变量选择 LASSO
[期刊] 统计与决策
[作者]
黄河 潘莹丽
在生物医学、临床试验和流行病学等领域的研究中,由于获得生存数据的试验设计、观测时间的局限,以及观测对象在进入或退出试验时的个体差异等方面的原因,与所关注事件的发生时间相关的数据经常存在右删失。基于右删失生存数据解析协变量和生存时间的关系时,应用最为广泛的统计模型是Cox模型。随着科学技术的进步,数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高,数据的维度通常可以达到成百上千维,甚至更高。文章提出一种Cox模型中基于Model-X Knockoffs的高维控制变量选择方法。首先基于Knockoffs框架建立一个Knockoffs变量,并基于原始协变量和其相应的Knockoffs变量构造一个正则化的目标函数,然后通过求解目标函数的最优解构造一个统计量和基于数据的阈值,最后进行变量选择。模拟分析和实证研究结果表明:所提方法可以在变量选择的同时提供可靠的FDR控制,优于传统的LASSO方法。
[期刊] 中国科学技术大学学报
[作者]
熊亦民 郑智 张伟平
近几年提出的Extremile回归不仅保留了分位数回归通过设定不同的分位点全面掌握数据信息的优点,而且与分位数回归中和Expectile回归相比也有其独特的优势,特别是在风险保护上的优秀表现。本文提出了一种带惩罚的线性Extremile回归模型用以解决高维数据下的变量选择问题,其中惩罚函数是由和惩罚函数组合得到的类弹性网(QEN)惩罚函数,同时给出了解决相关优化问题的EM算法,以及在较为宽松条件下即能成立相关理论性质。在数值模拟中,我们通过与L_0,L_1,L_2和弹性网惩罚函数的比较,展示了类弹性网惩罚函数。
[期刊] 统计与决策
[作者]
白永昕 钱曼玲 田茂再
在超高维数据中,一方面,协变量的维数可能远远大于样本量,甚至随着样本量以指数级的速度增长;另一方面,超高维数据通常是异质的,协变量对条件分布中心的影响可能与他们对尾部的影响大不相同,甚至会出现重尾以及异常点的复杂情况。文章在协变量维度发散且为超高维的情况下研究了部分线性可加分位数回归模型的变量选择和稳健估计问题。首先,为了实现模型的稀疏性和非参数光滑性,引入了一种非凸Atan双惩罚,并采用分位迭代坐标下降算法来解决所提方法的优化问题。在选择适当正则化参数的情况下,证明了所提双惩罚估计量的理论性质。其次,通过模拟研究对所提方法的性能进行验证。模拟结果表明,所提方法比其他惩罚方法具有更好的表现,尤其是在数据存在重尾的情况下。最后,通过基于癌症筛查病人血液样本数据的实证来验证所提方法的实用性。
[期刊] 中国人口科学
[作者]
李强 张震
文章对使用生存分析技术分析左截平数据时如何选择时间变量进行了探讨。作者从理论上、逻辑上、似然函数的构造、协变量系数的估计及模型对数据的拟合度方面指出,以真正的历险时间(如年龄)为时间变量是正确的模型表达,而以观测期为时间变量的模型表达是错误的,用中国高龄老人死亡风险的研究例示了这一结论。并指出在特定的情况下,两个模型对协变量的估计比较接近,研究者应该准确把握所研究事件的特点,选择正确的时间变量,从而正确表达风险函数和构建似然函数,准确地估计模型的各个参数。
[期刊] 统计与决策
[作者]
张陶陶 胡亚南 李扬 田茂再
文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用。将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标。
关键词:
稀疏聚类 高维数据 聚类 特征选择
[期刊] 统计与决策
[作者]
张陶陶 胡亚南 李扬 田茂再
文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用。将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标。
关键词:
稀疏聚类 高维数据 聚类 特征选择
[期刊] 数理统计与管理
[作者]
蔡敏 方李君 李洪喜 李树威
带有治愈亚组的区间删失数据常见于周期性随访或检查的医学研究中,此时研究总体中有一部分个体不会发生所感兴趣的事件,而对于每个发生所感兴趣事件的个体,其事件的发生时间落入某一时间区间内而非被精确地观测到。此外,在实际问题中,我们时常会遇到协变量维数较高的情形,而如何进行变量选择以识别出对疾病发生有重要影响的因素十分重要。本文研究带有治愈亚组的区间删失数据的变量选择问题,我们采用最小近似信息准则方法并提出一种惩罚期望极大化算法来同时实现变量选择和参数估计,所提出方法的一个重要优点是在变量选择过程中无须选择最优调节参数。通过数值模拟,我们比较所提出方法与一般的正则化方法如LASSO,ALASSO,以及SCAD在有限样本下的表现。结果表明,所提出方法有很高的变量选择准确率且在计算上比LASSO,ALASSO和SCAD更加快速、高效。最后,我们将所提出方法应用到一组有关于尼日利亚新生儿童死亡率的区间删失数据中。
[期刊] 数理统计与管理
[作者]
蔡敏 方李君 李洪喜 李树威
带有治愈亚组的区间删失数据常见于周期性随访或检查的医学研究中,此时研究总体中有一部分个体不会发生所感兴趣的事件,而对于每个发生所感兴趣事件的个体,其事件的发生时间落入某一时间区间内而非被精确地观测到。此外,在实际问题中,我们时常会遇到协变量维数较高的情形,而如何进行变量选择以识别出对疾病发生有重要影响的因素十分重要。本文研究带有治愈亚组的区间删失数据的变量选择问题,我们采用最小近似信息准则方法并提出一种惩罚期望极大化算法来同时实现变量选择和参数估计,所提出方法的一个重要优点是在变量选择过程中无须选择最优调节参数。通过数值模拟,我们比较所提出方法与一般的正则化方法如LASSO,ALASSO,以及SCAD在有限样本下的表现。结果表明,所提出方法有很高的变量选择准确率且在计算上比LASSO,ALASSO和SCAD更加快速、高效。最后,我们将所提出方法应用到一组有关于尼日利亚新生儿童死亡率的区间删失数据中。
[期刊] 统计研究
[作者]
斯介生 李扬 谢邦昌
在大数据时代,数据的异质性和变量的稀疏性是不可回避的两大问题。本文针对上述问题构建了异质性Logit变量选择模型。研究显示,在不同的异质性条件下,本文的方法可以明显区分有效变量和冗余变量。而且,通过Gmeans等评价指标可知该模型具有很好的预测效果。在对上市公司财务预警分析的应用研究中,本文方法得到了具有解释意义的结果,说明该方法具有一定的实证价值。
关键词:
异质性 变量选择 财务预警
[期刊] 统计与决策
[作者]
朱燚丹 陈兴荣 李秋萍
文章针对信息增益变量选择方法(IG-SIS)的不足,对其进行改进,提出适用于超高维、无模型假设框架下基于信息增益率的变量选择方法(IGR-SIS),从理论上证明了IGR-SIS方法具有确定性筛选性质,并通过蒙特卡洛数值模拟和基因表达分类数据验证IGR-SIS方法对超高维分类变量选择的有效性。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除