标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(9031)
2023(12981)
2022(11458)
2021(10776)
2020(8934)
2019(20841)
2018(20715)
2017(40178)
2016(21592)
2015(24179)
2014(23892)
2013(23237)
2012(20886)
2011(18563)
2010(18062)
2009(15940)
2008(15084)
2007(12606)
2006(10575)
2005(8587)
作者
(58493)
(48656)
(48132)
(45986)
(30971)
(23271)
(22002)
(19353)
(18473)
(16941)
(16667)
(16108)
(15138)
(15107)
(14948)
(14645)
(14530)
(14517)
(13864)
(13759)
(11833)
(11632)
(11585)
(11124)
(10862)
(10701)
(10586)
(10533)
(9664)
(9634)
学科
(83067)
经济(82980)
管理(61666)
(57871)
(48897)
企业(48897)
方法(43639)
数学(38532)
数学方法(37927)
(21137)
(21025)
中国(19982)
业经(18576)
(17192)
地方(15740)
理论(14492)
(14248)
贸易(14243)
农业(14177)
(13929)
财务(13859)
(13834)
财务管理(13831)
技术(13674)
(13359)
企业财务(13102)
环境(13034)
(12534)
(11684)
教育(10814)
机构
大学(294072)
学院(291568)
管理(122650)
(113407)
经济(111038)
理学(108472)
理学院(107341)
管理学(105255)
管理学院(104740)
研究(89958)
中国(64609)
(60835)
科学(56854)
(49714)
业大(44293)
(42753)
(42411)
中心(42154)
财经(41582)
研究所(39304)
(38986)
(38739)
师范(38398)
(38132)
北京(37517)
经济学(33851)
农业(33528)
(33453)
(32173)
财经大学(31477)
基金
项目(214774)
科学(170039)
基金(157272)
研究(157072)
(136220)
国家(135126)
科学基金(117922)
社会(98629)
社会科(93543)
社会科学(93517)
基金项目(84191)
(83368)
自然(78030)
自然科(76258)
自然科学(76241)
自然科学基金(74826)
教育(73103)
(70422)
资助(64744)
编号(64630)
成果(50441)
重点(47422)
(47411)
(44882)
(44658)
课题(42999)
创新(41793)
科研(41611)
教育部(41201)
大学(40709)
期刊
(111369)
经济(111369)
研究(79744)
中国(47518)
学报(44896)
管理(42841)
科学(41438)
(37231)
(36944)
大学(34746)
教育(33246)
学学(32628)
技术(26682)
农业(26572)
业经(19150)
(19130)
金融(19130)
财经(19083)
经济研究(17989)
图书(16786)
(16180)
问题(14551)
理论(14510)
科技(14430)
技术经济(13889)
实践(13556)
(13556)
(13137)
(13023)
情报(12983)
共检索到394304条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 统计与决策  [作者] 刘洋  
在应用机器学习构建数据模型的过程中,经常会面临类不平衡性的问题,在许多研究中,降低数据集的不平衡性多采用欠抽样法来进行处理,再应用C4.5、NB、LR、RF、KNN等机器学习算法进行数据建模。实验结果往往表明,欠抽样法得到的模型准确度并不尽如人意,原因是这种方法是在牺牲负样本的预测精度前提下来提高整体精度的,因此,文章试图在尽量不减少原数据集中有用信息丢失的前提下采用重复抽样法进行数据处理可以有效弥补欠抽样法所带来的信息损失,进而提高模型精度。
[期刊] 统计与决策  [作者] 宋捷  吕晓玲  吴喜之  
Boosting算法是一类串行的集成算法,可用于分类和回归。不同的算法由不同的损失与不同的集成方式构成。文章提出了一种自适应地处理分类中的不平衡数据的Boosting算法Baboost。实验证明该算法能有效地减小各个类内部的预测误差。
[期刊] 情报理论与实践  [作者] 刘嘉宇  李贺  谷莹  时倩如  杨心苗  
[目的/意义]先前研究在识别有用性在线评论时假设数据集类是平衡的,但真实数据往往不符合这一假定。为克服这一局限,文章从真实情景出发提出了在不平衡数据集上识别在线评论的有用性,以提升在线评论的效用。[方法/过程]提出不平衡数据集上在线评论有用性识别模型,该模型包括在线评论有用性特征集构建、融合SMOTE和Boosting的有用性识别算法以及识别效果评价等模块,并从真实数据集出发验证了模型的识别效果。[结果/结论]模型在解决类不平衡后准确识别在线评论有用性的综合性能超过89%,优于未解决类不平衡的分类识别算法,为在线评论有用性识别提供了有效的方法和工具。
[期刊] 统计与决策  [作者] 王泳欣  张大斌  车大庆  吕建秋  
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。
[期刊] 统计与决策  [作者] 陈钟毓  尹居良  
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。
[期刊] 保险研究  [作者] 沈扬扬  
基于保险密度和保险深度指标,利用2001年~2009年数据,研究中国保险业区域发展差距的情况,并得到研究成果,一是以保险密度为标准,2003年后我国区域保险业的发展呈现σ收敛、β收敛以及跨越式增长态势;二是以保险深度为标准,2003年之后我国区域保险业的发展基本呈现σ发散态势;三是以保险密度为衡量标准的区域保险业发展水平具有空间收敛的性质,而以保险深度为指标则不存在空间相关;四是人身保险对保险业区域差距的贡献度更大,其变动特点决定了保险业整体区域发展差距的变动特点;五是以保险密度指标衡量,对保险业区域发展差距贡献最大是三大地区间的差距,但有下降趋势,以保险深度指标衡量,则三大地区间差距是最小的...
[期刊] 商业经济研究  [作者] 李根红  
本文通过我国省域数据进行实证研究,分析了我国流通业集聚的不平衡性。研究发现:在2009-2017年期间,我国流通业集聚发展经历了从集聚劣势到集聚优势的过程,但东、中、西三大区域流通业集聚的不平衡性也比较明显,东部地区集聚优势较强而中西部地区表现出集聚劣势。通过三大细分产业的研究则发现,不同产业集聚水平的区域不平衡性也是相异的,重庆和陕西等地流通业及细分产业的集聚水平都处在前列,而江苏和浙江等相对发达地区在交通运输仓储邮政业这一细分领域的集聚程度反而较低。最后,按照流通业细分产业的均衡发展以及流通业整体的区域均衡发展,提出了相应的对策建议。
[期刊] 统计与决策  [作者] 朱梅红  
在数据挖掘的分类问题中,经常出现数据集内类别不平衡现象。大部分分类方法对于不平衡数据集内的小类数据,分类精度并不理想。文章分析了多目标线性规划分类方法(简称MCLP)在不平衡数据集上的表现;然后从模型角度,提出了面向不平衡数据集的加权MCLP分类模型。从理论上分析了加权MCLP分类模型的有效性,并从实证角度,与其他方法进行了比较。
[期刊] 工业工程与管理  [作者] 闫伟  何桢  田文萌  何曙光  
为了在高维不平衡质量特性数据集中提高关键质量特征识别效率,将EM(ExpectationMaximization)算法引入,通过逐步缩小比例较大数据集内的样本数量来抵消数据不平衡带来的负面影响。算例表明,该方法具有一定的合理性和可行性。
[期刊] 统计与决策  [作者] 孟东霞  李玉鑑  
针对实际应用中不平衡数据集分类效果较差的问题,文章提出一种基于特征边界信息进行欠采样的数据处理方法。所提方法根据特征边界点的定义获得多数类样本中可构造特征边界的数据点,其分布在最优非线性分类决策面附近,通常包含重要的分类信息,在欠采样时应进行保留,其他多数类样本远离分类决策面,在分类中易于识别,可在聚类后选取部分样本和少数类样本构成平衡数据集。该方法保留了多数类样本的几何分布特征,降低了样本的信息流失率。对比实验利用支持向量机进行分类,实验结果表明该方法有利于提高不平衡数据中少数类的分类精度,验证了算法的有效性。
[期刊] 统计与决策  [作者] 孟东霞  魏晓光  柳凌燕  
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。
[期刊] 数量经济技术经济研究  [作者] 任婷婷  鲁统宇  崔俊  
研究目标:构建动态不平衡财务预警模型以同时处理概念漂移和数据分布不平衡问题。研究方法:在改进AdaBoost算法的基础上,以代价敏感支持向量机为基分类器构建ADA-CSSVM-TW模型,并利用我国2010~2020年制造业公司数据进行分析。研究发现:ADA-CSSVM-TW模型可显著提高预测准确率,性能良好,模型稳健。研究创新:将代价敏感支持向量机作为改进AdaBoost算法的基分类器,建立动态不平衡预警模型。研究价值:对我国上市公司有效防范财务困境具有重要的理论价值和现实意义。
[期刊] 统计与决策  [作者] 祁飞  
比较优势和新经济地理共同决定了经济活动的空间分布,导致区域不平衡发展。文章的目的在于从经验上分离导致区域不平衡的这两种因素,通过构建一个融合比较优势区域特征和新经济地理行业特征的模型,利用中国9个制造业部门,2006~2012年的面板数据,估计了这两种因素对中国区域产出的作用。研究发现,区域要素禀赋和地理位置上的比较优势极大程度上决定了中国制造业区位,比较优势的"第一性"特征引起的区域产业结构的差异是导致区域不平衡发展的关键因素,而NEG模型关于规模经济、产业纵向联系、最终品产出份额等变量对于中国制造业区位并无显著影响。
[期刊] 山西财经大学学报  [作者] 杨有志  代伟  
投标单位在投标过程中常采用不平衡报价方法,利用信息不对称优势,在不违规的前提下追逐利益最大化。文章从不平衡投标报价的成因入手,提出了招标建设单位不平衡投标报价的对策,对其投资控制具有一定的实用价值。
[期刊] 清华大学学报(自然科学版)  [作者] 贾春福  王雅飞  陈阳  孙梦洁  葛凤仪  
大数据时代要求数据在云端进行存储和计算,这导致敏感数据隐私泄露的问题。该文提出了一种在同态加密数据集上应用机器学习分类算法的方案:首先对明文进行预处理,保证其满足对数据进行同态加密的要求;然后在加密数据集上通过协议实现比较、排序等操作;最后获取分类结果。客户端将加密数据上传,可以保证服务器端不会获取任何敏感信息;选取同态加密算法,能够保证服务器端仍可对密文执行相关操作。实验结果表明:该方案适用于Bayes、超平面和决策树分类器,其经过修正具有良好的适用性能,准确率高。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除