- 年份
- 2024(1969)
- 2023(2751)
- 2022(2592)
- 2021(2210)
- 2020(1995)
- 2019(4863)
- 2018(4882)
- 2017(9320)
- 2016(5105)
- 2015(5555)
- 2014(5473)
- 2013(5376)
- 2012(5020)
- 2011(4459)
- 2010(4416)
- 2009(3742)
- 2008(3875)
- 2007(3418)
- 2006(2872)
- 2005(2625)
- 学科
- 济(21594)
- 经济(21578)
- 管理(13837)
- 业(12560)
- 方法(12051)
- 企(10654)
- 企业(10654)
- 数学(10271)
- 数学方法(10016)
- 财(6670)
- 中国(5250)
- 学(5232)
- 务(4264)
- 财务(4246)
- 财务管理(4241)
- 业经(4141)
- 企业财务(4061)
- 农(3873)
- 理论(3742)
- 和(3301)
- 融(3289)
- 金融(3289)
- 银(3170)
- 银行(3161)
- 制(3128)
- 贸(3081)
- 贸易(3080)
- 地方(3047)
- 易(2993)
- 行(2942)
- 机构
- 大学(71228)
- 学院(68047)
- 济(28706)
- 经济(28124)
- 管理(27261)
- 理学(23737)
- 理学院(23484)
- 研究(23418)
- 管理学(22850)
- 管理学院(22739)
- 中国(18492)
- 京(15893)
- 科学(14701)
- 财(13558)
- 所(12005)
- 中心(11178)
- 财经(11013)
- 研究所(10819)
- 农(10215)
- 北京(10151)
- 经(10115)
- 业大(9782)
- 江(9600)
- 经济学(9443)
- 范(8790)
- 师范(8710)
- 经济学院(8609)
- 院(8523)
- 财经大学(8236)
- 农业(8022)
- 基金
- 项目(47282)
- 科学(37344)
- 基金(35666)
- 研究(33146)
- 家(31391)
- 国家(31174)
- 科学基金(26894)
- 社会(21382)
- 社会科(20437)
- 社会科学(20431)
- 基金项目(18210)
- 自然(17774)
- 自然科(17394)
- 自然科学(17392)
- 自然科学基金(17042)
- 省(16574)
- 资助(15502)
- 教育(15091)
- 划(14810)
- 编号(13270)
- 成果(11218)
- 部(10843)
- 重点(10581)
- 科研(9502)
- 国家社会(9471)
- 发(9434)
- 教育部(9378)
- 创(9372)
- 大学(8983)
- 人文(8971)
共检索到100574条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
宋捷
不平衡数据的分类问题一直都是分类中面临的问题。几乎所有的分类方法直接运用到不平衡数据上都会带来比较大的少数类数据的错判率。为了解决这一问题学者们提出了很多方法,文章就一些主要分类方法和评价标准作一个综述,为这一问题的解决提供一些参考。
关键词:
不平衡数据 分类 综述
[期刊] 统计与决策
[作者]
孟东霞 李玉鑑
针对实际应用中不平衡数据集分类效果较差的问题,文章提出一种基于特征边界信息进行欠采样的数据处理方法。所提方法根据特征边界点的定义获得多数类样本中可构造特征边界的数据点,其分布在最优非线性分类决策面附近,通常包含重要的分类信息,在欠采样时应进行保留,其他多数类样本远离分类决策面,在分类中易于识别,可在聚类后选取部分样本和少数类样本构成平衡数据集。该方法保留了多数类样本的几何分布特征,降低了样本的信息流失率。对比实验利用支持向量机进行分类,实验结果表明该方法有利于提高不平衡数据中少数类的分类精度,验证了算法的有效性。
关键词:
平衡数据集 欠采样 特征边界 聚类
[期刊] 统计与决策
[作者]
陈伟 刘思峰 Robin Qiu
对用于面向数据的计算机审计的数据处理方法进行了综述。首先阐述了审计数据处理在面向数据的计算机审计中的重要性,然后分析了目前常用的审计数据处理方法以及其在审计软件中的应用情况。最后,结合信息技术的发展现状,分析了目前正在探索的审计数据处理方法,并指出了审计数据处理方法研究的发展趋势。
关键词:
计算机辅助审计 数据处理 审计方法
[期刊] 国际商务研究
[作者]
马建军 鲁晓东
近年来,因中国对美国贸易顺差持续加大而导致的中美贸易不平衡加剧始终是中美双方关注的焦点。而关于造成中美贸易不平衡的原因分析,学者们则见仁见智。本文通过分类和归纳总结,尝试从统计误差、人民币汇率、外资、储蓄投资缺口、产业转移、贸易政策以及产业内贸易等不同角度对研究中美贸易不平衡原因的文献进行综述。
[期刊] 国际贸易问题
[作者]
林斐婷
近年来,美中贸易逆差一直是中美双方颇为关注的一个热点问题,也是影响两国贸易关系发展的一个主要障碍,学者们在关于中美贸易不平衡说法方面也存在很多争议,主要可以分为以下几个方面:中美贸易统计数据上的巨大差别;隐藏在巨额顺差数据背后的实质;关于美国对中美贸易不平衡态度的争论。本文以这三个方面为线索对研究中美贸易不平衡的文献进行综述。
[期刊] 统计与决策
[作者]
孟东霞 魏晓光 柳凌燕
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。
关键词:
不平衡数据集 欠采样 自然最近邻
[期刊] 统计与决策
[作者]
王泳欣 张大斌 车大庆 吕建秋
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。
[期刊] 统计与决策
[作者]
宋捷 吕晓玲 吴喜之
Boosting算法是一类串行的集成算法,可用于分类和回归。不同的算法由不同的损失与不同的集成方式构成。文章提出了一种自适应地处理分类中的不平衡数据的Boosting算法Baboost。实验证明该算法能有效地减小各个类内部的预测误差。
[期刊] 数理统计与管理
[作者]
何晓群 夏利宇 姜天英
征信数据中的客户往往呈现"好多坏少"的不平衡结构,这种结构使得一般的分类模型在预测客户信用表现时失效。本文基于零膨胀计数模型的建模思想,分别提出处理因变量为二分类变量、多分类变量、计数变量的零膨胀信用评级模型(ZICSM),将客户结构拆分为稳定好客户、不稳定好客户和坏客户三个部分,利用模型自身优势形成严谨和宽松的两套贷款审批机制。ZICSM模型对目标函数进行权数调整,使模型更加关注"坏"客户,在目标函数中加入惩罚项,使模型具备组变量选择功能。此外,本文提出兼顾风险把控和市场份额的RS得分指标,借以评价信用评级模型的分类效果。模拟研究和实证研究的结果表明,ZICSM模型能够提升金融机构的贷款收益,增加其审批机制的灵活性,适用于处理征信数据的不平衡问题。
[期刊] 统计与决策
[作者]
张智驹
大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。
[期刊] 统计与决策
[作者]
韩冰 陈华友 陶志富 刘兮
现有的语言术语集在刻画决策信息时可能会导致信息的损失,文章针对属性值是概率不平衡语言且属性权重和时序权重未知的决策问题,构建了动态多属性决策模型。首先定义概率不平衡语言术语集,构建基于灰关联偏离度最小的线性规划模型,确定最优属性权重,得到单个时段的灰关联投影值;其次,考虑不同时段评价信息对最终决策的不同影响,建立指数衰减模型确定时序权重,获得综合投影值,并以此选出最佳方案。最后通过实例说明了该模型的实用性和有效性。
[期刊] 东北亚论坛
[作者]
张致顺 张世和
韩日建交以来,韩日间的贸易始终韩方逆差,一次也未出现顺差。其原因是多方面的,但其根本性的原因是韩国产业结构依赖于日本。核心技术、核心零部件依赖于日本,是结构性的。韩国为了摆脱对日贸易长期处于逆差的局面,应增强商品品质的竞争力、零部件的竞争力、开拓中间市场、继续维持和扩大对日出口良好品种的市场、努力扩大发达工业国市场、维持适合韩国国情的汇率水平、努力使日本缓和非贸易壁垒和积极吸引日本企业的投资等。
关键词:
韩日贸易 对日逆差原因 解决方法
[期刊] 工业工程与管理
[作者]
闫伟 何桢 田文萌 何曙光
为了在高维不平衡质量特性数据集中提高关键质量特征识别效率,将EM(ExpectationMaximization)算法引入,通过逐步缩小比例较大数据集内的样本数量来抵消数据不平衡带来的负面影响。算例表明,该方法具有一定的合理性和可行性。
关键词:
复杂产品 聚类 高维 不平衡数据
[期刊] 统计与决策
[作者]
陈钟毓 尹居良
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。
[期刊] 统计与决策
[作者]
刘洋
在应用机器学习构建数据模型的过程中,经常会面临类不平衡性的问题,在许多研究中,降低数据集的不平衡性多采用欠抽样法来进行处理,再应用C4.5、NB、LR、RF、KNN等机器学习算法进行数据建模。实验结果往往表明,欠抽样法得到的模型准确度并不尽如人意,原因是这种方法是在牺牲负样本的预测精度前提下来提高整体精度的,因此,文章试图在尽量不减少原数据集中有用信息丢失的前提下采用重复抽样法进行数据处理可以有效弥补欠抽样法所带来的信息损失,进而提高模型精度。
关键词:
不平衡数据集 机器学习 欠抽样 重复抽样
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除