- 年份
- 2024(2219)
- 2023(2950)
- 2022(2575)
- 2021(2364)
- 2020(2112)
- 2019(4874)
- 2018(4864)
- 2017(9162)
- 2016(4961)
- 2015(5439)
- 2014(5077)
- 2013(4856)
- 2012(4492)
- 2011(3943)
- 2010(3852)
- 2009(3209)
- 2008(3223)
- 2007(2929)
- 2006(2533)
- 2005(2224)
- 学科
- 济(20560)
- 经济(20542)
- 管理(12679)
- 方法(11617)
- 业(11404)
- 数学(10388)
- 数学方法(10132)
- 企(8933)
- 企业(8933)
- 财(5650)
- 中国(5283)
- 学(4562)
- 农(4259)
- 业经(3981)
- 贸(3340)
- 贸易(3337)
- 易(3262)
- 制(3250)
- 地方(3058)
- 农业(3057)
- 银(2903)
- 银行(2897)
- 务(2890)
- 财务(2880)
- 财务管理(2871)
- 技术(2863)
- 和(2830)
- 融(2808)
- 金融(2807)
- 理论(2737)
- 机构
- 大学(66470)
- 学院(63767)
- 济(27577)
- 经济(27046)
- 管理(25619)
- 研究(22295)
- 理学(22087)
- 理学院(21843)
- 管理学(21251)
- 管理学院(21131)
- 中国(17791)
- 京(14862)
- 科学(13908)
- 财(12639)
- 中心(11009)
- 所(10882)
- 财经(10177)
- 研究所(10001)
- 农(9853)
- 业大(9628)
- 经(9359)
- 北京(9305)
- 经济学(9243)
- 江(9090)
- 经济学院(8415)
- 院(8389)
- 范(7898)
- 师范(7841)
- 农业(7733)
- 财经大学(7651)
- 基金
- 项目(46205)
- 科学(36999)
- 基金(35292)
- 研究(32576)
- 家(31407)
- 国家(31202)
- 科学基金(26970)
- 社会(21347)
- 社会科(20451)
- 社会科学(20444)
- 基金项目(17768)
- 自然(17625)
- 自然科(17275)
- 自然科学(17273)
- 自然科学基金(16935)
- 省(16299)
- 资助(15189)
- 教育(14661)
- 划(14495)
- 编号(12844)
- 成果(10650)
- 部(10567)
- 重点(10426)
- 国家社会(9787)
- 发(9439)
- 科研(9245)
- 创(9211)
- 教育部(9127)
- 人文(8679)
- 创新(8668)
共检索到95874条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
王泳欣 张大斌 车大庆 吕建秋
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。
[期刊] 统计与决策
[作者]
孟东霞 李玉鑑
针对实际应用中不平衡数据集分类效果较差的问题,文章提出一种基于特征边界信息进行欠采样的数据处理方法。所提方法根据特征边界点的定义获得多数类样本中可构造特征边界的数据点,其分布在最优非线性分类决策面附近,通常包含重要的分类信息,在欠采样时应进行保留,其他多数类样本远离分类决策面,在分类中易于识别,可在聚类后选取部分样本和少数类样本构成平衡数据集。该方法保留了多数类样本的几何分布特征,降低了样本的信息流失率。对比实验利用支持向量机进行分类,实验结果表明该方法有利于提高不平衡数据中少数类的分类精度,验证了算法的有效性。
关键词:
平衡数据集 欠采样 特征边界 聚类
[期刊] 统计与决策
[作者]
孟东霞 魏晓光 柳凌燕
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。
关键词:
不平衡数据集 欠采样 自然最近邻
[期刊] 统计与决策
[作者]
宋捷 吕晓玲 吴喜之
Boosting算法是一类串行的集成算法,可用于分类和回归。不同的算法由不同的损失与不同的集成方式构成。文章提出了一种自适应地处理分类中的不平衡数据的Boosting算法Baboost。实验证明该算法能有效地减小各个类内部的预测误差。
[期刊] 统计与决策
[作者]
张智驹
大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。
[期刊] 统计与决策
[作者]
朱梅红
在数据挖掘的分类问题中,经常出现数据集内类别不平衡现象。大部分分类方法对于不平衡数据集内的小类数据,分类精度并不理想。文章分析了多目标线性规划分类方法(简称MCLP)在不平衡数据集上的表现;然后从模型角度,提出了面向不平衡数据集的加权MCLP分类模型。从理论上分析了加权MCLP分类模型的有效性,并从实证角度,与其他方法进行了比较。
[期刊] 统计与决策
[作者]
刘洋
在应用机器学习构建数据模型的过程中,经常会面临类不平衡性的问题,在许多研究中,降低数据集的不平衡性多采用欠抽样法来进行处理,再应用C4.5、NB、LR、RF、KNN等机器学习算法进行数据建模。实验结果往往表明,欠抽样法得到的模型准确度并不尽如人意,原因是这种方法是在牺牲负样本的预测精度前提下来提高整体精度的,因此,文章试图在尽量不减少原数据集中有用信息丢失的前提下采用重复抽样法进行数据处理可以有效弥补欠抽样法所带来的信息损失,进而提高模型精度。
关键词:
不平衡数据集 机器学习 欠抽样 重复抽样
[期刊] 情报理论与实践
[作者]
刘嘉宇 李贺 谷莹 时倩如 杨心苗
[目的/意义]先前研究在识别有用性在线评论时假设数据集类是平衡的,但真实数据往往不符合这一假定。为克服这一局限,文章从真实情景出发提出了在不平衡数据集上识别在线评论的有用性,以提升在线评论的效用。[方法/过程]提出不平衡数据集上在线评论有用性识别模型,该模型包括在线评论有用性特征集构建、融合SMOTE和Boosting的有用性识别算法以及识别效果评价等模块,并从真实数据集出发验证了模型的识别效果。[结果/结论]模型在解决类不平衡后准确识别在线评论有用性的综合性能超过89%,优于未解决类不平衡的分类识别算法,为在线评论有用性识别提供了有效的方法和工具。
[期刊] 统计与决策
[作者]
陈钟毓 尹居良
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。
[期刊] 统计与决策
[作者]
宋捷
不平衡数据的分类问题一直都是分类中面临的问题。几乎所有的分类方法直接运用到不平衡数据上都会带来比较大的少数类数据的错判率。为了解决这一问题学者们提出了很多方法,文章就一些主要分类方法和评价标准作一个综述,为这一问题的解决提供一些参考。
关键词:
不平衡数据 分类 综述
[期刊] 中央财经大学学报
[作者]
江庆
本文对纵向财政不平衡的传统理论与新近发展进行了回顾,并根据纵向财政不平衡的传统定义和汉特(Hunter)的测量方法,构建了三个纵向财政不平衡系数,并对1994-2003年我国中央与地方财政纵向不平衡度进行测量,结果均显示分税制后我国纵向财政不平衡度呈现扩大趋势。
关键词:
纵向财政不平衡 分税制 汉特测量法
[期刊] 商业经济研究
[作者]
李根红
本文通过我国省域数据进行实证研究,分析了我国流通业集聚的不平衡性。研究发现:在2009-2017年期间,我国流通业集聚发展经历了从集聚劣势到集聚优势的过程,但东、中、西三大区域流通业集聚的不平衡性也比较明显,东部地区集聚优势较强而中西部地区表现出集聚劣势。通过三大细分产业的研究则发现,不同产业集聚水平的区域不平衡性也是相异的,重庆和陕西等地流通业及细分产业的集聚水平都处在前列,而江苏和浙江等相对发达地区在交通运输仓储邮政业这一细分领域的集聚程度反而较低。最后,按照流通业细分产业的均衡发展以及流通业整体的区域均衡发展,提出了相应的对策建议。
关键词:
流通业集聚 不平衡性 细分产业
[期刊] 云南财经大学学报
[作者]
商晨
发展不平衡是中国当前的主要矛盾之一,中国发展不平衡表现为多维度的不平衡,除原有的城乡差距之外,沿海与内地、东中西部,甚至同一地区内部,都存在明显的差距。发展不平衡现象在理论上可以被归结为二元经济,通过对二元经济结构的形成机理进行分析,发现资本向某些地区聚集,导致地区间分工深化水平出现差距,是二元经济结构形成和区域发展不平衡的原因。计划体制下城乡间资本分布的不均衡,在市场化改革中并没有收敛,反而由于禀赋差异导致的资本回报率差异,使资本向部分地区聚集,导致新的地区资本分布和分工深化的差异,造成新的发展不平衡现象。使用1995—2015年间省际面板数据验证了相关的理论命题。
[期刊] 统计与决策
[作者]
韩冰 陈华友 陶志富 刘兮
现有的语言术语集在刻画决策信息时可能会导致信息的损失,文章针对属性值是概率不平衡语言且属性权重和时序权重未知的决策问题,构建了动态多属性决策模型。首先定义概率不平衡语言术语集,构建基于灰关联偏离度最小的线性规划模型,确定最优属性权重,得到单个时段的灰关联投影值;其次,考虑不同时段评价信息对最终决策的不同影响,建立指数衰减模型确定时序权重,获得综合投影值,并以此选出最佳方案。最后通过实例说明了该模型的实用性和有效性。
[期刊] 东北亚论坛
[作者]
张致顺 张世和
韩日建交以来,韩日间的贸易始终韩方逆差,一次也未出现顺差。其原因是多方面的,但其根本性的原因是韩国产业结构依赖于日本。核心技术、核心零部件依赖于日本,是结构性的。韩国为了摆脱对日贸易长期处于逆差的局面,应增强商品品质的竞争力、零部件的竞争力、开拓中间市场、继续维持和扩大对日出口良好品种的市场、努力扩大发达工业国市场、维持适合韩国国情的汇率水平、努力使日本缓和非贸易壁垒和积极吸引日本企业的投资等。
关键词:
韩日贸易 对日逆差原因 解决方法
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除