- 年份
- 2024(4889)
- 2023(7113)
- 2022(6127)
- 2021(5890)
- 2020(5209)
- 2019(12474)
- 2018(12487)
- 2017(23808)
- 2016(12903)
- 2015(14331)
- 2014(13964)
- 2013(13429)
- 2012(12324)
- 2011(11080)
- 2010(11508)
- 2009(10329)
- 2008(10388)
- 2007(9190)
- 2006(8142)
- 2005(7177)
- 学科
- 济(52786)
- 经济(52743)
- 管理(32192)
- 业(29690)
- 方法(27110)
- 企(24721)
- 企业(24721)
- 数学(24115)
- 数学方法(23472)
- 中国(12808)
- 学(12572)
- 农(12002)
- 财(11050)
- 业经(10252)
- 理论(10185)
- 贸(8884)
- 贸易(8877)
- 地方(8615)
- 易(8605)
- 农业(7920)
- 制(7814)
- 和(7255)
- 技术(7074)
- 银(7067)
- 银行(7044)
- 融(6969)
- 金融(6965)
- 行(6672)
- 教学(6395)
- 环境(6323)
- 机构
- 大学(178340)
- 学院(176118)
- 济(67052)
- 管理(65856)
- 经济(65595)
- 研究(61582)
- 理学(56907)
- 理学院(56208)
- 管理学(54438)
- 管理学院(54127)
- 中国(45661)
- 科学(40901)
- 京(39358)
- 所(32488)
- 农(32308)
- 财(30427)
- 研究所(29943)
- 业大(28753)
- 中心(27717)
- 江(27102)
- 农业(25520)
- 北京(24835)
- 财经(24280)
- 范(23912)
- 师范(23642)
- 院(22633)
- 经(22098)
- 州(21310)
- 经济学(20812)
- 技术(20797)
- 基金
- 项目(122179)
- 科学(95073)
- 基金(88120)
- 研究(85123)
- 家(79182)
- 国家(78612)
- 科学基金(66110)
- 社会(51912)
- 社会科(49271)
- 社会科学(49254)
- 省(47769)
- 基金项目(45423)
- 自然(44757)
- 自然科(43831)
- 自然科学(43819)
- 自然科学基金(42980)
- 划(41028)
- 教育(40814)
- 资助(38144)
- 编号(34298)
- 成果(28420)
- 重点(28414)
- 部(26420)
- 发(25492)
- 创(25051)
- 课题(24200)
- 科研(23943)
- 计划(23715)
- 创新(23413)
- 大学(22542)
共检索到261084条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
朱梅红
在数据挖掘的分类问题中,经常出现数据集内类别不平衡现象。大部分分类方法对于不平衡数据集内的小类数据,分类精度并不理想。文章分析了多目标线性规划分类方法(简称MCLP)在不平衡数据集上的表现;然后从模型角度,提出了面向不平衡数据集的加权MCLP分类模型。从理论上分析了加权MCLP分类模型的有效性,并从实证角度,与其他方法进行了比较。
[期刊] 情报理论与实践
[作者]
刘嘉宇 李贺 谷莹 时倩如 杨心苗
[目的/意义]先前研究在识别有用性在线评论时假设数据集类是平衡的,但真实数据往往不符合这一假定。为克服这一局限,文章从真实情景出发提出了在不平衡数据集上识别在线评论的有用性,以提升在线评论的效用。[方法/过程]提出不平衡数据集上在线评论有用性识别模型,该模型包括在线评论有用性特征集构建、融合SMOTE和Boosting的有用性识别算法以及识别效果评价等模块,并从真实数据集出发验证了模型的识别效果。[结果/结论]模型在解决类不平衡后准确识别在线评论有用性的综合性能超过89%,优于未解决类不平衡的分类识别算法,为在线评论有用性识别提供了有效的方法和工具。
[期刊] 统计与决策
[作者]
王泳欣 张大斌 车大庆 吕建秋
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。
[期刊] 统计与决策
[作者]
李雪芹 丰伟
文章通过界定二维指派及不平衡指派问题,针对运输换装过程中货物批数和车辆数不等的情况,建立了二维不平衡指派问题的优化模型,给出了遗传算法进行求解的方法。
关键词:
指派问题 遗传算法 随机 编码
[期刊] 统计与决策
[作者]
宋捷 吕晓玲 吴喜之
Boosting算法是一类串行的集成算法,可用于分类和回归。不同的算法由不同的损失与不同的集成方式构成。文章提出了一种自适应地处理分类中的不平衡数据的Boosting算法Baboost。实验证明该算法能有效地减小各个类内部的预测误差。
[期刊] 统计与决策
[作者]
刘赛可 何晓群 夏利宇
模型评价指标对于衡量模型的表现尤为关键,只有正确合理的评价指标才能更好地反映模型的性能优劣。由于AUC和KS指标在被用于评价信用评级模型时,均存在忽视了数据的不平衡性和类别误判代价不等价性的不足,故文章从代价敏感矩阵出发计算总损失,进而提出新的评价指标——AKS指标。进一步地,模拟分析的结果表明,由AKS指标确定的阈值较KS指标更合理,且不同情形下AUC、KS和AKS指标的有效性分析结果表明AKS指标可以较好地衡量模型的分类性能。
[期刊] 数理统计与管理
[作者]
何晓群 夏利宇 姜天英
征信数据中的客户往往呈现"好多坏少"的不平衡结构,这种结构使得一般的分类模型在预测客户信用表现时失效。本文基于零膨胀计数模型的建模思想,分别提出处理因变量为二分类变量、多分类变量、计数变量的零膨胀信用评级模型(ZICSM),将客户结构拆分为稳定好客户、不稳定好客户和坏客户三个部分,利用模型自身优势形成严谨和宽松的两套贷款审批机制。ZICSM模型对目标函数进行权数调整,使模型更加关注"坏"客户,在目标函数中加入惩罚项,使模型具备组变量选择功能。此外,本文提出兼顾风险把控和市场份额的RS得分指标,借以评价信用评级模型的分类效果。模拟研究和实证研究的结果表明,ZICSM模型能够提升金融机构的贷款收益,增加其审批机制的灵活性,适用于处理征信数据的不平衡问题。
[期刊] 运筹与管理
[作者]
田博 覃正
基于非平衡数据集的支持向量域分类模型,提出了一种银行客户个人信用预测方法。首先分析了信用预测的主要方法及其不足,然后研究了支持向量域分类模型及其参数的非负二次规划乘性更新算法,进而提出基于支持向量域分类模型的银行客户个人信用预测方法,最后使用人工数据和实际数据对提出方法与支持向量机预测方法进行对比实验。实验结果表明对于银行客户个人信用预测的非平衡数据分析问题,基于支持向量域模型的分类预测方法更有效。
[期刊] 国际贸易问题
[作者]
蒙自强
全球对外直接投资发展呈现出明显的不平衡性,而传统的OLI范式理论对此并不能做出解释。本文从要素禀赋的角度分析要素禀赋、厂商优势和FDI流出三者的关系,从而解释了全球对外直接投资发展不平衡的原因
[期刊] 南开经济研究
[作者]
蒙自强
全球对外直接投资发展呈现出明显的不平衡性,而传统的OLI范式理论对此并不能做出解释。本文从要素禀赋的角度分析要素禀赋、厂商优势和FDI流出三者的关系,从而解释了全球对外直接投资发展不平衡的原因。
关键词:
要素禀赋 FDI FDI流出
[期刊] 经济管理
[作者]
陈长石 刘晨晖
本文借鉴中心—外围模型的研究思想,采用加权变异系数法测算了地区发展不平衡并进行了空间分解,以确定中国地区发展不平衡的来源,而后采用差分GMM对其收敛性进行了实证分析。研究结果显示,导致地区发展不平衡的主要原因并非是中心城市与外围城市之间而是中心城市与外围城市内部的发展差异;地区发展不平衡变量与经济增长之间呈现U型关系,说明在样本考察期内的中国地区发展不平衡水平是趋于发散的。据此,本文提出解决中国地区发展不平衡问题必须着眼于消除外围中小城市之间发展不平衡的观点与政策主张。
[期刊] 林业科学
[作者]
童春发 杨立伟 蒋安纳 施季森
虽然巢式试验设计在动植物育种中得到广泛应用,但是在不平衡数据条件下有关遗传参数估计和假设检验统计量的计算还存在着很多问题。文中针对不平衡数据条件下的巢式试验设计,使用固定效应模型和随机效应模型估计相关的遗传参数并进行相应的统计假设检验。对于固定效应模型,使用约束线性模型方法推导出亲本配合力估计及亲本间配合力假设检验统计量的计算公式。对于随机效应模型,采用混合线性模型中的方差分析法,推导出方差分量估计的计算公式,并给出方差分量估计标准误以及方差分量假设检验统计量的计算方法,进而给出遗传力计算公式及其标准误的近似计算方法。最后,用VC++编写多种形式巢式设计遗传模型的各种遗传参数估计和假设检验统计...
关键词:
巢式设计 一般配合力 方差分量 遗传力
[期刊] 技术经济与管理研究
[作者]
白明 刘志伟
以利润现值最大化为目标函数的数学模型,考虑了施工中工程量变化和施工顺序对承包商未来利润影响。模型简单实用,对投标者参与工程竞标,增加盈利具有一定的指导意义。
关键词:
投标 不平衡报价 利润 现值
[期刊] 统计与决策
[作者]
刘洋
在应用机器学习构建数据模型的过程中,经常会面临类不平衡性的问题,在许多研究中,降低数据集的不平衡性多采用欠抽样法来进行处理,再应用C4.5、NB、LR、RF、KNN等机器学习算法进行数据建模。实验结果往往表明,欠抽样法得到的模型准确度并不尽如人意,原因是这种方法是在牺牲负样本的预测精度前提下来提高整体精度的,因此,文章试图在尽量不减少原数据集中有用信息丢失的前提下采用重复抽样法进行数据处理可以有效弥补欠抽样法所带来的信息损失,进而提高模型精度。
关键词:
不平衡数据集 机器学习 欠抽样 重复抽样
[期刊] 统计与决策
[作者]
陈钟毓 尹居良
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除