标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(6163)
2023(8827)
2022(7589)
2021(7070)
2020(6114)
2019(14086)
2018(13701)
2017(26561)
2016(13923)
2015(15556)
2014(15154)
2013(14483)
2012(12911)
2011(11306)
2010(10802)
2009(9603)
2008(8965)
2007(7421)
2006(6052)
2005(5043)
作者
(35927)
(30359)
(29969)
(28661)
(19095)
(14302)
(13690)
(11901)
(11574)
(10438)
(10245)
(10187)
(9372)
(9304)
(9182)
(9026)
(9021)
(8933)
(8734)
(8674)
(7183)
(7136)
(7086)
(7002)
(6875)
(6752)
(6446)
(6326)
(5983)
(5897)
学科
(55330)
经济(55241)
管理(41038)
(37780)
(31961)
企业(31961)
方法(30889)
数学(27774)
数学方法(27289)
(15849)
中国(12922)
(12800)
业经(11315)
(10338)
(10079)
(10068)
财务(10026)
财务管理(10004)
企业财务(9531)
(9080)
贸易(9076)
(8858)
技术(8532)
地方(8490)
农业(8323)
理论(8195)
(8056)
环境(7774)
(7671)
金融(7670)
机构
大学(186706)
学院(184693)
管理(77375)
(77131)
经济(75768)
理学(68347)
理学院(67692)
管理学(66323)
管理学院(65962)
研究(55127)
中国(42151)
(37341)
(35941)
科学(33031)
财经(29559)
中心(27646)
(27117)
业大(27063)
(25873)
(25001)
(24939)
经济学(24842)
研究所(22918)
经济学院(22632)
财经大学(22357)
北京(22348)
(22210)
师范(21976)
(20839)
农业(20376)
基金
项目(136797)
科学(109823)
基金(103071)
研究(98934)
(89656)
国家(88984)
科学基金(78418)
社会(65117)
社会科(61951)
社会科学(61938)
基金项目(54497)
(51560)
自然(51228)
自然科(50146)
自然科学(50135)
自然科学基金(49199)
教育(45729)
(44092)
资助(41922)
编号(39128)
(31000)
重点(30558)
成果(30154)
(29002)
国家社会(28257)
(27994)
教育部(27265)
创新(27185)
科研(27007)
人文(26668)
期刊
(72385)
经济(72385)
研究(48495)
中国(29929)
(28859)
管理(27353)
学报(27057)
科学(25301)
大学(21675)
(21538)
学学(20562)
技术(17363)
教育(14942)
农业(14767)
财经(14353)
(13695)
金融(13695)
(12300)
经济研究(11959)
业经(11548)
统计(11278)
(9855)
问题(9791)
技术经济(9180)
理论(9119)
决策(8923)
财会(8776)
图书(8771)
(8430)
实践(8340)
共检索到250752条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 统计与决策  [作者] 张智驹  
大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。
[期刊] 科技管理研究  [作者] 黄柏如  周志平  王利  赵卫东  
目前国内对于专利地图的研究大部分仍停留在应用阶段,对其制作的基础理论研究较少。概述目前专利地图类别,分析现有专利地图制作方法的缺陷,从增强专利文献信息可信度和价值的角度,运用TF-IDF(term frequency-inverse document frequency)统计特征将非结构化的专利文献信息映射到低维空间中,采用密度峰值快速搜索聚类(clustering by fast search and find of density peaks,CFSFDP)算法进行聚类,对同一聚类中的专利文献特征进行分析,得到不同专利文献间的发展关系并映射为图表示,从而构建以有向图表示的专利地图。改进提出的这种专利地图制作方法,同时利用了结构化信息与非结构化信息,以使专利地图更为真实准确地反映目标技术领域的技术发展过程。
[期刊] 统计与决策  [作者] 孙洁   景志敏   周欢  
半监督自训练方法属于半监督自标记方法的一种,它能同时利用有标记样本和无标记样本来训练分类器。然而,对半监督自训练方法而言,误标记是一个不容忽视的问题。为此,文章提出了一种基于密度峰值聚类和相对距离的半监督自训练方法(STDPRD)。在迭代的自训练过程中,STDPRD首先用密度峰值聚类来选取具有高置信度的无标记样本,再标记他们;其次,STDPRD用相对距离来过滤掉在迭代过程中被误标记的样本;然后,STDPRD把在迭代过程中被正确标记的样本加入有标记集中;最后,STDPRD用被扩充的有标记集来训练给定的分类器,训练完成后,输出被训练的分类器。仿真实验结果表明,在真实数据集上,STDPRD的表现优于4种流行的半监督自训练方法。
[期刊] 管理评论  [作者] 夏利宇  何晓群  
由于履约客户的数量远远大于违约客户,征信数据具备严重的不平衡特征,常用的处理方法较少同时考虑金融机构所关注的违约损失和市场份额因素。本文基于违约损失因素提出迭代重抽样集成模型(IRIM),利用迭代欠抽样方法提升模型对"坏"客户的关注,采用集成方法将弱分类模型转变为强分类模型;基于市场份额因素改进常用的F-value指标,引入评价分类效果的RS指标。在6类不平衡关系下进行模拟研究,并对SSBF数据和中国某银行征信数据进行实证研究。结果表明,与常用的方法和指标相比,迭代重抽样集成模型能够在确保市场份额不过度减少的情况下降低金融机构的违约风险,RS指标能够恰当地权衡市场份额和违约风险的关系。
[期刊] 统计与决策  [作者] 杜洪波  白阿珍  朱立军  
针对传统K-means算法存在的随机选取初始聚类中心和类簇数目需要人为选定,从而导致聚类结果不稳定,容易陷入局部最优解的问题,文章提出了一种基于改进的密度峰值算法(DPC)的K-means算法,该算法首先采用改进的DPC算法来选取初始聚类中心,弥补了K-means算法初始聚类中心随机选取导致易陷入局部最优解的缺陷;其次运用K-means算法进行迭代,并且引入熵值法计算距离优化聚类。在UCI数据集上的实验表明,该算法得到较好的初始聚类中心和较稳定的聚类结果,并且收敛速度也较快,证明了该算法的可行性。
[期刊] 中国注册会计师  [作者] 程平  陈珊  
高度信息化的大数据时代,导致企业的生产经营产生大量、分散、复杂的会计数据,在审计全覆盖无法实现的情况下,审计抽样的质量至关重要。针对现有审计抽样问题,本文提出了在已有的审计领域知识库的基础上,建立审计样本与审计目标的关联规则,并利用DBSCAN聚类算法对审计抽样关联规则进行聚类,接着对聚类结果进行新颖度评价,筛选出高价值聚类结果存入审计领域知识库,实现审计领域知识的积累和再利用。最后,运用审计实例对实验进行分析。
[期刊] 统计与决策  [作者] 王泳欣  张大斌  车大庆  吕建秋  
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。
[期刊] 统计与决策  [作者] 吴强  
实例约简的目的是移除训练集中的冗余样本。大多数实例约简算法保留了许多内部样本,且难以处理非球形的数据。为此,文章提出了一种基于局部均值k近邻和密度峰值聚类的实例约简算法(IRLMDP)。首先,设计了一种基于局部均值k近邻的裁剪方法LMEM来移除噪声;其次,设计了一种基于局部均值k近邻和密度峰值聚类的压缩方法CMLMDP来保留代表性的边界样本;最后,实验证明,就KNN分类器而言,IRLMDP在分类正确率和样本压缩率上优于6个流行的实例约简算法。
[期刊] 亚太经济  [作者] 刘钻石  张娟  
本文把635个贸易行业SITC 4位分类数据转换成27个工业行业ISIC 3位分类数据,利用工业品外部金融依赖度、实物资本密度、人力资本密度和自然资源密度4个行业特征指标对中国进出口贸易结构和贸易不平衡进行了量化分析。研究结果表明近年来中国在这27个行业中大部分是贸易顺差,这种顺差的变化趋势是向外部金融依赖度高的行业、实物资本密度低的行业、自然资源密度低的行业转移。根据贸易整体要素密度指数可以看出,中国四个维度表示的贸易结构中,多年来都是进口要素密度指数高于出口要素密度指数,进出口贸易结构不断升级,出口贸易结构升级更为显著。本文还分析了中国与9个主要贸易伙伴国之间双边贸易的净要素密度指数。
[期刊] 统计与决策  [作者] 孟东霞  李玉鑑  
针对实际应用中不平衡数据集分类效果较差的问题,文章提出一种基于特征边界信息进行欠采样的数据处理方法。所提方法根据特征边界点的定义获得多数类样本中可构造特征边界的数据点,其分布在最优非线性分类决策面附近,通常包含重要的分类信息,在欠采样时应进行保留,其他多数类样本远离分类决策面,在分类中易于识别,可在聚类后选取部分样本和少数类样本构成平衡数据集。该方法保留了多数类样本的几何分布特征,降低了样本的信息流失率。对比实验利用支持向量机进行分类,实验结果表明该方法有利于提高不平衡数据中少数类的分类精度,验证了算法的有效性。
[期刊] 统计与决策  [作者] 孟东霞  魏晓光  柳凌燕  
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。
[期刊] 统计研究  [作者] 陈光慧  刘建平  
针对现存的各种单水平轮换模式和估计方法,本文提出一套统一的平衡单水平轮换模式。在此轮换模式下,引入两类相关关系,运用线性无偏估计方法,并通过使不同类型估计量方差的加权总和最小的方法确定最优系数,从而得到最优线性无偏估计量,不仅能够减少甚至消除估计量偏差的影响,还能使得连续性调查的整体抽样误差最小,适合估计各种类型的估计量。
[期刊] 统计与决策  [作者] 罗少甫  
基于噪声过滤的过抽样方法能克服噪声生成,但是他们的噪声侦察技术和合成样本的过程依赖于参数,同时,他们也会过滤掉大量的少数类样本。为了解决该问题,文章提出了一种基于局部集合和差分进化的过抽样方法(OMLSDE)。首先,用该方法计算每个样本的局部集合;其次,用局部集合和不平衡比去发现可疑的噪声;然后,用差分进化去优化可疑的噪声;最后,用局部集合内的随机样本去生成少数类的合成样本。实验证明,OMLSDE优于6个流行的过抽样方法。
[期刊] 西南农业学报  [作者] 何建文  韩世玉  
关键词:
[期刊] 统计研究  [作者] 谢佳斌  金勇进  谢邦昌  
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除