- 年份
- 2024(2511)
- 2023(3734)
- 2022(3272)
- 2021(3009)
- 2020(2894)
- 2019(6808)
- 2018(6590)
- 2017(12624)
- 2016(6764)
- 2015(7454)
- 2014(7232)
- 2013(7111)
- 2012(6361)
- 2011(5753)
- 2010(6007)
- 2009(5617)
- 2008(5582)
- 2007(4765)
- 2006(4069)
- 2005(3750)
- 学科
- 济(31643)
- 经济(31625)
- 方法(17800)
- 管理(16966)
- 数学(16410)
- 数学方法(15969)
- 业(14808)
- 企(12873)
- 企业(12873)
- 学(7182)
- 中国(6475)
- 财(5398)
- 理论(5292)
- 地方(5130)
- 农(4996)
- 业经(4575)
- 贸(4164)
- 贸易(4158)
- 易(3997)
- 关系(3797)
- 和(3607)
- 融(3498)
- 金融(3497)
- 技术(3482)
- 环境(3440)
- 划(3428)
- 制(3423)
- 务(3298)
- 策(3298)
- 财务(3272)
- 机构
- 大学(93789)
- 学院(92058)
- 济(35206)
- 经济(34499)
- 管理(34201)
- 研究(32416)
- 理学(29885)
- 理学院(29501)
- 管理学(28346)
- 管理学院(28166)
- 中国(23727)
- 科学(22245)
- 京(20258)
- 农(17694)
- 所(17363)
- 业大(16186)
- 研究所(15946)
- 财(15546)
- 中心(14276)
- 江(14096)
- 农业(13916)
- 北京(12846)
- 财经(12382)
- 院(12259)
- 范(11686)
- 师范(11524)
- 经(11181)
- 州(10987)
- 技术(10692)
- 经济学(10690)
- 基金
- 项目(65677)
- 科学(50942)
- 基金(47825)
- 家(43384)
- 研究(43165)
- 国家(43111)
- 科学基金(36359)
- 社会(26538)
- 省(26231)
- 自然(25496)
- 社会科(25274)
- 社会科学(25266)
- 自然科(25006)
- 自然科学(25001)
- 自然科学基金(24484)
- 基金项目(24438)
- 划(22207)
- 资助(21485)
- 教育(20888)
- 编号(16070)
- 重点(15258)
- 部(13902)
- 计划(13486)
- 发(13373)
- 创(13300)
- 科研(13233)
- 成果(12936)
- 创新(12455)
- 大学(12085)
- 科技(11998)
共检索到136812条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
余立凡 殷瑞飞
文章借助对应分析的基本思路实现了对Q型因子分析算法上的改进,得到了一种新的能够处理海量数据的聚类方法。通过算法分析,该方法的时间复杂度为样本容量的线性阶,这充分体现了其在算法效率上的优越性。最后,将该方法应用于上市公司板块分析中,并取得了较好的效果。
关键词:
因子分析 对应分析 聚类
[期刊] 运筹与管理
[作者]
施振佺 陈世平
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。
[期刊] 统计与决策
[作者]
吴孟书 吴喜之
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。
[期刊] 统计与决策
[作者]
赖芨宇 陈克明
文章基于类别数据集合引入质量和特征向量的概念;确定了计算类别型数据的相似度;给出聚类结果清晰度及其变化率的定义;提出一种对质量和特征向量有效聚类类别型数据的算法。
关键词:
类别型数据 聚类 质量 特征向量 清晰度
[期刊] 统计与决策
[作者]
孟子健 马江洪
传统的k均值算法对初始聚类中心具有一定的敏感性,聚类结果会随着不同的初始聚类中心波动。针对这一缺点,文章提出一种选择初始聚类中心的算法,该算法首先计算数据对象两两之间的相异度函数,构造一种新的相异度矩阵,然后选取k个与其他数据对象相异度较低且个数最多的数据对象作为初始聚类中心。实验表明,在给定聚类个数k的情况下,这样改进后的k均值算法比随机选取初始聚类中心的传统k均值算法以及已经提出的其中一种改进的k均值算法有更高的准确率,且可消除对初始聚类中心的敏感性。
关键词:
k均值算法 初始聚类中心 相异度矩阵
[期刊] 统计研究
[作者]
吕盛鸽
统计分组的作用在于将社会经济现象总体按照统计研究的目的区分为性质不同的各个组成部分,因此,分组的结果应该使同一组内的各总体单位在分组标志上的区别不大,不同组之间有明显的差异。按数量标志进行统计分组时,有一个确定组数和组限的问题。本文根据多元统计分析中聚类及判别分
[期刊] 统计研究
[作者]
殷瑞飞 朱建平
本文基于Q型因子分析的基本思想,结合对应分析方法,建立了一种适用于大型数据库聚类的方法。该方法既解决了Q型因子分析算法效率方面的问题,也解决了传统对应分析法中缺乏客观分类标准、信息损失严重等多种缺陷,在实证分析中也取得了良好的效果。
关键词:
数据挖掘 聚类分析 对应分析 因子旋转
[期刊] 统计与决策
[作者]
朱红灿 陈星星
欧氏距离条件下的聚类分析没有考虑指标间的相关性,基于模型的聚类方法存在多重共线性影响参数稳定性等问题,针对上述问题,文章在欧式距离条件下对变量间具有相关性的数据样本进行聚类分析时,先构建变量间相关性结构的回归相关模型,再通过差分分析对变量间的多重共线进行消除,然后做聚类分析。并以1996—2011年9个省份城市教育投入情况进行聚类分析,结果表明,给出的聚类方法是有效的。
关键词:
相关性 聚类 差分分析 多重共线
[期刊] 数理统计与管理
[作者]
姚晓红 高海燕 吕家奇 黄恒君
函数型数据多以多变量的形式出现,目前的多元函数型聚类方法常以数据贴合的方式进行处理,不能充分提取各变量的共同信息及不同变量间的互补信息。为了进一步提取各变量中蕴含的聚类特征信息,本文在多视角学习框架下讨论多元函数型数据的聚类方法:构建了一个能够将多元函数型数据生成过程和各视角数据聚类特征提取统一进行的目标函数;借助非负矩阵分解的聚类特性,提出了一个基于半非负矩阵分解的多元函数型聚类模型;给出了交替迭代更新的求解算法。模拟实验结果显示,与现有的多元函数型聚类方法相比较,该聚类方法的聚类性能显著提高;以北京市空气质量监测站点应用为例,其聚类结果表明,多视角方法在聚类精度和信息提取方面具有优势。
[期刊] 统计与决策
[作者]
王志坚 王斌会
文章分析了基于假设检验的时间序列IO型异常值检测方法的不稳健性,提出了一种改进的方法,并利用R语言对异常值的个数分四种情况进行模拟研究,模拟结果表明:改进后的检测法检测能力显著提高。
关键词:
时间序列 异常值检测 IO R语言
[期刊] 统计与决策
[作者]
周丽华 黄成泉 王林
针对经典模糊C均值(Fuzzy C-Means,FCM)聚类算法聚类数需预先指定的缺点,提出了一种能自动确定聚类数的自动模糊C均值(Automatic FCM,AFCM)聚类算法。通过引入聚类模糊隶属度基数到FCM聚类算法,实现了FCM聚类算法聚类数的自动获取。在随机生成的人工模拟数据数据集以及UCI机器学习数据集上的实验结果表明,AFCM算法能自动实现聚类数的确定。
关键词:
模糊聚类 模糊隶属度基数 聚类数
[期刊] 林业科学
[作者]
张峰 张晓东 朱德海 刘峻明
从计算机程序设计的角度出发,针对影响系统聚类算法执行效率的几个主要因素,分别提出较合理的数据结构来优化系统聚类的算法实现,降低算法的时间和空间的复杂度,增强系统聚类对大数据量的空间数据处理能力,并通过实际例子证明该优化算法的可行性。
关键词:
系统聚类 算法优化 数据结构
[期刊] 实验技术与管理
[作者]
申赞伟 周军盈 张士文 殳国华 张峰
电类实验教学过程中人工评判学生所测数据工作烦琐,影响了教学质量和效率。该文提出了改进的K近邻(K-nearest neighbors,KNN)分类算法,即基于均值漂移、安全间隔和核主成分分析(KPCA)的M-KPCA-KNN(KNN based on margin and KPCA)算法,以判断学生测量数据正确与否和错误原因。首先利用KPCA对高维实验数据进行降维,然后利用均值漂移向量找到不同类别数据的最密集位置,并在不同类别数据的边界设置安全间隔,最后,将与待测样本距离最近的k个数据设置权重,计算每个类别的权重和,权重和最大的类别为待测样本的类别。与现有的KNN算法相比,M-KPCA-KNN算法不仅提高了分类正确率,而且降低了时间复杂度。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除