- 年份
- 2024(1649)
- 2023(2604)
- 2022(2293)
- 2021(1983)
- 2020(1876)
- 2019(4468)
- 2018(4263)
- 2017(7965)
- 2016(4039)
- 2015(4404)
- 2014(4172)
- 2013(4175)
- 2012(3868)
- 2011(3469)
- 2010(3645)
- 2009(3332)
- 2008(3332)
- 2007(2940)
- 2006(2647)
- 2005(2528)
- 学科
- 济(16620)
- 经济(16607)
- 管理(9099)
- 业(8065)
- 企(6703)
- 企业(6703)
- 方法(6403)
- 数学(5568)
- 数学方法(5353)
- 中国(4769)
- 学(4538)
- 财(4064)
- 地方(4052)
- 关系(3203)
- 农(3107)
- 理论(2999)
- 税(2891)
- 税收(2717)
- 收(2705)
- 融(2699)
- 金融(2698)
- 业经(2657)
- 制(2650)
- 贸(2640)
- 贸易(2635)
- 经济关系(2529)
- 易(2497)
- 对外(2479)
- 外经(2295)
- 对外经济(2281)
- 机构
- 大学(55627)
- 学院(53647)
- 研究(21615)
- 济(20753)
- 经济(20274)
- 管理(18418)
- 中国(15722)
- 理学(15656)
- 理学院(15429)
- 管理学(14868)
- 管理学院(14742)
- 科学(14125)
- 京(12517)
- 所(11612)
- 农(10624)
- 财(10562)
- 研究所(10530)
- 中心(9260)
- 业大(8978)
- 江(8826)
- 院(8425)
- 农业(8298)
- 北京(8151)
- 财经(7868)
- 范(7511)
- 师范(7415)
- 省(7248)
- 经(7088)
- 研究院(6854)
- 州(6829)
共检索到88612条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
孟子健 马江洪
传统的k均值算法对初始聚类中心具有一定的敏感性,聚类结果会随着不同的初始聚类中心波动。针对这一缺点,文章提出一种选择初始聚类中心的算法,该算法首先计算数据对象两两之间的相异度函数,构造一种新的相异度矩阵,然后选取k个与其他数据对象相异度较低且个数最多的数据对象作为初始聚类中心。实验表明,在给定聚类个数k的情况下,这样改进后的k均值算法比随机选取初始聚类中心的传统k均值算法以及已经提出的其中一种改进的k均值算法有更高的准确率,且可消除对初始聚类中心的敏感性。
关键词:
k均值算法 初始聚类中心 相异度矩阵
[期刊] 运筹与管理
[作者]
施振佺 陈世平
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。
[期刊] 统计与决策
[作者]
吴孟书 吴喜之
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。
[期刊] 数字图书馆论坛
[作者]
郑德俊 朱婷婷 沈军威
对移动图书馆用户评论的自动聚类研究有助于更准确高效地获取用户需求。本文结合移动图书馆评论特征,在传统K均值算法的基础上,使用HT-LaD算法对初始聚类中心进行算法改进,并使用移动图书馆的用户评论数据进行实证。结果表明,利用改进后K均值算法完成移动图书馆用户评论文本的需求聚类是可行的,且聚类精度和稳定性得到提高。
[期刊] 统计与决策
[作者]
周平 马景义
时间序列聚类是数据挖掘领域的热点问题之一。结合时间序列的特点,光滑子空间K均值聚类算法在进行稀疏型聚类的同时,可以筛选出连续的时间子区间,并基于这些子区间上的观测对时间序列聚类,其复杂度主要取决于更新聚类权重的方法。然而,现有算法中聚类权重的更新是通过凸二次规划问题求解完成的,其计算复杂度较高。文章的理论推导表明,可以通过复杂度较低的严格凸二次规划问题的求解来更新聚类权重。在此基础上,给出了计算复杂度更低的路径跟随方法来更新聚类权重。数据模拟表明了基于路径跟随方法的新算法在聚类中的有效性,及其在计算速度上的优越性。
[期刊] 清华大学学报(自然科学版)
[作者]
肖熙 周路
语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错
[期刊] 中央财经大学学报
[作者]
李梦雨
本文首先通过研究我国1994—2011年的经济数据,对关系到金融系统稳定的16项经济变量进行主成分分析,进而将所选变量归结为宏观经济、金融体系、对外经贸三个方面。在此基础上运用K—均值聚类算法,把金融系统风险状态分为四类。继而借助BP神经网络建立了我国金融系统风险的预警模型,并通过2011年的数据对我国2012年金融系统运行状况进行了预测。预测结果表明我国2012年处于轻度风险状态,总需求的回落和资产泡沫的收缩将是影响我国金融系统稳定运行的主要问题。最后对我国如何预测并防范金融风险给出了政策建议。
[期刊] 统计与决策
[作者]
施从美 江亚洲
文章利用K-均值聚类法对全国首批127个特色小镇多方面数据的统计分析发现,这些特色小镇可以分为产业特色类、生态建设类、资源潜力类、文化历史类以及无明显特色类小镇。数据表明不同类型特色小镇的发展与其独特的资源禀赋相关,同时也存在其他方面的短板。只有产业特色类小镇是建立在相对全面发展基础上的一种成熟形态。因此理想的特色小镇发展模式就是充分利用自身资源发展培育成一种特色产业,以产业带动其他方面发展,实现特色鲜明与综合发展并进并举。
关键词:
K-均值聚类 特色小镇 分类 评价
[期刊] 图书情报工作
[作者]
边鹏 赵妍 苏玉召
从嵌入式NSTL文本推荐系统的检索词推荐需求入手,分析原有方法的不足,引入共词分析方法和分化理论,提出一种新的最佳聚类数确定方法,改进最小类间距离和平均类内距离的计算方法,强化聚类结果的推荐效果,同时使推荐效果可以随着样本数据的变化而动态调整。最后,运用实验验证该方法的有效性。
[期刊] 图书情报工作
[作者]
高劲松 张俊丽
利用模糊C均值算法解决文本聚类问题时,随机选取的初始聚类中心和聚类数会导致不同的聚类结果,且容易陷入局部最优。提出利用粒子群优化算法确定模糊C均值的初始聚类中心,并通过向量空间模型和特征提取,再利用模糊C均值进行文档聚类。实验表明,这种基于粒子群的模糊C均值聚类算法迭代次数少,能解决经典模糊C均值算法对初始值敏感和易陷入局部极小的缺点,且聚类速度和效果得到明显提高。
关键词:
模糊C均值 粒子群 文本聚类
[期刊] 统计与决策
[作者]
周丽华 黄成泉 王林
针对经典模糊C均值(Fuzzy C-Means,FCM)聚类算法聚类数需预先指定的缺点,提出了一种能自动确定聚类数的自动模糊C均值(Automatic FCM,AFCM)聚类算法。通过引入聚类模糊隶属度基数到FCM聚类算法,实现了FCM聚类算法聚类数的自动获取。在随机生成的人工模拟数据数据集以及UCI机器学习数据集上的实验结果表明,AFCM算法能自动实现聚类数的确定。
关键词:
模糊聚类 模糊隶属度基数 聚类数
[期刊] 统计与决策
[作者]
赖芨宇 陈克明
文章基于类别数据集合引入质量和特征向量的概念;确定了计算类别型数据的相似度;给出聚类结果清晰度及其变化率的定义;提出一种对质量和特征向量有效聚类类别型数据的算法。
关键词:
类别型数据 聚类 质量 特征向量 清晰度
[期刊] 林业科学
[作者]
张峰 张晓东 朱德海 刘峻明
从计算机程序设计的角度出发,针对影响系统聚类算法执行效率的几个主要因素,分别提出较合理的数据结构来优化系统聚类的算法实现,降低算法的时间和空间的复杂度,增强系统聚类对大数据量的空间数据处理能力,并通过实际例子证明该优化算法的可行性。
关键词:
系统聚类 算法优化 数据结构
[期刊] 科技进步与对策
[作者]
高山行 王慧 杨张博
生成式人工智能(AIGC)技术对经济社会发展带来巨大挑战,现有研究多从技术规制、发展历程等方面展开,较少对AIGC领先企业专利布局进行深入分析。选取美国AIGC领域领先的14家初创公司和4家科技巨头,基于复杂网络分析方法和机器学习的K均值聚类算法,利用专利IPC信息构建专利知识网络。研究发现,美国AIGC领先企业的专利布局聚焦于电数字数据处理、图形数据读取及呈现等技术领域;从专利布局知识宽度、知识深度、知识紧密程度、知识分离程度和知识一致性程度进行聚类,企业可分为三类,即专业玩家、大厂/领先者和创新者。同时,识别不同企业的核心知识领域和桥接知识领域,最后从算法、算力和数据方面为我国发展AIGC产业提出政策建议。
[期刊] 统计与决策
[作者]
余立凡 殷瑞飞
文章借助对应分析的基本思路实现了对Q型因子分析算法上的改进,得到了一种新的能够处理海量数据的聚类方法。通过算法分析,该方法的时间复杂度为样本容量的线性阶,这充分体现了其在算法效率上的优越性。最后,将该方法应用于上市公司板块分析中,并取得了较好的效果。
关键词:
因子分析 对应分析 聚类
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除