- 年份
- 2024(5992)
- 2023(8712)
- 2022(7468)
- 2021(6996)
- 2020(6050)
- 2019(14044)
- 2018(13602)
- 2017(26362)
- 2016(13908)
- 2015(15707)
- 2014(15243)
- 2013(14810)
- 2012(13428)
- 2011(11858)
- 2010(11352)
- 2009(10142)
- 2008(9457)
- 2007(7868)
- 2006(6526)
- 2005(5577)
- 学科
- 济(54569)
- 经济(54474)
- 管理(40740)
- 业(37621)
- 企(31690)
- 企业(31690)
- 方法(29143)
- 数学(26373)
- 数学方法(25981)
- 财(15771)
- 农(13608)
- 中国(13233)
- 学(11120)
- 制(10977)
- 业经(10947)
- 务(9662)
- 财务(9626)
- 财务管理(9601)
- 贸(9438)
- 贸易(9435)
- 易(9221)
- 企业财务(9165)
- 农业(8857)
- 地方(8753)
- 技术(8343)
- 理论(7950)
- 环境(7910)
- 和(7851)
- 体(7776)
- 融(7724)
- 机构
- 大学(190283)
- 学院(187719)
- 济(77920)
- 经济(76557)
- 管理(75341)
- 理学(66341)
- 理学院(65668)
- 管理学(64400)
- 管理学院(64053)
- 研究(60906)
- 中国(45282)
- 京(38655)
- 科学(37665)
- 财(36010)
- 农(32183)
- 业大(30024)
- 所(29276)
- 财经(29152)
- 中心(29044)
- 研究所(26914)
- 经(26777)
- 江(26317)
- 农业(25580)
- 经济学(24803)
- 北京(23300)
- 院(22940)
- 范(22651)
- 经济学院(22471)
- 师范(22302)
- 财经大学(22110)
- 基金
- 项目(138354)
- 科学(110057)
- 基金(103625)
- 研究(97525)
- 家(91850)
- 国家(91152)
- 科学基金(78783)
- 社会(63426)
- 社会科(60144)
- 社会科学(60129)
- 基金项目(54837)
- 自然(52829)
- 省(52815)
- 自然科(51651)
- 自然科学(51632)
- 自然科学基金(50719)
- 划(45586)
- 教育(45440)
- 资助(42264)
- 编号(37424)
- 重点(31603)
- 部(31456)
- 创(29440)
- 发(29022)
- 成果(28871)
- 科研(27648)
- 创新(27627)
- 教育部(27192)
- 国家社会(27081)
- 制(26209)
共检索到261028条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
吴强
实例约简的目的是移除训练集中的冗余样本。大多数实例约简算法保留了许多内部样本,且难以处理非球形的数据。为此,文章提出了一种基于局部均值k近邻和密度峰值聚类的实例约简算法(IRLMDP)。首先,设计了一种基于局部均值k近邻的裁剪方法LMEM来移除噪声;其次,设计了一种基于局部均值k近邻和密度峰值聚类的压缩方法CMLMDP来保留代表性的边界样本;最后,实验证明,就KNN分类器而言,IRLMDP在分类正确率和样本压缩率上优于6个流行的实例约简算法。
[期刊] 统计与决策
[作者]
杜洪波 白阿珍 朱立军
针对传统K-means算法存在的随机选取初始聚类中心和类簇数目需要人为选定,从而导致聚类结果不稳定,容易陷入局部最优解的问题,文章提出了一种基于改进的密度峰值算法(DPC)的K-means算法,该算法首先采用改进的DPC算法来选取初始聚类中心,弥补了K-means算法初始聚类中心随机选取导致易陷入局部最优解的缺陷;其次运用K-means算法进行迭代,并且引入熵值法计算距离优化聚类。在UCI数据集上的实验表明,该算法得到较好的初始聚类中心和较稳定的聚类结果,并且收敛速度也较快,证明了该算法的可行性。
[期刊] 科技管理研究
[作者]
黄柏如 周志平 王利 赵卫东
目前国内对于专利地图的研究大部分仍停留在应用阶段,对其制作的基础理论研究较少。概述目前专利地图类别,分析现有专利地图制作方法的缺陷,从增强专利文献信息可信度和价值的角度,运用TF-IDF(term frequency-inverse document frequency)统计特征将非结构化的专利文献信息映射到低维空间中,采用密度峰值快速搜索聚类(clustering by fast search and find of density peaks,CFSFDP)算法进行聚类,对同一聚类中的专利文献特征进行分析,得到不同专利文献间的发展关系并映射为图表示,从而构建以有向图表示的专利地图。改进提出的这种专利地图制作方法,同时利用了结构化信息与非结构化信息,以使专利地图更为真实准确地反映目标技术领域的技术发展过程。
[期刊] 统计与决策
[作者]
孙洁 景志敏 周欢
半监督自训练方法属于半监督自标记方法的一种,它能同时利用有标记样本和无标记样本来训练分类器。然而,对半监督自训练方法而言,误标记是一个不容忽视的问题。为此,文章提出了一种基于密度峰值聚类和相对距离的半监督自训练方法(STDPRD)。在迭代的自训练过程中,STDPRD首先用密度峰值聚类来选取具有高置信度的无标记样本,再标记他们;其次,STDPRD用相对距离来过滤掉在迭代过程中被误标记的样本;然后,STDPRD把在迭代过程中被正确标记的样本加入有标记集中;最后,STDPRD用被扩充的有标记集来训练给定的分类器,训练完成后,输出被训练的分类器。仿真实验结果表明,在真实数据集上,STDPRD的表现优于4种流行的半监督自训练方法。
关键词:
半监督学习 半监督分类 相对距离 误标记
[期刊] 统计与决策
[作者]
张智驹
大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。
[期刊] 浙江农林大学学报
[作者]
王书涵 张晓丽 朱程浩 瞿帅
林分密度对林分生长有很重要的影响,既是生态学中重要的研究内容,也是林分因子调查的重要参数之一。采用快鸟影像的全色波段利用局部最大值滤波方法提取了研究区的林分密度。采用了皮尔森相关系数衡量了实际林分密度同树冠点数量之间的相关性,重点探讨了3×3,5×5,7×7(以像素为单位)等3种不同窗口大小及不同的归一化植被指数(I_(NDVI))阈值对提取树冠点数量的影响,选择出最佳的窗口和INDVI滤值的组合,并建立线性回归模型,将整个研究区划分成样地大小的格网,统计格网中光谱最大值点的数量并转换成林分密度栅格图层,
[期刊] 地理科学进展
[作者]
朝布嘎 包刚 元志辉 温都日娜 佟斯琴 郭恩亮 黄晓君
植被夏季生长峰值期和峰值是植被极为重要的物候和生长指标,对年生产力的大小具有决定性作用。论文利用2001—2020年MODIS EVI数据和双Logistic四参数模型,识别北半球中高纬度植被生长峰值期与EVI峰值时空变化特征及其对气候的敏感性。研究结果表明:(1)在过去20年间,植被生长峰值期主要发生在6—8月,并随着纬度的升高呈先提前后推迟趋势,但如果忽略70°N以北地区的少部分陆地,植被峰值期随着纬度升高呈提前趋势。植被EVI峰值主要介于0.2~0.6之间,整体上高纬度的值低于低纬度。(2)区域平均植被生长峰值期呈不显著提前趋势(0.12 d/a,p>0.05)。在空间上呈提前趋势(60.3%)的像元占比大于呈推迟趋势(39.7%)的占比。EVI峰值以0.01/10 a(p<0.01)的速率呈显著增加趋势。在空间上,研究区74.5%地区的植被EVI峰值呈增加趋势。(3) 2001—2020年间,春夏季气温、降水量和云覆盖对植被生长峰值期(EVI峰值)的影响最广泛,其中气温对植被生长峰值期和EVI峰值的影响最强,在高纬度地区对两者产生不对称作用,在低纬度地区气温的升高可能通过干旱等事件将降低EVI峰值。而降水量和云覆盖对峰值期和EVI峰值的影响在空间分布上相对复杂,空间异质性强。研究结果可为阐明北半球中高纬度地区植被物候和生长变化规律及其对气候变化的响应特征,以及对生态系统的影响过程和预测提供数据支撑。
[期刊] 统计与决策
[作者]
周平 马景义
时间序列聚类是数据挖掘领域的热点问题之一。结合时间序列的特点,光滑子空间K均值聚类算法在进行稀疏型聚类的同时,可以筛选出连续的时间子区间,并基于这些子区间上的观测对时间序列聚类,其复杂度主要取决于更新聚类权重的方法。然而,现有算法中聚类权重的更新是通过凸二次规划问题求解完成的,其计算复杂度较高。文章的理论推导表明,可以通过复杂度较低的严格凸二次规划问题的求解来更新聚类权重。在此基础上,给出了计算复杂度更低的路径跟随方法来更新聚类权重。数据模拟表明了基于路径跟随方法的新算法在聚类中的有效性,及其在计算速度上的优越性。
[期刊] 统计与决策
[作者]
施从美 江亚洲
文章利用K-均值聚类法对全国首批127个特色小镇多方面数据的统计分析发现,这些特色小镇可以分为产业特色类、生态建设类、资源潜力类、文化历史类以及无明显特色类小镇。数据表明不同类型特色小镇的发展与其独特的资源禀赋相关,同时也存在其他方面的短板。只有产业特色类小镇是建立在相对全面发展基础上的一种成熟形态。因此理想的特色小镇发展模式就是充分利用自身资源发展培育成一种特色产业,以产业带动其他方面发展,实现特色鲜明与综合发展并进并举。
关键词:
K-均值聚类 特色小镇 分类 评价
[期刊] 北京林业大学学报
[作者]
丁相元 陈尔学 赵磊 刘清旺 范亚雄 赵俊鹏 徐昆鹏
【目的】以林场或县森林资源总体为调查对象,及时、准确地调查监测总体平均每公顷蓄积量,对上级(如市、省)部门开展森林资源宏观管理、生态保护价值评价、森林碳储量计量、领导干部任期绩效考核等工作都有重要支撑作用。将卫星、无人机等多源遥感数据作为辅助数据,采用较少抽样调查样地数据,实现总体参数有效估测的新方法,已成为国内外重要的研究方向,但目前,国内尚无多种现有估计方法的比较评价研究。为了促进新一代遥感技术在森林资源调查业务中的应用,提高我国森林资源天空地一体化调查监测技术水平,亟需对现有林场或县总体参数估测方法进行比较评价研究。【方法】以内蒙古旺业甸实验林场主要人工林树种为总体,基于2019年在林场获取的无人机激光雷达(LiDAR)抽样数据、Sentinel-2A多光谱数据(全覆盖)和少量样地数据,针对样地(p)、样地-卫星(ps)、样地-抽样无人机LiDAR(pl)以及样地-抽样无人机LiDAR-卫星(pls)4种模式,利用适合这4种模式的概率抽样法(DB)、模型辅助法(MA)、模型法(MD)和混合法(HY)4类共5种估测方法(DB_p、MD_(ps)、MA_(ps)、HY_(pl)以及MD_(pls))对总体森林蓄积量密度均值(MSVD)进行估计与对比分析。【结果】(1)DB_p、MD_(ps)、MA_(ps)、HY_(pl)、MD_(pls) 5种方法估测的MSVD分别为212.54、202.09、202.38、210.07以及208.96 m~3/hm~2,精度分别为90.44%、91.54%、91.69%、96.35%和96.45%,方差依次减小。(2)其他4种方法相对于MD_(pls)方法的估计效率(RE)均大于1 (RE_(DBp,MDpls)=5.39,RE_(MDps,MDpls)=3.82,RE_(MAps,MDpls)=3.69,RE_(HYpl,MDpls)=1.07);HY_(pl)相对于MD_(pls)的RE略大于1,但几倍于其他3种方法(RE_(DBp,HYpl)=5.02,RE_(MAps,HYpl)=3.43,RE_(MDps,HYpl)=3.56)。(3)包含LiDAR数据的HY_(pl)与MD_(pls)方法相对于包含Sentinel-2A数据的MD_(ps)与MA_(ps)方法均为正效率(RE_(MAps,HYpl)=3.43,RE_(MDps,HYpl)=3.56,RE_(MDps,MDpls)=3.82,RE_(MAps,MDpls)=3.69);MD_(ps)与MA_(ps)方法之间的RE接近1,但MA_(ps)的效率微高于MD_(ps)(RE_(MDps,MAps)=1.04)。【结论】和只利用样地数据的估计方法相比,将遥感数据作为辅助变量建立估测模型,无论是采用对蓄积量不够敏感的林场全覆盖Sentinel-2A多光谱遥感数据,还是采用对蓄积量很敏感的抽样式获取的LiDAR数据,都可有效提高林场总体MSVD的估测精度。涉及遥感数据应用的4种方法,估计精度最高的为MD_(pls),其次为HY_(pl),这2种方法都包含了LiDAR遥感抽样观测数据的应用,都是适应于林场总体MSVD估计的年度监测方法。可实现天空地3种观测数据协同应用的MD_(pls)估测精度和相对效率最高,可作为林场森林蓄积量年度监测的首选方法。
[期刊] 清华大学学报(自然科学版)
[作者]
肖熙 周路
语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错
[期刊] 中央财经大学学报
[作者]
李梦雨
本文首先通过研究我国1994—2011年的经济数据,对关系到金融系统稳定的16项经济变量进行主成分分析,进而将所选变量归结为宏观经济、金融体系、对外经贸三个方面。在此基础上运用K—均值聚类算法,把金融系统风险状态分为四类。继而借助BP神经网络建立了我国金融系统风险的预警模型,并通过2011年的数据对我国2012年金融系统运行状况进行了预测。预测结果表明我国2012年处于轻度风险状态,总需求的回落和资产泡沫的收缩将是影响我国金融系统稳定运行的主要问题。最后对我国如何预测并防范金融风险给出了政策建议。
[期刊] 南京农业大学学报
[作者]
张小虎 陈佳悦 黄芬 高翔 刘铭 姚霞 朱艳
[目的]为克服光照不均引起的低对比度、反光、阴影、光斑及遮挡等对大田复杂背景下小麦冠层图像分割的干扰。[方法]本文设计了一种结合脉冲耦合神经网络(Pulse Coupled Neural network,PCNN)与同态滤波的自适应图像增强和基于L*a*b*颜色空间α角度模型的K均值聚类分割算法。首先,将小麦冠层图像转换到HSI颜色空间,采用自适应算法对HSI空间的I分量进行增强处理,适当调节饱和度S分量,补偿光照强度分布不均,去除阴影及拉大对比度;其次,将增强处理后的图像映射到L*a*b*颜色空间,提取
[期刊] 数字图书馆论坛
[作者]
郑德俊 朱婷婷 沈军威
对移动图书馆用户评论的自动聚类研究有助于更准确高效地获取用户需求。本文结合移动图书馆评论特征,在传统K均值算法的基础上,使用HT-LaD算法对初始聚类中心进行算法改进,并使用移动图书馆的用户评论数据进行实证。结果表明,利用改进后K均值算法完成移动图书馆用户评论文本的需求聚类是可行的,且聚类精度和稳定性得到提高。
[期刊] 统计与决策
[作者]
吴自强
文章构造了第三方物流供应商选择评价指标体系,针对第三方物流供应商现状,采用K-均值聚簇法先对物流供应商进行分类,在最优类中选择最优的供应商作为合作伙伴,使得对第三方物流供应商选择更为科学、合理。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除