- 年份
- 2024(5932)
- 2023(8479)
- 2022(7240)
- 2021(6829)
- 2020(5961)
- 2019(13550)
- 2018(13109)
- 2017(25346)
- 2016(13189)
- 2015(14596)
- 2014(14092)
- 2013(13385)
- 2012(11836)
- 2011(10306)
- 2010(9704)
- 2009(8582)
- 2008(7859)
- 2007(6314)
- 2006(5021)
- 2005(4152)
- 学科
- 济(51227)
- 经济(51143)
- 管理(38955)
- 业(36001)
- 企(30274)
- 企业(30274)
- 方法(28366)
- 数学(25839)
- 数学方法(25422)
- 财(14523)
- 中国(12413)
- 农(12390)
- 业经(10906)
- 制(9687)
- 务(9393)
- 财务(9352)
- 财务管理(9331)
- 企业财务(8904)
- 贸(8591)
- 贸易(8588)
- 易(8382)
- 学(8325)
- 技术(8206)
- 地方(8084)
- 农业(8037)
- 理论(7325)
- 和(7319)
- 环境(7216)
- 融(7094)
- 金融(7093)
- 机构
- 大学(173241)
- 学院(171012)
- 管理(72768)
- 济(72047)
- 经济(70853)
- 理学(64595)
- 理学院(64010)
- 管理学(62820)
- 管理学院(62482)
- 研究(50049)
- 中国(37819)
- 京(33895)
- 财(32944)
- 科学(29278)
- 财经(27269)
- 中心(25406)
- 经(25121)
- 业大(24753)
- 农(23178)
- 经济学(23153)
- 江(22728)
- 所(21797)
- 经济学院(21104)
- 财经大学(20697)
- 范(20475)
- 师范(20253)
- 研究所(20116)
- 北京(20027)
- 商学(19328)
- 经济管理(19320)
- 基金
- 项目(129237)
- 科学(104304)
- 基金(97796)
- 研究(94204)
- 家(84846)
- 国家(84203)
- 科学基金(74546)
- 社会(62395)
- 社会科(59376)
- 社会科学(59364)
- 基金项目(52010)
- 省(48891)
- 自然(48564)
- 自然科(47542)
- 自然科学(47532)
- 自然科学基金(46644)
- 教育(43634)
- 划(41591)
- 资助(39122)
- 编号(37293)
- 部(29354)
- 重点(28842)
- 成果(28295)
- 创(27870)
- 国家社会(27089)
- 发(26554)
- 创新(26074)
- 教育部(26054)
- 制(25700)
- 人文(25532)
共检索到228277条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 清华大学学报(自然科学版)
[作者]
韩东红 宋明 张宏亮 王佳茜 王嘉兴 王国仁
不确定性的出现使传统算法无法直接用于聚类不确定数据流。该文提出一种不确定数据流环境下基于密度的聚类算法,其中提出不确定度的概念以衡量不确定数据的分布信息,并在改进面向确定数据的聚类算法DENCLUE的基础上,提出一种可处理数据不确定度的UDENCLUE算法,以降低数据的不确定性对聚类结果产生的影响;提出滑动窗口下基于密度的不确定数据流聚类算法USDENCLUE,通过聚类特征指数直方图技术实现快速剪枝,可以高效处理噪音数据、演化数据流并生成任意形状的簇;采用真实数据集及人工合成数据集对USDENCLUE与C
关键词:
不确定数据流 聚类 密度 滑动窗口
[期刊] 数据分析与知识发现
[作者]
罗彦福 钱晓东
【目的】为解决由经典聚类算法改进而来的不确定数据聚类算法往往存在原有算法本身的缺点问题,提出一种新的不确定数据聚类方法。【方法】改进不确定距离的度量方法,确保两个不确定对象在以一定概率存在的前提下,再进行二者概率差异的比较;确定聚类中心后,依据局部密度定义最大支持点、密度链域等概念,据此提出一种将数据对象归入相应聚类中心所在簇的新算法。【结果】利用UCI机器学习库中的数据集验证本文聚类算法,实验结果表明,F值较传统不确定数据聚类算法(UK-Means和FDBSCAN)在两组数据集上分别最高提升13.23%
关键词:
不确定数据 截止距离 局部密度 密度链域
[期刊] 统计与决策
[作者]
王劲波,翁伟,许华荣
聚类在数据挖掘、模式识别等许多领域有着重要的应用。本文介绍了聚类算法的几种分类,并例举了几种基于密度的聚类算法。最后以一种新颖的基于最大不相含核心点集的聚类算法LSNCCP为例,详细介绍整个聚类算法的工作过程。
[期刊] 清华大学学报(自然科学版)
[作者]
索明亮 周鼎 安若铭 李顺利
聚类作为数据分析的工具之一,已在模式识别、文献计量及故障诊断等领域中发挥了重要作用.该文基于邻域关系、局部密度和空间网格划分提出了一种聚类方法.该方法主要利用空间网格降低计算复杂度,利用邻域关系在网格空间中以密度为依据搜索聚类元素,并根据最大相对距离和最大相对密度原则自动寻找聚类中心.基于人工数据的实验结果表明,所提邻域密度网格聚类方法可有效处理任意形状数据并自主完成聚类.基于区域识别的对比实验表明,所提方法更适用于处理奇异形状且分布复杂的数据.
[期刊] 统计与决策
[作者]
张智驹
大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。
[期刊] 统计与决策
[作者]
王丙参 魏艳华 张贝贝
文章基于谱聚类算法,首先利用拉普拉斯矩阵的特征值构造聚类个数变点图,给出了确定聚类个数的直观方法,然后对优化目标引入聚类个数惩罚项,定量探讨聚类个数的选择,最后针对多元数据,通过修订距离矩阵处理成对约束信息,并基于距离矩阵构造了三种自适应相似度矩阵,再进行谱聚类。数值模拟结果显示:对于确定聚类个数,聚类个数变点图直观、有效,而惩罚法依赖惩罚项的权重参数,具有一定主观性;三种自适应谱聚类算法均有效,对成对约束信息处理方便、适应面广,稳定自适应谱聚类对近邻个数的选取更稳健。
关键词:
谱聚类 聚类个数 成对约束 自适应
[期刊] 科技管理研究
[作者]
黄柏如 周志平 王利 赵卫东
目前国内对于专利地图的研究大部分仍停留在应用阶段,对其制作的基础理论研究较少。概述目前专利地图类别,分析现有专利地图制作方法的缺陷,从增强专利文献信息可信度和价值的角度,运用TF-IDF(term frequency-inverse document frequency)统计特征将非结构化的专利文献信息映射到低维空间中,采用密度峰值快速搜索聚类(clustering by fast search and find of density peaks,CFSFDP)算法进行聚类,对同一聚类中的专利文献特征进行分析,得到不同专利文献间的发展关系并映射为图表示,从而构建以有向图表示的专利地图。改进提出的这种专利地图制作方法,同时利用了结构化信息与非结构化信息,以使专利地图更为真实准确地反映目标技术领域的技术发展过程。
[期刊] 统计与决策
[作者]
姜爱克 赵峰 张杰
数据流具有连续、实时、有序及无限等特点,使用传统的数据挖掘技术来处理数据流的分类面临着严重的挑战,很难处理数据流中的概念漂移问题。文章结合现有的决策树分类挖掘算法,提出了自适应集成分类器方法,构建了数据流概念漂移的自适应集成分类模型,通过不断更新训练样例的权重与属性类别,将训练样例从现有的数据集中分离出来,并被确定为新类别属性的训练样例,以达到对数据流中概念漂移现象的有效检测,仿真结果也证明该方法的适应性和可靠性。
关键词:
数据流 概念漂移 决策树 集成分类器
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱付保 白庆春 汤萌萌 朱颢东
针对传统数据流频繁项集计算中效率低、内存消耗大等问题,本文采用并行计算的思想设计了一种基于MapReduce的数据流频繁项集挖掘算法,首先,对进行数据分块压缩和传输,其次,将数据频繁项的计算分布在负载均衡的数据节点,可以有效保证数据的执行效率.最后通过一次调度处理合并各个节点产生的频繁项集并进行合并.理论分析和实验对比结果均表明,该算法对于并行处理数据流频繁项集的统计问题是有效可行的.
[期刊] 统计与决策
[作者]
柳炳祥 李海林
在科学技术、经济管理中经常要对一些主体对象按照某种标准进行分类,便于更好的经营管理和发展。但在实际的分类中,有些标准是不确定的、含有模糊性的中介状态,如企业的技术密度水
[期刊] 北京工商大学学报(社会科学版)
[作者]
吴玉霞
收入的不确定性是影响居民可支配收入和居民消费需求的重要变量。基于我国31个省份1985年至2010年城镇居民和农村居民人均可支配收入的面板数据,估算我国省域城镇居民和农村居民的收入不确定性指标,并采用非参数分析中密度分布函数的核估计方法,剖析了收入不确定性因素的省域分布特征及其动态变动趋势。不确定性对我国居民可支配收入的影响深度和广度正在迅速扩大,居民收入不确定性在省域之间的影响力度和差距逐步拉大。在未来经济增长过程中,应尽快完善各种经济制度改革的底层设计,以提升我国居民可支配收入,提振居民消费。
[期刊] 统计与决策
[作者]
杜洪波 白阿珍 朱立军
针对传统K-means算法存在的随机选取初始聚类中心和类簇数目需要人为选定,从而导致聚类结果不稳定,容易陷入局部最优解的问题,文章提出了一种基于改进的密度峰值算法(DPC)的K-means算法,该算法首先采用改进的DPC算法来选取初始聚类中心,弥补了K-means算法初始聚类中心随机选取导致易陷入局部最优解的缺陷;其次运用K-means算法进行迭代,并且引入熵值法计算距离优化聚类。在UCI数据集上的实验表明,该算法得到较好的初始聚类中心和较稳定的聚类结果,并且收敛速度也较快,证明了该算法的可行性。
[期刊] 清华大学学报(自然科学版)
[作者]
陈东辉 陈岭 王俊凯 吴勇 王敬昌
随着大数据时代的到来,不确定性数据上的聚合查询面临形式多样、计算复杂等挑战。该文将不确定性数据上聚合查询的结果定义为所有可能的值以及对应的概率。基于动态规划思想的求解“和”的分布(distribution sum,DSUM)精确算法,提出贪心的“和”的分布(greedy distribution sum,GDSUM)和折半合并的“和”的分布(binary merge distribution sum,BMDSUM)的近似算法,这2种算法都能应用于元组级不确定性模型和属性级不确定性模型;并通过理论分析,给出
[期刊] 林业科学
[作者]
龙时胜 曾思齐 杨盛扬
【目的】构建栎类天然林最大密度线,探究栎类天然林自稀疏规律,从理论上丰富种群生态学,为天然林林分密度管理与控制提供理论参考。【方法】以湖南省265块栎类天然林连续清查样地为研究对象,对现有林分密度指数进行改进,采用分位数回归和随机前沿分析评估Reineke林分密度指数和改进林分密度指数在构建栎类天然林最大密度线方面的适用性,并对不同林分类型栎类天然林的自稀疏特点进行分析。【结果】与Reineke林分密度模型相比,改进林分密度模型的预测误差显著降低(P<0.05),模型以林分平均胸径和优势树种平均高为基础变量,能够更好诠释林分自稀疏的内涵;随机前沿分析方法在模拟天然林最大密度线模型方面更加客观且精度较高,分位数回归方法也可提供有价值的补充;天然混交林自稀疏过程受林分平均胸径和优势树种平均高的共同影响,林分平均胸径越大,自稀疏速率越快;林分优势树种平均高越大,林分可容纳株数越多。天然林自稀疏速率在不同类型林分之间存在显著差异(P<0.05),栎类相对纯林的自稀疏速率更快、死亡率更高。【结论】构建栎类天然林最大密度线,探究其自稀疏规律,可为栎类天然林自稀疏状态的判别提供定量依据,有助于精准提升栎类天然林林分质量,更好把握天然林的自稀疏动态。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除