- 年份
- 2024(5037)
- 2023(7069)
- 2022(6049)
- 2021(5759)
- 2020(4908)
- 2019(11281)
- 2018(10999)
- 2017(21407)
- 2016(11016)
- 2015(12060)
- 2014(11492)
- 2013(10890)
- 2012(9515)
- 2011(8088)
- 2010(7454)
- 2009(6330)
- 2008(5538)
- 2007(4182)
- 2006(3034)
- 2005(2141)
- 学科
- 济(43028)
- 经济(42985)
- 管理(31904)
- 业(29968)
- 方法(25566)
- 企(25160)
- 企业(25160)
- 数学(23541)
- 数学方法(23165)
- 财(11694)
- 农(10064)
- 中国(9674)
- 业经(9122)
- 务(8159)
- 财务(8126)
- 财务管理(8109)
- 企业财务(7740)
- 贸(7366)
- 贸易(7365)
- 易(7203)
- 技术(7149)
- 农业(6802)
- 地方(6643)
- 环境(6268)
- 学(6242)
- 和(6137)
- 理论(5986)
- 制(5663)
- 产业(5521)
- 划(5509)
- 机构
- 大学(138612)
- 学院(137582)
- 管理(61278)
- 济(58404)
- 经济(57521)
- 理学(54902)
- 理学院(54448)
- 管理学(53475)
- 管理学院(53212)
- 研究(38058)
- 中国(28449)
- 京(26404)
- 财(25051)
- 科学(22327)
- 财经(21549)
- 业大(20069)
- 中心(20054)
- 经(19983)
- 经济学(18613)
- 农(17818)
- 江(17494)
- 经济学院(17087)
- 财经大学(16591)
- 经济管理(16520)
- 商学(16089)
- 范(15957)
- 商学院(15931)
- 师范(15770)
- 所(15655)
- 北京(15138)
- 基金
- 项目(108768)
- 科学(88275)
- 基金(82712)
- 研究(79185)
- 家(71549)
- 国家(71011)
- 科学基金(63575)
- 社会(52666)
- 社会科(50256)
- 社会科学(50244)
- 基金项目(44351)
- 自然(41754)
- 省(41359)
- 自然科(40898)
- 自然科学(40890)
- 自然科学基金(40129)
- 教育(36864)
- 划(34949)
- 资助(32987)
- 编号(31446)
- 部(24737)
- 重点(24041)
- 创(23706)
- 成果(23013)
- 国家社会(22972)
- 发(22491)
- 创新(22131)
- 教育部(22047)
- 科研(21800)
- 人文(21772)
共检索到174836条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱付保 白庆春 汤萌萌 朱颢东
针对传统数据流频繁项集计算中效率低、内存消耗大等问题,本文采用并行计算的思想设计了一种基于MapReduce的数据流频繁项集挖掘算法,首先,对进行数据分块压缩和传输,其次,将数据频繁项的计算分布在负载均衡的数据节点,可以有效保证数据的执行效率.最后通过一次调度处理合并各个节点产生的频繁项集并进行合并.理论分析和实验对比结果均表明,该算法对于并行处理数据流频繁项集的统计问题是有效可行的.
[期刊] 物流技术
[作者]
黄金晶 叶施仁 何福男
将MapReduce运用于关联规则挖掘算法中,提出了一种改进的频繁项集挖掘算法。该算法以并行的方式工作,并且改变了频繁项集挖掘的次序,从包含项数最多的频繁项集开始挖掘,直到得到用户希望的频繁项集终止,为用户提供了交互性,与经典的关联规则挖掘算法Apriori相比,运行效率有大幅度的提高。
[期刊] 统计与决策
[作者]
敖孟飞 石鸿雁
文章针对频繁项集挖掘中传统串行Eclat算法面对海量数据时挖掘效率不高的问题,提出一种海量数据下的并行频繁项集挖掘算法,即I-SPEclat算法。首先,对Eclat算法存在的缺陷进行改进,引入图的邻接矩阵作为数据的存储结构,避免了大量的交集运算;其次,利用先验性质对候选项集进行预剪枝和后剪枝,减少无用候选项集的数量,节约存储空间;再次,根据项集的前缀对数据进行划分,平衡每个计算节点的工作负载;最后,将改进的Eclat算法在Spark分布式计算框架上实现并行化。实验结果表明,I-SPEclat算法较已有的改进Eclat算法在时间消耗和内存消耗方面均有减少,且面对不同规模的数据集也有着良好的扩展性。
[期刊] 统计与决策
[作者]
张启徽
针对关联规则挖掘中Apriori算法在生成频繁项集时的不足,文章在对原始数据集预处理的基础上,提出了进一步修剪频繁项集修剪优化策略,减少了频繁项集的数目,提高了连接速度;另外通过增加项数统计字段和对不再使用的子项在数据库中标记或删除等方法使数据库数据规模不断减少,从而缩小搜索范围,提高扫描速度。
关键词:
数据挖掘 关联规则 频繁项集 改进算法
[期刊] 特区经济
[作者]
李晓龙 冯俊文
数据挖掘领域中,关联规则挖掘是研究的核心内容,其能够在大量数据中发现某种潜在的规律,从而辅助决策者实现决策。但是,频繁项集挖掘属于关联规则挖掘中最消耗时间的部分,挖掘速度对关联规则挖掘造成了影响,并且也对数据挖掘的效率造成了影响。另外,多核硬件技术在不断发展的过程中,多核处理器也在不断的普及,以此有效促进了多和并行软件技术的发展。所以,设计关联规则频繁项集挖掘算法具有重要的意义。本文深入研究了数据挖掘技术的算法,并且使用Prolog语言进行了实现,试图使用逻辑推理方法对数据挖掘过程中的问题进行有效解决。
关键词:
关联规则 频繁项集 挖掘算法
[期刊] 图书情报工作
[作者]
陈亮 张志强 尚玮姣
本文以专利中的技术术语作为事务、以术语中的词汇作为项,通过闭频繁项集挖掘方法,对专利文献中的技术术语的结构变化情况进行时序分析,以从新的角度来研究技术演化趋势,之后以硬盘驱动器磁头技术为例进行实证分析,实证结果表明,该方法能够对技术演化过程中所产生的技术变化进行有效识别。
[期刊] 统计与决策
[作者]
王大将 孙洁
数据流挖掘技术是数据挖掘技术的新研究方向之一。文章介绍了数据流、数据流挖掘的特点,对现有的数据流挖掘算法进行了总结、分析,提出了数据流挖掘的研究方向和应用前景。
关键词:
数据流 数据流挖掘 聚类 分类 频繁模式
[期刊] 情报理论与实践
[作者]
李勇男
[目的/意义]时间序列模式挖掘可以识别不同暴恐案件中各种因素的时间序列关系,为反恐预警提供参考。[方法/过程]首先设定最小支持度阈值参数和最小反恐情报序列长度参数,对样本集进行常规数据预处理和合并同类项,统计频繁1-序列,然后不断迭代生成候选i-序列和筛选频繁i-序列的过程,直到达到终止条件为止,最后选取满足最小长度阈值的反恐情报序列。[结果/结论]该方法通过总结各种暴恐活动中较为频繁的时序关系,可以在反恐预警系统中设定触发警报的条件,预测部分恐怖袭击并提前处置。[局限]该方法只能发现这类有时序关系的信息,在实际反恐情报分析中,需要与其他方法整合才能覆盖更多的情报。
[期刊] 图书情报工作
[作者]
陈亮 张静 杨冠灿 雷孝平
[目的 /意义]将闭频繁项集挖掘技术应用于专利文本,进而分析技术的演化发展趋势,从微观层次描绘既定领域中主要的技术发展脉络。[方法 /过程]在进行闭频繁项集挖掘过程中,以专利文本的术语为事务、术语中的单词作为项,继而使用闭频繁项集之间的关联规则建立起术语层次网络,最后以术语层次网络为依托创建技术路线图。[结果 /结论]实证结果表明,该方法应用于硬盘驱动器磁头领域,能够刻画出不同术语的融合、派生过程,从而描绘出更加符合技术演化真实情况的技术路线图。
[期刊] 统计与决策
[作者]
陈文锋
文章提出了一种处理噪音数据的算法。最后应用MATLAB软件和SAS软件建立模型,实验结果表明该算法能够很成功地建立模型拟合这种问题。
关键词:
数据挖掘 信息 模型 统计
[期刊] 管理世界
[作者]
琚春华
本文在阐述动态连锁商业数据流概念的基础上,提出了面向动态连锁商业数据流的分布式数据挖掘模型,并对有关模型架构、算法和实现技术等关键内容进行了深入探讨。
关键词:
连锁商业 数据流 分布式 数据挖掘
[期刊] 中国注册会计师
[作者]
王良 鲍喜 王云 周建成 张海超
"数据挖掘"通常也称为"知识发现",顾名思义就是从海量数据中找出有用的知识。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。本文主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据,通过机器学习和数据库的交叉运用,从而实现基于数据分析挖掘的审计方法。数据挖掘是针对日益庞大的电子
[期刊] 统计与决策
[作者]
王劲波,翁伟,许华荣
聚类在数据挖掘、模式识别等许多领域有着重要的应用。本文介绍了聚类算法的几种分类,并例举了几种基于密度的聚类算法。最后以一种新颖的基于最大不相含核心点集的聚类算法LSNCCP为例,详细介绍整个聚类算法的工作过程。
[期刊] 管理现代化
[作者]
郭长帅 卓建伟
通过评估5种数据挖掘、机器学习算法,选出评估效果最好的算法模型,对流动人口的定居意愿进行研究和分析。研究发现,定居意愿更多的受到工作收入与生活成本的约束。低学历者在流入地定居为工作机会导向,高学历者定居为收入导向。
关键词:
流动人口 定居意愿 数据挖掘
[期刊] 图书馆论坛
[作者]
潘卫东
文章主要描述了WEB页数据挖掘的基本任务,包括内容、结构、使用等。针对WEB数据的复杂性和特殊性,WEB的数据挖掘除日志等一小部分可以用常用的数据挖掘方法外,必须对WEB页做必要的数据处理,使之达到结构化数据的挖掘要求,或使用XML技术来构造半结构数据模式再进行数据挖掘。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除