标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(3309)
2023(4756)
2022(4155)
2021(3849)
2020(3129)
2019(6746)
2018(6765)
2017(12385)
2016(6523)
2015(6835)
2014(5947)
2013(5336)
2012(4371)
2011(3776)
2010(3617)
2009(3409)
2008(2787)
2007(2229)
2006(1805)
2005(1456)
作者
(14833)
(12283)
(12244)
(11741)
(7798)
(5769)
(5542)
(4723)
(4608)
(4141)
(4108)
(4019)
(3803)
(3710)
(3685)
(3669)
(3614)
(3513)
(3505)
(3489)
(2932)
(2929)
(2883)
(2796)
(2782)
(2653)
(2621)
(2619)
(2450)
(2424)
学科
(20446)
经济(20423)
管理(16451)
(14284)
(11312)
企业(11312)
方法(9362)
数学(8300)
数学方法(8100)
(6498)
中国(6185)
业经(5625)
(5613)
(4830)
贸易(4828)
(4698)
农业(4359)
地方(3665)
(3558)
(3523)
理论(3443)
产业(3392)
(3391)
环境(3378)
财务(3373)
财务管理(3368)
(3212)
银行(3208)
技术(3195)
(3130)
机构
学院(75570)
大学(73096)
管理(29200)
(29149)
经济(28594)
理学(25604)
理学院(25381)
管理学(24765)
管理学院(24636)
研究(22144)
中国(16982)
(14356)
科学(13671)
(13220)
中心(11204)
财经(10819)
(10431)
(10366)
业大(10261)
(10066)
(9888)
(9621)
师范(9517)
经济学(9243)
研究所(9218)
技术(9003)
(8679)
经济学院(8413)
(8380)
北京(8290)
基金
项目(55760)
科学(44195)
研究(42494)
基金(40350)
(34817)
国家(34539)
科学基金(30211)
社会(27188)
社会科(25849)
社会科学(25844)
(22313)
基金项目(20829)
教育(19585)
自然(18726)
编号(18660)
自然科(18356)
自然科学(18354)
(18244)
自然科学基金(17950)
资助(16017)
成果(14351)
重点(12545)
(12261)
(12233)
项目编号(12081)
课题(11655)
(11601)
国家社会(11593)
创新(11397)
科研(11070)
期刊
(29742)
经济(29742)
研究(19107)
中国(12646)
学报(10796)
管理(10379)
(10184)
(9832)
科学(9421)
教育(8616)
大学(8230)
学学(7710)
农业(7032)
业经(6642)
技术(6538)
经济研究(5736)
图书(5533)
(5376)
金融(5376)
财经(4793)
(4203)
情报(3947)
商业(3925)
书馆(3741)
图书馆(3741)
理论(3592)
科技(3560)
问题(3543)
(3530)
统计(3500)
共检索到104553条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 统计与决策  [作者] 敖孟飞  石鸿雁  
文章针对频繁项集挖掘中传统串行Eclat算法面对海量数据时挖掘效率不高的问题,提出一种海量数据下的并行频繁项集挖掘算法,即I-SPEclat算法。首先,对Eclat算法存在的缺陷进行改进,引入图的邻接矩阵作为数据的存储结构,避免了大量的交集运算;其次,利用先验性质对候选项集进行预剪枝和后剪枝,减少无用候选项集的数量,节约存储空间;再次,根据项集的前缀对数据进行划分,平衡每个计算节点的工作负载;最后,将改进的Eclat算法在Spark分布式计算框架上实现并行化。实验结果表明,I-SPEclat算法较已有的改进Eclat算法在时间消耗和内存消耗方面均有减少,且面对不同规模的数据集也有着良好的扩展性。
[期刊] 华中师范大学学报(自然科学版)  [作者] 朱付保  白庆春  汤萌萌  朱颢东  
针对传统数据流频繁项集计算中效率低、内存消耗大等问题,本文采用并行计算的思想设计了一种基于MapReduce的数据流频繁项集挖掘算法,首先,对进行数据分块压缩和传输,其次,将数据频繁项的计算分布在负载均衡的数据节点,可以有效保证数据的执行效率.最后通过一次调度处理合并各个节点产生的频繁项集并进行合并.理论分析和实验对比结果均表明,该算法对于并行处理数据流频繁项集的统计问题是有效可行的.
[期刊] 物流技术  [作者] 黄金晶  叶施仁  何福男  
将MapReduce运用于关联规则挖掘算法中,提出了一种改进的频繁项集挖掘算法。该算法以并行的方式工作,并且改变了频繁项集挖掘的次序,从包含项数最多的频繁项集开始挖掘,直到得到用户希望的频繁项集终止,为用户提供了交互性,与经典的关联规则挖掘算法Apriori相比,运行效率有大幅度的提高。
[期刊] 统计与决策  [作者] 张启徽  
针对关联规则挖掘中Apriori算法在生成频繁项集时的不足,文章在对原始数据集预处理的基础上,提出了进一步修剪频繁项集修剪优化策略,减少了频繁项集的数目,提高了连接速度;另外通过增加项数统计字段和对不再使用的子项在数据库中标记或删除等方法使数据库数据规模不断减少,从而缩小搜索范围,提高扫描速度。
[期刊] 特区经济  [作者] 李晓龙  冯俊文  
数据挖掘领域中,关联规则挖掘是研究的核心内容,其能够在大量数据中发现某种潜在的规律,从而辅助决策者实现决策。但是,频繁项集挖掘属于关联规则挖掘中最消耗时间的部分,挖掘速度对关联规则挖掘造成了影响,并且也对数据挖掘的效率造成了影响。另外,多核硬件技术在不断发展的过程中,多核处理器也在不断的普及,以此有效促进了多和并行软件技术的发展。所以,设计关联规则频繁项集挖掘算法具有重要的意义。本文深入研究了数据挖掘技术的算法,并且使用Prolog语言进行了实现,试图使用逻辑推理方法对数据挖掘过程中的问题进行有效解决。
[期刊] 图书情报工作  [作者] 陈亮  张志强  尚玮姣  
本文以专利中的技术术语作为事务、以术语中的词汇作为项,通过闭频繁项集挖掘方法,对专利文献中的技术术语的结构变化情况进行时序分析,以从新的角度来研究技术演化趋势,之后以硬盘驱动器磁头技术为例进行实证分析,实证结果表明,该方法能够对技术演化过程中所产生的技术变化进行有效识别。
[期刊] 情报理论与实践  [作者] 李勇男  
[目的/意义]时间序列模式挖掘可以识别不同暴恐案件中各种因素的时间序列关系,为反恐预警提供参考。[方法/过程]首先设定最小支持度阈值参数和最小反恐情报序列长度参数,对样本集进行常规数据预处理和合并同类项,统计频繁1-序列,然后不断迭代生成候选i-序列和筛选频繁i-序列的过程,直到达到终止条件为止,最后选取满足最小长度阈值的反恐情报序列。[结果/结论]该方法通过总结各种暴恐活动中较为频繁的时序关系,可以在反恐预警系统中设定触发警报的条件,预测部分恐怖袭击并提前处置。[局限]该方法只能发现这类有时序关系的信息,在实际反恐情报分析中,需要与其他方法整合才能覆盖更多的情报。
[期刊] 图书情报工作  [作者] 陈亮  张静  杨冠灿  雷孝平  
[目的 /意义]将闭频繁项集挖掘技术应用于专利文本,进而分析技术的演化发展趋势,从微观层次描绘既定领域中主要的技术发展脉络。[方法 /过程]在进行闭频繁项集挖掘过程中,以专利文本的术语为事务、术语中的单词作为项,继而使用闭频繁项集之间的关联规则建立起术语层次网络,最后以术语层次网络为依托创建技术路线图。[结果 /结论]实证结果表明,该方法应用于硬盘驱动器磁头领域,能够刻画出不同术语的融合、派生过程,从而描绘出更加符合技术演化真实情况的技术路线图。
[期刊] 中国内部审计  [作者] 章怡翀  
案例背景随着智能终端的不断普及和运营力度的不断加大,通信公司移动互联网业务整体呈现迅猛发展态势,用户数量和收入规模不断攀升。近年来,结算业务不断发展,涉及结算金额庞大,结算流程和口径也日趋复杂,结算操作日趋频繁,因此与业务相关的结算数据的准确性、完整性,
[期刊] 统计与决策  [作者] 陈文锋  
文章提出了一种处理噪音数据的算法。最后应用MATLAB软件和SAS软件建立模型,实验结果表明该算法能够很成功地建立模型拟合这种问题。
[期刊] 地理科学进展  [作者] 关雪峰  曾宇媚  
随着互联网、物联网和云计算的高速发展,与时间、空间相关的数据呈现出"爆炸式"增长的趋势,时空大数据时代已经来临。时空大数据除具备大数据典型的"4V"特性外,还具备丰富的语义特征和时空动态关联特性,已经成为地理学者分析自然地理环境、感知人类社会活动规律的重要资源。然而在具体研究应用中,传统数据处理和分析方法已无法满足时空大数据高效存取、实时处理、智能挖掘的性能需求。因此,时空大数据与高性能计算/云计算融合是必然的发展趋势。在此背景下,本文首先从大数据的起源出发,回顾了大数据概念的发展历程,以及时空大数据的特有特征;然后分析了时空大数据研究应用产生的性能需求,总结了底层平台软硬件的发展现状;进而重点从时空大数据的存储管理、时空分析和领域挖掘3个角度对并行化现状进行了总结,阐述了其中存在的问题;最后指出了时空大数据研究发展趋势。
[期刊] 图书馆论坛  [作者] 潘卫东  
文章主要描述了WEB页数据挖掘的基本任务,包括内容、结构、使用等。针对WEB数据的复杂性和特殊性,WEB的数据挖掘除日志等一小部分可以用常用的数据挖掘方法外,必须对WEB页做必要的数据处理,使之达到结构化数据的挖掘要求,或使用XML技术来构造半结构数据模式再进行数据挖掘。
[期刊] 经济学动态  [作者] 朱建平  魏瑾  谢邦昌  
金融高频数据构成海量数据集,属于数据挖掘的研究范畴,然而在金融高频数据的研究中,数据挖掘技术尚未得到足够的重视。金融高频数据的研究目前主要集中于对波动率、交易间隔等特征的建模,最优抽样间隔的选择等应用领域,国内鲜有方法论框架下直接将金融高频数据作为研究对象的理论讨论与分析,这不可避免导致对高频数据认识上的一些误区和不一致。为此,本文对国内外金融高频数据的研究现状进行了剖析,澄清了金融高频数据的概念与特征,并从统计的视角重新审视了金融高频数据研究。在此基础上,提出了金融高频数据挖掘进一步的研究思路。
[期刊] 物流技术  [作者] 戴歆  何宁  
构建了RFID终端数据集和供应链工作流模型,重点设计了RFID终端数据集预处理算法、供应链工作流网络数据挖掘算法,并对算法效能和适用性进行了检验,表明所设计的算法对于海量RFID数据集具有较强的应用价值,对于供应链管理和相关问题的决策可以起到应有的作用。
[期刊] 中国注册会计师  [作者] 王良  鲍喜  王云  周建成  张海超  
"数据挖掘"通常也称为"知识发现",顾名思义就是从海量数据中找出有用的知识。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。本文主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据,通过机器学习和数据库的交叉运用,从而实现基于数据分析挖掘的审计方法。数据挖掘是针对日益庞大的电子
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除