欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    面向数据挖掘云端实施方案.doc

    • 资源ID:1131275       资源大小:124.40KB        全文页数:11页
    • 资源格式: DOC        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    面向数据挖掘云端实施方案.doc

    面向数据挖掘的云端实施方案摘要:云端运算是一种基于互联网的新兴应用计算机技术,数据挖掘是商业智能的重要环节,Data Mining与云端运算的结合将极大提高数据挖掘的应用与统计科学的开展。本文提出了云端的数据挖掘即效劳DMaaS,Data Mining as a Serves的概念,分别从IaaS、PaaS与DMaas给出了面向数据挖掘的云端实施方案;设计出商用DM软件与开源DM软件的云端实施平台,引入R中平行运算技术对Cloud-R进展改良。关键词:云端运算;Data Mining;DMaaS;平行运算中图:C81 文献标识码:AThe Cloud puting Program for Data Mining TechnologyAbstract: Cloud puting is a kind of newly emerging technology of puter application based on Internet. Data Mining is a key step in Business Intelligence. The bination of Data Mining and Cloud puting will greatly enhance the application of Data Mining and the development of Statistics Science. The paper proposes the concept of DMaaS and provides implication programs of cloud puting from the aspect of IaaS, PaaS and DMaaS respectively. The paper designs the cloud puting platforms of mercial DM software and open source DM software, and introduces parallel puting in R to improve Cloud-R.Keywords: Cloud puting; Data Mining; DMaaS; Parallel puting引言数据挖掘也是商业智能的重要环节,数据仓库是数据挖掘得以开展的根底,也是商业智能的支撑,由此可见数据仓库对于商业智慧来言具有很重要的作用,它集成了企业的最核心的数据,随着企业对数据的再次利用和深入挖掘,海量数据的高效计算问题成为企业最为关注的一个问题之一。在商业智慧(BI)活动中,数据仓库与数据挖掘要求的费用支出庞大,很多中小企业望而却步。云端运算的出现,对中小企业来讲,是一个振奋人心的好消息。如果云端运算应用在商业智能上,由于云端运算具有按需使用、按使用收费特性,这将大大减少企业应用商业智能的本钱。此外,一方面,我们可以通过云的数据仓库实现海量数据的高效计算。另一方面,云端运算可以实现在线支付使用数据挖掘工具和商业智能相关分析处理软件。数据挖掘Data Mining具备更多的工具与更成熟的功能,与领导品牌的BI解决方案并驾其驱,但投资本钱却更低;Data Mining大幅提升的效能与新增强化的功能,吸引我们全面升级以发挥新技术的效益。例如,*广达电脑*以Intel搭配SQL Server,所消耗的本钱却低于Uni*的三分之一,创造了绝对的本钱优势。目前,在线数据挖掘效劳也受到大陆许多企业的青睐,中国的海量信息技术*提供的名“海纳睿的在线数据挖掘效劳,可以利用其在在线网络数据挖掘技术上的优势,为用户提供个性化需求,定制个性模块效劳,以此来满足的不同需求。此外,开源商业智慧BI厂商生态系统逐渐崛起,包括Jasper Soft、Actuate、Pentagon、Spago BI等。云端运算(Cloud puting)是分布式处理(Distributed puting)、并行处理(Parallel puting)和网格计算(Grid puting)的开展,或者说是这些计算机科学概念的商业实现,它具有超大规模、虚拟化、高可靠度、高通用性、使用者付费、本钱低、高扩大性等特色。云端运算将庞大运算操作拆成千百个较小的操作,再交给远程、多台效劳器同时运算;透过此种技术,网络效劳提供者可以在数秒之内,处理数以千万计的信息,并提供和超级计算机一样强大效能的网络效劳,以符合网络用户日增的各种需求。云端运算基于因特网的运算方式,它通过因特网为个人使用者或企业使用者提供按需即取的效劳。直观来讲,云端算法就是让网络上不同计算机同时帮你做一件事情,大幅度的提高了处理速度和效率。云端运算的最终目标即为所有的资源均来自于云端,使用者只需一个连接云端的设备手机等和简单的界面如浏览器等即可,Google搜寻效劳, Gmail, YouTube, Google Docs, Google Talk, iGoogle, Google Calendar已充分使用云端运算技术;其它如微软, , AMAZON也采用这种技术提升网络效劳功能。从概念上说,使用者需要云端运算的计算平台或IT根底设施,并在这些平台与设施中运行应用。因此,计算云给予使用者进入硬件、软件及数据资源的效劳,此后,一个集成的计算平台以一种透明的方式进展效劳。软件即效劳SaaS平台即效劳PaaS架构即效劳IaaS图1 云端架构效劳层次示意图云端运算包括以下几个层次的效劳,架构即效劳IaaS, 平台即效劳PaaS和软件即效劳SaaS。云端运算效劳通常提供通用的通过浏览器存取的在线商业应用,软件和数据可储存在数据中心。架构即效劳提供了核心计算资源和网络架构的效劳,如防火墙、路由器、下载分配等。架构即效劳供货商包括亚马逊的弹性计算云EC2和Joyent。平台即效劳提供平台给系统管理员和开发人员,为它构建、测试及部署定制应用程序。平台即效劳供货商包括微软的Azure、Google 的App Engine等。软件即效劳通过Internet 提供软件的模式,用户向提供商租用基于Web的软件,来管理企业经营活动,且无需对软件进展维护,效劳提供商全权管理和维护软件。软件即效劳供货商包括惠普的云打印效劳,IBM的Lotus Live为企业提供的协作和社交网络效劳。其它SaaS提供商如Birst和SAS提供按需商务智慧效劳,Salesforce.和Zoho提供客户关系管理(CRM)等。一、面向DM的架构即效劳IaaS架构即效劳IaaS作为效劳或硬件效劳,指的是提供以IT根底设施为根底,基于虚拟或物理资源作为一种商品;这些资源满足内存,CPU类型和能力以及存储方面的最终用户的需求,并在大多数情况下是操作系统。用户按使用计费的根底上支付,必须建立对这些资源的主持和卖方所拥有的数据中心管理上他们的系统;架构即效劳提供了核心计算资源和网络架构的效劳。IaaS技术实施方案Technology机房建置Hardware构建软件平台Software图2 IaaS架构图面向Data Mining的IaaS,其软件平台、机房建置与技术实施可按照表1中的方案实施。表1 面向DM的IaaSIaaS构成实施方案构建软件平台Software提供用户R软件完善的web接口,以及多台双核心效劳器的支持,进而缩短统计分析上所消耗的计算时间适用于Cloud-R云端实施平台以R统计软件为根底,透过网页浏览器即能做出统计运算,并且参加云端技术的支持,让使用者可以无限扩大运算能适用于Cloud-R云端实施平台采用SUN-Micro、Trend-Micro技术作为支持,完成硬件虚拟化根本架构以Open Source为主进展研发,掌握Total solution评估Centos, *en,Hadoop,Tashi, Eucalyptus, Ganglia, Nagios等开源软件集,进展各项运转测试机房建置Hardware硬件建置:*86 PC/效劳器为根底的丛集系统整合云端测试套件(Test Suites);确认示范应用导入需求及测试规格GUI portal建置技术实施方案Technology虚拟平台机:以*86 PC效劳器架构丛集系统,建立虚拟机平台,运用开放原始码软件,建置如Amazon-like云端效劳,实作IaaS试营运自动化负载平衡:在多核系统上使用*en控制多台虚拟机并执行不同功能的伺服主机;变动*en的Credit CPU排程器的weight及cap参数设定, 来观察虚拟伺服主机的效能;利用观察的经历数据及机器学习算法建立效能函数模型;利用多目标决策规划寻找最正确的weight及cap参数设定自动化大量数据切割与整合:以Java语言进展单机系统仿真大量数据切割与重组;设计出单机系统仿真大量数据切割与重组的多引线算法,并开发修正边缘计算效应的算法4效劳质量衡量:透过客户端程序与Hadoop Distributed File SystemHDFS上的NameNode daemon沟通,以得到对客户端程序存取最有利的DataNode daemon所在的主机位置及档案目录。接着,客户端程序再直接向DataNode daemon要数据或上传数据至该主机上GPU协同平行化程序分析与部属:以OpenMP、 Windows API Threads进展多核心CPU分布式算法设计,并使用NVIDIA GUDA GPU进展分布式算法设计,使两种不同架构下的计算进展比拟与测试,也设计CPU与GPU协同运算算法。云端运算主机使用CPU与NVIDIA CUDA GPU协同运算,在时间、人力充足的情况下,可以考虑使用Threads API对硬件做进一步效能优化注:参考资料:1、谢邦昌.?云端运算在商业智能及数据挖掘的应用前沿综述?.2021。2、*财团法人信息工业策进会国立*大学.?*云端达算应用实验中心研发方案? .2021.二、面向DM的平台即效劳PaaSPaaS(Platform as a Service)就是将云计算时代相应的效劳器平台或者开发环境作为效劳提供给用户,用户可以在平台上进展软件部署及软件开发等工作阵。平台即效劳PaaS作为一个效劳解决方案提供给用程序或开发平台,用户可以创立自己的应用程序将在云中运行。平台即效劳提供平台给系统管理员和开发人员,以及它构建、测试及部署定制应用程序。PaaS的实现提供了一个应用程序框架和一组API,可用于编程或开发人员组成的云应用程序的用户。在一些情况下,PaaS的解决方案通常提供为一体的综合开发平台,同时提供一个系统和一个顶尖的IT根底构造的申请将被执行。一接口效劳发布接口效劳发布是实现PaaS平台应用管理的关键技术。接口效劳按照SOA模式,采用WebService技术进展发布。以.Net平台下的接口设计和发布为例:将所有业务效劳功能封装成接口实体类并编译,PaaS平台将实体类的名称、调用标准、功能描述等信息添加到应用接口列表中,并实现接口与业务实体类的映射;用户在使用接口时,向平台发送WebService请求;拦截器将请求截获后在接口列表中查找出相应接口和实体类,通过反射技术取得实体对象进展业务处理,最后将处理结果返回给用户。业务用户封装、编译接口调用请求业务实体类处理结果Web Service拦截器注册、映射应用接口列表机器学习 数据挖掘 统计分析 可视化通过反射机制进展接口和实体映射图3 面向DM的应用接口注册及调用逻辑构造二mon API 技术整合现有效劳的API,对现有云端效劳API进展研究 (Google APIs、Microsoft Azure APIs、salesforce. web service APIs),使用标准将定义成说明档,以利使用者查询。在使用者自制云端效劳的上传机制,也将撰写一个网页,以方便使用者上传至云端,供其他使用者使用。而在检查机制上,也会有所限定;利用DWR,让javascript去呼叫在云端的meta-api即云端效劳,以到达云端效劳的提供与实现。三、面向DM的软件即效劳DMaaS面向DM的软件即效劳DMaaS(Data Mining as a Serves是数据挖掘的新理念,通过Internet提供软件的模式,用户向提供商租用基于Web的DM软件,来进展企业或个人的数据挖掘活动,且无需对软件进展维护,效劳提供商会全权管理和维护软件。DM软件在应用时作为效劳,通过互联网提供给顾客。图4 DMaaS示意图一DMaaS的商用软件DM云端实施平台DMssS商用软件DM云端实施平台是一种通过Internet向用户提供DM软件与效劳的模式,用户不用再购置软件,而改为向效劳提供商租用基于Web的商用数据软件来管理企业经营活动。商用软件DM平台降低了用户电脑安装或运行应用的需求,减轻了用户软件维护的负担,用户不需要担忧商业DM软件版本的不断更新的问题,只要通过Internet连接到该实施平台,就能够使用该平台提供的最新版本的商用软件,从而降低了企业与个人软件购置的费用,大幅度提升了企业和个人进展数据挖掘活动的效率。DMaaS商用软件DM平台可以提供的DM软件包括:SQL server 2021、SPSS 19 (PAWS) IBM、SAS 、SQL 2021+E*cel (2021)-Data Mining Add-in、Clementine 12.0、Statistica 7.0、WEKA、R+E*cel ADD-IN等。相应的商用软件DM实施平台如表2所示。表2 DMaaS商用软件DM云端实施平台平台中DM商用软件DM云端平台名称DM云端效劳SQL server2021Cloud- SQL server决策树、聚类分析、关联规则、主成分分析、因子分析、类神经网络、Logsitc回归、支持向量机、线性回归、文本数据挖掘SPSS 19(PAWS)Cloud- SPSSSASCloud- SASSQL 2021+E*cel (2021) Cloud- SQL +E*celClementine 12.0Cloud- ClementineStatistica 7.0Cloud- StatisticaWEKACloud- WEKADMaaS商用软件DM云端实施平台能够为用户提供便利的DM效劳,其优点是操作简便,用户界面友好,能够有效进展企业海量数据的处理与分析。但该平台也存在一些较为明显的缺点:1DMaaS商用软件DM云端实施平台的运营与管理的本钱较高,由于该平台提供的是商用DM软件,需要花大量资金购置相应DM软件,随着商用软件版本的不断升级,为了满足业务的需要,该平台的商用DM软件业必须不断更新,这样进一步增加了该平台管理与运营的本钱。2DMaaS商用软件DM云端实施平台提供的DM效劳是基于商业DM软件的,由于目前数据挖掘方法开展迅速,DM方法不断更新,而常用的商用DM软件中提供的数据挖掘方法有限,在科学研究与特定商业数据处理过程中,用户需要用到的许多数据挖掘方法无法通过商用软件实现。为了解决商用软件DM云端实施平台的问题,开源软件DM平台有了广阔的应用与开展空间。二DMaaS的开源软件云端实施平台Cloud-R1. Cloud-R简介对于现今的商业智能分析而言,通常需要进展海量数据的分析。因此,运用计算机的高效运算能对数据资进展统计分析已经是统计开展的必然趋势。以R 为首的多套统计软件都拥有强大的处以及统计能。由于R软件是以GNU 自由免费开发中的S language 工程而,具有广阔群众支持以及快速更新的优点,用户可以在R Project 中免费下载使用R软件。但在商业数据挖掘过程中,R 个人用户的计算机硬件配备无法支持庞大的计算量。此外,由于R软件版本与程序包更新较快,可能低一局部用户使用R 软件的意愿。针对以上R软件所固有的缺点,我们希望能够将R软件扩大成为一项 web service,R软件的广阔用户将能够透过web接口轻松的使用R软件,应用云端技术协助负担信息分析所需要用到的大量运算效能。因此,开源软件DM云端实施平台Cloud-R逐渐建立起来,Cloud-R将提供用户R 软件完善的web 接口,并且至少有一台四核心、多台双核心效劳器的支持,进而缩短统计分析上所消耗的计算时间。CloudR 主要以R 统计软件为根底,用户在网页浏览器即可做出统计运算,由于云端技术的支持,使用者可以无限扩大运算能。CloudR 可以藉由任何网页浏览器进操作。作为与R 软件相互照应的网接口,CloudR支援R 软件所提供的所有指;使用者可实时的运算,并即将结果及图片呈现在网页上。使用者可下载使用过的程序与结果CloudR 与其他web 接口的R 同的地方在于使用php 语言撰写而成,使用者需再另外加装java 或是其他套件,用户只需能够连接到Internet,即可方便应用该平台应用R 软件进展统计分析,并且可方便的将统计结果与他人共享。透过CloudR,使用者可以更轻松、无负担的使用R 统计软件,用户可通过网页界面调用资库,能够将所需的分析资、程序快速的下载到任何计算机中,并且能享用平运算所带的好处。CloudR 提供使用者更便利、更有效率、更强大的计算机运算能,进一步拉近了用户使用R软件的门槛,并推动了统计分析、数学运算的各领域的更快开展。2Cloud-R技术改良R的平行运算技术1CloudR现行的平行运算技术。目前的CloudR在实现平运算能方面,需要预先加载R软件中的 networkspace程序包,networkspace 提供完整的平运算根底,与过往平运算所同的是,networkspace 以更有效的方法处变量的共享问题,让平运算的效能能加发挥。CloudR 目前提供一台四核心主机、两台双核心主机以及Raid5 的备份机制,用户不需担忧计算机效能与储存空间的问题,在未来的运营中,只要在CloudR 参加运算能力强的主机及大的储存空间,所有的使用者便能一起享受到升级过后所带来的便利,而需再消耗大量时间与财力来扩大个人计算机的效能与容,同时也有效解决了计算机资源闲置浪费的问题。2R的平行运算技术。平行计算是一种许多运算同时实施计算形式,其原理是将大问题分成假设干小问题,然后并行的解决问题。目前,Cloud-R中的平行运算中存在一些问题,例如,单独的程序容易影响一个完整的架构,例如该程序分配到过多的CPU或RAM,而没有给其他用户和程序留下资源,或者该程序的运行降低了一个或更多的计算机的运行效率。R中的sfCluster程序能够有效进展CPU资源的配置。因此,对于工作组或较大的集群,可以在Cloud-R云端实施平台中引入sfCluster中的平行计算技术。SfCluster的工作流程如下列图所示。初始化执行观察环启动R (控制)内存占用检测检查 R 进程观察环全面资源检查检测节点撤销集群安装 集群 (会话)可视状态关闭 LAM 集群启动 LAM/MPI 集群可选步骤遇错停顿图5 SfCluster的工作流程现已开发了管理工具sfCluster和相应的R程序包snowfall,它们旨在使并行程序更简单和灵活。sfCluster完全隐藏了来自用户的集群的安装和处理以及监控所有引起机器和集群问题的并行程序的执行。sfCluster与snowfall的配合使用,可以使用户在没有关于集群与计算机配置知识的情况下,仍可以使用R中进展并行计算。此外,snowfall支持PVM 和NetWorkSpaces/Sleight的使用。根本来讲,snowfall的使用流程机制如下所示:第一,使用sfInit()进展初始化,安装cluster(如果需要)和内部函数。第二,sfInit()必须在使用snowfall包的任何函数之前被调用。第三,对所有附属程序输出所需的变量/对象。第四,使用snowfall计算函数进展一些平行计算。第五,按所需重复屡次。最后,使用sfStop()完毕平行计算。具体R程序演示如下:library(snowfall) #调用snowfall程序包# 1. Initialisation of snowfall. Snowfall的初始化# (if used with sfCluster, just call sfInit() 如果使用sfCluster,就调用sfInit()sfInit(parallel=TRUE, cpus=4, type="SOCK")# 2. Loading data. 装载数据require(mvna)data(sir.adm)# 3. Wrapper, which can be parallelised. 封装平行列表wrapper <- function(id*) # Output progress in worker logfile 在文件logfile中输出进程cat( "Current inde*: ", id*, "n" )inde* <- sample(1:nrow(sir.adm), replace=TRUE)temp <- sir.adminde*, fit <- crr(temp$time, temp$status, temp$pneu)return(fit$coef)# 4. E*porting needed data and loading required 输出所需的数据并装载所要求的程序包# packages on workers.sfE*port("sir.adm")sfLibrary(cmprsk)# 5. Start network random number generator 启动网络随机数产生器# (as "sample" is using random numbers). 作为“样本使用随机数sfClusterSetupRNG()# 6. Distribute calculation 分配计算result <- sfLapply(1:1000, wrapper)# Result is always in list form. 结果总在列表中mean(unlist(result)# 7. Stop snowfall 完毕snowfallsfStop()3Cloud-R提供的云端效劳Cloud-R面向DM的云端效劳主要分为两类,具体内容如下表所示。表3DMaaS提供的云端效劳第一类:数据库第二类:Data Mining新增查询删除汇入汇出Binary Classifier (二元分类) Numeric Predictor (数值预测) Time Series (时间序列) C&R TREE (分类回归树) Quick Unbiased Efficient Statistical Tree (QUEST判定树模型) CHAID (分类树) Decision List (判定树列表) Regression (线性回归分析) PCA/Factor (主成分分析) Neural Net (类神经网络) C5.0 (判定树) Feature Selection (特征选取) Discriminant Analysis Logistic (罗吉斯回归) Generalize Linear Model (广义线性模型) Co* Regression (Co* 回归)Support Vector Machine (支持向量机) Bayes Net (贝氏分类器) SLRM (自我学习反响模型) GRI关联Apriori关联CARMA关联(连续交易) Sequence Clusterc序列关联K-Means (K-Means分群) Kohonen (自我组织化) Two-Step (二阶段) Anomaly (异常检测) Random Forests (随机森林) ICA (独立成分分析) Multivariate adaptive regression spline (MARS多元适应性回归平滑) Pmml(预测模型标记语言) Boosting 注:资料来源:谢邦昌.?云端运算在商业智能及数据挖掘的应用前沿综述?.2021。Cloud-R云端实施平台可以提供全面而灵活的DM的云端效劳,改善了商业软件云端平台DM算法更新滞后的缺点,用户可以应用最新版本的R软件及最新的R统计方法。用户也可以根据自己需要,根据实际需要编写自己的程序。在云端平台管理方面,由于R软件是开源软件,其下载及使用均是免费的,因此较商用软件云端平台相比,Cloud-R的具有本钱低,管理方便的优点,因此将成为DMaaS未来的开展趋势。四、结语面向DM的云端运算DMaaS是一个全新的理念,它不但适用于企业信息化的应用模式,又能够极大促进数据挖掘技术与商业智能的开展。作为一种全新的软件应用模式,DMaaS开展过程中还面临着不少问题,其中包括DMaaS模式自身的问题,也有企业用户及DMaaS供给商的问题。我们有理由相信,DMaaS在开展过程中遇到的问题和阻碍只是暂时的,在未来,DMaaS在云端运算领域有着广阔的开展及应用前景, DMaaS产业也将会不断完善,使更多企业和个人受惠于DMaaS。参考文献1 A. Berson, S. J. Smith & K. Thearling. Building Data Mining Applications for CRMM. McGraw-Hill, 1999.2 A. Rossini, L. Tierney & N. Li. Simple parallel statistical puting in RJ. Journal of putational and Graphical Statistics,2007. 16(2),399420.3 Black Friday traffic takes down Sears.M. Associated Press, 2021(11).4 CHENG, D. PaaS-onomics: A CIOs Guide to using Platform-as-a-Service to Lower Costs of Application Initiatives While Improving the Business Value of ITM. Tech. rep., LongJump, 2021.5 C. Oehmen, J. Nieplocha. Scalablast: A scalable implementation of blast for high-performance data-intensive bioinformatics analysisJ. IEEE Transactions on Parallel and Distributed Systems, 2006.17(8),740749.6 DEAN, J., AND GHEMAWAT, S. Mapreduce: simplified data processing on large clustersJ. In OSDI04: Proceedings of the 6th conference on Symposium on Opearting Systems Design & Implementation (Berkeley, CA, USA), USENI* Association, 2004(10),10.7 DECANDIA, G., HASTORUN, D., JAMPANI, M., KAKULAPATI, G., LAKSHMAN, A., PILCHIN, A., SIVASUBRAMANIAN, S., VOSSHALL, P., AND VOGELS, W. Dynamo: Amazons highly available key-value storeJ. In Proceedings of twenty-first ACM SIGOPS symposium on Operating systems principles M, ACM Press New York, NY, USA, 2007. 205220.8 E. Alpaydin. Introduction to Machine Learning (Adaptive putation and Machine Learning) M. 2004. MIT Press.9 GARFINKEL, S. An Evaluation of Amazons Grid puting Services: EC2, S3 and SQSM . Tech. Rep. TR-08-07, Harvard University, August 2007.10 GRAY, J., AND PATTERSON, D. A conversation with Jim GrayJ. ACM Queue 1, 4 (2003), 817.11 HOSANAGAR, K., KRISHNAN, R., SMITH, M., AND CHUANG, J. Optimal pricing of content delivery network (CDN) servicesJ. In The 37th Annual Hawaii International Conference on System Sciences ,2004. 205214.12 J. Murty. Programming Amazon Web ServicesM. OReilly Press, 2021.13 Jochen Knaus, Christine Porzelius, Harald Binder & Guido Schwarzer J. Easier Parallel puting in R with snowfall and sfCluster. The R Journal,2021.1(1),54-59.14 KREBS, B. Amazon: Hey Spammers, Get Off My Cloud! J. Washington Post (July 2021).15 Little, R. J. A., & Rubin, D. B. Statistical analysis with missing dataM, 2nd ed. New York: John Wiley & Sons. 2002.16 Li, J.R., Khoo, L. P.,&Tor, S. B. RMINE:Arough set based data mining prototype for the reasoning of inplete data in conditionbased fault diagnosisJ. Journal of IntelligentManufacturing, 2006(17), 163176.17 MCCALPIN, J. Memory bandwidth and machine balance in current high performance putersJ. IEEE Technical mittee on puter Architecture Newsletter ,1995. 1925.18 Margaret, H. D. Data miningintroductory and advanced topics. Prentice Hall.2002.19 P. J. Brockwell, R. A. Davis. Introduction to Time Series and Forecasting (2nd ed.) M. Springe, 2002.20 R.Albert, A.-L.Barabasi.Emergence of scaling in randomnetworks. ScienceM,1999. 286,509512.21 Richard Newton, Lorenz Wernisch. & Rwui. A web application to create user friendly web interfaces for R scriptsJ. R News, 2007.7(2),32-35.22 S. Benninga, B. Czaczkes. Financial Modeling (2nd ed.) M. MIT Press, 2000.23 Uwe Ligges, John Fo*. R Help Desk: How can I avoid this loop or make it fasterJ. R News, 2021. 8(1),46-50.

    注意事项

    本文(面向数据挖掘云端实施方案.doc)为本站会员(李司机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开