企业管理培训,亚洲伦理精品,企业培训公开课,亚洲伦理电影,企业内训课程,亚洲伦理,企业培训师 - 名课堂企业管理培训网

名課堂 - 企業(yè)管理培訓(xùn)網(wǎng)聯(lián)系方式

聯(lián)系電話:400-8228-121

值班手機(jī):18971071887

Email:Service@mingketang.com

企業(yè)管理培訓(xùn)分類導(dǎo)航

企業(yè)管理培訓(xùn)公開課計(jì)劃

企業(yè)培訓(xùn)公開課日歷

職業(yè)技能培訓(xùn)公開課

職業(yè)技能培訓(xùn)內(nèi)訓(xùn)課程

熱門企業(yè)管理培訓(xùn)關(guān)鍵字

您所在的位置:名課堂>>公開課>>職業(yè)技能培訓(xùn)公開課

基于Python的Spark大數(shù)據(jù)挖掘技術(shù)

【課程編號(hào)】:MKT036395

【課程名稱】:

基于Python的Spark大數(shù)據(jù)挖掘技術(shù)

【課件下載】:點(diǎn)擊下載課程綱要Word版

【所屬類別】:職業(yè)技能培訓(xùn)

【時(shí)間安排】:2017年07月13日 到 2017年07月15日5800元/人

2017年04月10日 到 2017年04月12日5800元/人

【授課城市】:上海

【課程說明】:如有需求,我們可以提供基于Python的Spark大數(shù)據(jù)挖掘技術(shù)相關(guān)內(nèi)訓(xùn)

【其它城市安排】:北京

【課程關(guān)鍵字】:上海大數(shù)據(jù)分析培訓(xùn),上海大數(shù)據(jù)挖掘培訓(xùn)

我要報(bào)名

咨詢電話:
手  機(jī): 郵箱:
課程介紹

Python是數(shù)據(jù)分析最常用的語言之一,而Apache Spark是一個(gè)開源的強(qiáng)大的分布式查詢和處理引擎。本培訓(xùn)用詳盡的案例介紹如何使用Python來調(diào)用Spark的新特性,如何處理結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),如何使用PySpark中一些基本的可用數(shù)據(jù)類型,如何生成機(jī)器學(xué)習(xí)模型、操作圖像、閱讀串流數(shù)據(jù)以及在云上部署模型。

本培訓(xùn)結(jié)合實(shí)例來介紹PySpark大數(shù)據(jù)挖掘。內(nèi)容包括對(duì)Apache Spark基礎(chǔ)知識(shí)介紹,彈性分布式數(shù)據(jù)集RDD的內(nèi)部運(yùn)行方式講解,分析利用DataFrame加速PySpark,準(zhǔn)備數(shù)據(jù)建模,檢查重復(fù)數(shù)據(jù)及異常數(shù)據(jù),分析描述性統(tǒng)計(jì)、數(shù)據(jù)相關(guān)性,介紹MLlib數(shù)據(jù)挖掘工具應(yīng)用,講解ML機(jī)器學(xué)習(xí)包功能,使用Blaze實(shí)現(xiàn)持久化,講解Tensorflow基礎(chǔ),分析結(jié)構(gòu)化流Streaming,以及打包Spark應(yīng)用程序,提交作業(yè)和監(jiān)控執(zhí)行等。

本培訓(xùn)將合實(shí)例,對(duì)Python和Spark進(jìn)行講解,通過實(shí)際操作,了解云環(huán)境下,大數(shù)據(jù)處理、數(shù)據(jù)探索的基本方法。

培訓(xùn)對(duì)象

1,對(duì)大數(shù)據(jù)的前沿技術(shù)非常感興趣的人。

2,有志于成為一名數(shù)據(jù)科學(xué)家的從業(yè)人員。

3,有一定算法和編程基礎(chǔ)的技術(shù)愛好者。

培訓(xùn)目標(biāo)

1, 學(xué)習(xí)Python和Spark的相關(guān)基礎(chǔ)知識(shí)。

2,學(xué)習(xí)Python和Spark的核心技術(shù)方法及應(yīng)用。

3,了解Python和Spark在數(shù)據(jù)分析中的使用。

培訓(xùn)內(nèi)容

第一講 Spark基礎(chǔ)知識(shí)

1)什么是Apache Spark

2)Spark作業(yè)和API

3)DataFrame和Dataset

4)Spark 2.0的架構(gòu)

5)SparkSession介紹

6)Tungsten Phase 2

7)結(jié)構(gòu)化流

第二講 彈性分布式數(shù)據(jù)集

1)RDD的內(nèi)部運(yùn)行方式

2)創(chuàng)建RDD

3)全局作用域和局部作用域

4)RDD轉(zhuǎn)換

5)RDD操作

第三講 利用DataFrame加速PySpark

1)Python到RDD之間的通信

2)Catalyst優(yōu)化器刷新

3)創(chuàng)建DataFrame

4)RDD的交互操作

5)利用DataFrame API查詢

6)利用SQL查詢

7)DataFrame應(yīng)用實(shí)例

第四講 準(zhǔn)備數(shù)據(jù)建模

1)檢查重復(fù)數(shù)據(jù)及異常數(shù)據(jù)

2)描述性統(tǒng)計(jì)

3)數(shù)據(jù)相關(guān)性

4)數(shù)據(jù)可視化

5)直方圖

第五講 MLlib數(shù)據(jù)挖掘工具

1)MLlib包概述

2)加載和轉(zhuǎn)換數(shù)據(jù)

3)數(shù)據(jù)相關(guān)性和描述性統(tǒng)計(jì)

4)創(chuàng)建最終數(shù)據(jù)集

5)MLlib應(yīng)用實(shí)例-預(yù)測(cè)嬰兒生存機(jī)會(huì)

第六講 ML機(jī)器學(xué)習(xí)包

1)ML包的概述

2)分類、回歸和聚類

3)使用ML預(yù)測(cè)嬰兒生存率

4)ML超參調(diào)優(yōu)

5)ML的特征提取

6)ML的其他功能

第七講 使用Blaze實(shí)現(xiàn)持久化

1)安裝Blaze

2)混合持久化

3)使用NumPy和pandas數(shù)據(jù)

4)與關(guān)系型數(shù)據(jù)庫進(jìn)行交互

5)數(shù)據(jù)操作和訪問

6)數(shù)據(jù)連接

第八講 Tensorflow基礎(chǔ)

1)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)

2)TensorFlow介紹和安裝

3)配置和設(shè)置TensorFlow

4)使用TensorFlow進(jìn)行矩陣分析

5)TensorFlow操作示例

第九講 結(jié)構(gòu)化流Streaming

1)Streaming介紹

2)Streaming的基本組件

3)Streaming應(yīng)用程序數(shù)據(jù)流

4)用DStream簡(jiǎn)化Streaming應(yīng)用程序

5)全局聚合

6)結(jié)構(gòu)化流介紹

第十講 打包Spark應(yīng)用程序

1)spark-submit命令

2)以編程方式部署應(yīng)用程序

3)配置你的SparkSession

4)創(chuàng)建SparkSession

5)模塊化代碼

6)提交作業(yè)和監(jiān)控執(zhí)行

楊老師

主要研究網(wǎng)絡(luò)信息分析以及云計(jì)算相關(guān)技術(shù),長(zhǎng)期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個(gè)國家和省部級(jí)基金項(xiàng)目,具有豐富的工程實(shí)踐及軟件研發(fā)經(jīng)驗(yàn)。

我要報(bào)名

在線報(bào)名:基于Python的Spark大數(shù)據(jù)挖掘技術(shù)(上海)

主站蜘蛛池模板: 艺术生文化课培训|艺术生文化课辅导冲刺-济南启迪学校 | 机械立体车库租赁_立体停车设备出租_智能停车场厂家_春华起重 | 昆山新莱洁净应用材料股份有限公司-卫生级蝶阀,无菌取样阀,不锈钢隔膜阀,换向阀,离心泵 | 假肢-假肢价格-假肢厂家-河南假肢-郑州市力康假肢矫形器有限公司 | 恒压供水控制柜|无负压|一体化泵站控制柜|PLC远程调试|MCGS触摸屏|自动控制方案-联致自控设备 | 自动螺旋上料机厂家价格-斗式提升机定制-螺杆绞龙输送机-杰凯上料机 | 电动打包机_气动打包机_钢带捆扎机_废纸打包机_手动捆扎机 | 网站优化公司_SEO优化_北京关键词百度快速排名-智恒博网络 | 北京京云律师事务所 | 渣土车电机,太阳能跟踪器电机,蜗轮蜗杆减速电机厂家-淄博传强电机 | 西安中国国际旅行社(西安国旅) | 黑田精工电磁阀-CAMMOZI气缸-ROSS电磁-上海茂硕机械设备有限公司 | 圆周直径尺-小孔内视镜-纤维研磨刷-东莞市高腾达精密工具 | 海鲜池-专注海鲜鱼缸、移动海鲜缸、饭店鱼缸设计定做-日晟水族厂家 | 灌木树苗-绿化苗木-常绿乔木-价格/批发/基地 - 四川成都途美园林 | 样品瓶(色谱样品瓶)百科-浙江哈迈科技有限公司 | 北京百度网站优化|北京网站建设公司-百谷网络科技 | 定制防伪标签_防伪标签印刷_防伪标签厂家-510品保防伪网 | 建筑工程资质合作-工程资质加盟分公司-建筑资质加盟 | 电机保护器-电动机综合保护器-上海硕吉电器有限公司 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 水篦子|雨篦子|镀锌格栅雨水篦子|不锈钢排水篦子|地下车库水箅子—安平县云航丝网制品厂 | 三佳互联一站式网站建设服务|网站开发|网站设计|网站搭建服务商 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | 干式磁选机_湿式磁选机_粉体除铁器-潍坊国铭矿山设备有限公司 | 壹车网 | 第一时间提供新车_资讯_报价_图片_排行! | CNC机加工-数控加工-精密零件加工-ISO认证厂家-鑫创盟 | 刮板输送机,粉尘加湿搅拌机,螺旋输送机,布袋除尘器 | 软文推广发布平台_新闻稿件自助发布_媒体邀约-澜媒宝 | 附着力促进剂-尼龙处理剂-PP处理剂-金属附着力处理剂-东莞市炅盛塑胶科技有限公司 | 香港新时代国际美容美发化妆美甲培训学校-26年培训经验,值得信赖! | 北京印刷厂_北京印刷_北京印刷公司_北京印刷厂家_北京东爵盛世印刷有限公司 | 电子巡更系统-巡检管理系统-智能巡检【金万码】| 反渗透阻垢剂-缓蚀阻垢剂厂家-循环水处理药剂-山东鲁东环保科技有限公司 | 今日扫码_溯源二维码_产品防伪一物一码_红包墙营销方案 | 粉末冶金-粉末冶金齿轮-粉末冶金零件厂家-东莞市正朗精密金属零件有限公司 | 沧州友城管业有限公司-内外涂塑钢管-大口径螺旋钢管-涂塑螺旋管-保温钢管生产厂家 | 哈希余氯测定仪,分光光度计,ph在线监测仪,浊度测定仪,试剂-上海京灿精密机械有限公司 | 杭州中策电线|中策电缆|中策电线|杭州中策电缆|杭州中策电缆永通集团有限公司 | 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 | 深圳法律咨询【24小时在线】深圳律师咨询免费 |