企业管理培训,亚洲伦理精品,企业培训公开课,亚洲伦理电影,企业内训课程,亚洲伦理,企业培训师 - 名课堂企业管理培训网

名課堂 - 企業管理培訓網聯系方式

聯系電話:400-8228-121

值班手機:18971071887

Email:Service@mingketang.com

企業管理培訓分類導航

企業管理培訓公開課計劃

企業培訓公開課日歷

職業技能培訓公開課

職業技能培訓內訓課程

熱門企業管理培訓關鍵字

您所在的位置:名課堂>>公開課>>職業技能培訓公開課

基于Python的Spark大數據挖掘技術

【課程編號】:MKT035435

【課程名稱】:

基于Python的Spark大數據挖掘技術

【課件下載】:點擊下載課程綱要Word版

【所屬類別】:職業技能培訓

【時間安排】:2025年07月15日 到 2025年07月17日5800元/人

2024年07月30日 到 2024年08月01日5800元/人

2023年12月27日 到 2023年12月29日5800元/人

【授課城市】:北京

【課程說明】:如有需求,我們可以提供基于Python的Spark大數據挖掘技術相關內訓

【其它城市安排】:上海

【課程關鍵字】:北京大數據分析培訓,北京大數據挖掘培訓

我要報名

咨詢電話:
手  機: 郵箱:
課程介紹

Python是數據分析最常用的語言之一,而Apache Spark是一個開源的強大的分布式查詢和處理引擎。本培訓用詳盡的案例介紹如何使用Python來調用Spark的新特性,如何處理結構化和非結構化的數據,如何使用PySpark中一些基本的可用數據類型,如何生成機器學習模型、操作圖像、閱讀串流數據以及在云上部署模型。

本培訓結合實例來介紹PySpark大數據挖掘。內容包括對Apache Spark基礎知識介紹,彈性分布式數據集RDD的內部運行方式講解,分析利用DataFrame加速PySpark,準備數據建模,檢查重復數據及異常數據,分析描述性統計、數據相關性,介紹MLlib數據挖掘工具應用,講解ML機器學習包功能,使用Blaze實現持久化,講解Tensorflow基礎,分析結構化流Streaming,以及打包Spark應用程序,提交作業和監控執行等。

本培訓將合實例,對Python和Spark進行講解,通過實際操作,了解云環境下,大數據處理、數據探索的基本方法。

培訓對象

1,對大數據的前沿技術非常感興趣的人。

2,有志于成為一名數據科學家的從業人員。

3,有一定算法和編程基礎的技術愛好者。

培訓目標

1, 學習Python和Spark的相關基礎知識。

2,學習Python和Spark的核心技術方法及應用。

3,了解Python和Spark在數據分析中的使用。

培訓內容

第一講 Spark基礎知識

1)什么是Apache Spark

2)Spark作業和API

3)DataFrame和Dataset

4)Spark 2.0的架構

5)SparkSession介紹

6)Tungsten Phase 2

7)結構化流

第二講 彈性分布式數據集

1)RDD的內部運行方式

2)創建RDD

3)全局作用域和局部作用域

4)RDD轉換

5)RDD操作

第三講 利用DataFrame加速PySpark

1)Python到RDD之間的通信

2)Catalyst優化器刷新

3)創建DataFrame

4)RDD的交互操作

5)利用DataFrame API查詢

6)利用SQL查詢

7)DataFrame應用實例

第四講 準備數據建模

1)檢查重復數據及異常數據

2)描述性統計

3)數據相關性

4)數據可視化

5)直方圖

第五講 MLlib數據挖掘工具

1)MLlib包概述

2)加載和轉換數據

3)數據相關性和描述性統計

4)創建最終數據集

5)MLlib應用實例-預測嬰兒生存機會

第六講 ML機器學習包

1)ML包的概述

2)分類、回歸和聚類

3)使用ML預測嬰兒生存率

4)ML超參調優

5)ML的特征提取

6)ML的其他功能

第七講 使用Blaze實現持久化

1)安裝Blaze

2)混合持久化

3)使用NumPy和pandas數據

4)與關系型數據庫進行交互

5)數據操作和訪問

6)數據連接

第八講 Tensorflow基礎

1)神經網絡和深度學習

2)TensorFlow介紹和安裝

3)配置和設置TensorFlow

4)使用TensorFlow進行矩陣分析

5)TensorFlow操作示例

第九講 結構化流Streaming

1)Streaming介紹

2)Streaming的基本組件

3)Streaming應用程序數據流

4)用DStream簡化Streaming應用程序

5)全局聚合

6)結構化流介紹

第十講 打包Spark應用程序

1)spark-submit命令

2)以編程方式部署應用程序

3)配置你的SparkSession

4)創建SparkSession

5)模塊化代碼

6)提交作業和監控執行

楊老師

主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。

我要報名

在線報名:基于Python的Spark大數據挖掘技術(北京)

主站蜘蛛池模板: 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 茶叶百科网-茶叶知识与茶文化探讨分享平台| 华溶溶出仪-Memmert稳定箱-上海协烁仪器科技有限公司 | POS机办理_个人POS机免费领取 - 银联POS机申请首页 | 磷酸肌酸二钠盐,肌酐磷酰氯-沾化欣瑞康生物科技 | 一体化污水处理设备-一体化净水设备-「山东梦之洁水处理」 | 东莞螺丝|东莞螺丝厂|东莞不锈钢螺丝|东莞组合螺丝|东莞精密螺丝厂家-东莞利浩五金专业紧固件厂家 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 智能汉显全自动量热仪_微机全自动胶质层指数测定仪-鹤壁市科达仪器仪表有限公司 | 钢托盘,铁托盘,钢制托盘,镀锌托盘,饲料托盘,钢托盘制造商-南京飞天金属13260753852 | 协议书_协议合同格式模板范本大全| 热处理炉-退火炉-回火炉设备厂家-丹阳市电炉厂有限公司 | 科昊仪器超纯水机系统-可成气相液氮罐-美菱超低温冰箱-西安昊兴生物科技有限公司 | 三氯异氰尿酸-二氯-三氯-二氯异氰尿酸钠-优氯净-强氯精-消毒片-济南中北_优氯净厂家 | 无线联网门锁|校园联网门锁|学校智能门锁|公租房智能门锁|保障房管理系统-KEENZY中科易安 | 泰安塞纳春天装饰公司【网站】 | 一体式钢筋扫描仪-楼板测厚仪-裂缝检测仪-泰仕特(北京) | EPDM密封胶条-EPDM密封垫片-EPDM生产厂家 | 志高装潢官网-苏州老房旧房装修改造-二手房装修翻新 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | 淘趣英语网 - 在线英语学习,零基础英语学习网站 | 热闷罐-高温罐-钢渣热闷罐-山东鑫泰鑫智能热闷罐厂家 | 无锡网站建设-做网站-建网站-网页设计制作-阿凡达建站公司 | 成都租车_成都租车公司_成都租车网_众行宝 | 酒店品牌设计-酒店vi设计-酒店标识设计【国际级】VI策划公司 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 专业深孔加工_东莞深孔钻加工_东莞深孔钻_东莞深孔加工_模具深孔钻加工厂-东莞市超耀实业有限公司 | 两头忙,井下装载机,伸缩臂装载机,30装载机/铲车,50装载机/铲车厂家_价格-莱州巨浪机械有限公司 | 氮化镓芯片-碳化硅二极管 - 华燊泰半导体 | 软膜天花_软膜灯箱_首选乐创品牌_一站式天花软膜材料供应商! | SOUNDWELL 编码器|电位器|旋转编码器|可调电位器|编码开关厂家-广东升威电子制品有限公司 | 深圳离婚律师咨询「在线免费」华荣深圳婚姻律师事务所专办离婚纠纷案件 | 天坛家具官网| 塑胶跑道_学校塑胶跑道_塑胶球场_运动场材料厂家_中国塑胶跑道十大生产厂家_混合型塑胶跑道_透气型塑胶跑道-广东绿晨体育设施有限公司 | 温州食堂承包 - 温州市尚膳餐饮管理有限公司 | 上海公众号开发-公众号代运营公司-做公众号的公司企业服务商-咏熠软件 | 飞扬动力官网-广告公司管理软件,广告公司管理系统,喷绘写真条幅制作管理软件,广告公司ERP系统 | 电磁辐射仪-电磁辐射检测仪-pm2.5检测仪-多功能射线检测仪-上海何亦仪器仪表有限公司 | 细沙回收机-尾矿干排脱水筛设备-泥石分离机-建筑垃圾分拣机厂家-青州冠诚重工机械有限公司 | 变频器维修公司_plc维修_伺服驱动器维修_工控机维修 - 夫唯科技 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 迪威娱乐|迪威娱乐客服|18183620002 |