企業(yè)管理培訓(xùn)分類導(dǎo)航
企業(yè)管理培訓(xùn)公開課計劃
企業(yè)培訓(xùn)公開課日歷
2025年
2024年
職業(yè)技能培訓(xùn)公開課
職業(yè)技能培訓(xùn)內(nèi)訓(xùn)課程
熱門企業(yè)管理培訓(xùn)關(guān)鍵字
您所在的位置:名課堂>>公開課>>職業(yè)技能培訓(xùn)公開課
Spark大數(shù)據(jù)挖掘工具Mllib實戰(zhàn)(機器學(xué)習(xí))
【課程編號】:MKT028424
Spark大數(shù)據(jù)挖掘工具Mllib實戰(zhàn)(機器學(xué)習(xí))
【課件下載】:點擊下載課程綱要Word版
【所屬類別】:職業(yè)技能培訓(xùn)
【時間安排】:2025年02月18日 到 2025年02月19日5500元/人
2024年03月05日 到 2024年03月06日5500元/人
【授課城市】:北京
【課程說明】:如有需求,我們可以提供Spark大數(shù)據(jù)挖掘工具Mllib實戰(zhàn)(機器學(xué)習(xí))相關(guān)內(nèi)訓(xùn)
【課程關(guān)鍵字】:北京大數(shù)據(jù)挖掘培訓(xùn)
我要報名
咨詢電話: | |
手 機: | 郵箱: |
課程介紹
隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)切實地迎來了一個大數(shù)據(jù)的時代。大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合,對大數(shù)據(jù)的實時分析已經(jīng)成為一個非常重要且緊迫的需求。目前對大數(shù)據(jù)的實時分析工具,業(yè)界公認最佳為Spark。Spark是一個開源集群運算框架,最初是由加州大學(xué)柏克利分校AMPLab所開發(fā),Spark使用了內(nèi)存內(nèi)運算技術(shù),在內(nèi)存上的運算速度比Hadoop MapReduce的運算速度快上100倍,即便是在磁盤上運行也能快10倍。
為解決廣大系統(tǒng)設(shè)計人員深入研究與開發(fā)大數(shù)據(jù)挖掘和實時分析的需要,培訓(xùn)中心特舉辦“Spark大數(shù)據(jù)挖掘工具MLlib實戰(zhàn)”培訓(xùn)班,本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴展的分布式計算框架,實現(xiàn)了常用的機器學(xué)習(xí),如:聚類、分類、回歸等算法。講解各個算法的理論、詳細展示Spark源碼實現(xiàn),最后均會通過實例進行解析實戰(zhàn),幫助大家真正從理論到實踐全面掌握Spark MLlib分布式機器學(xué)習(xí)和大數(shù)據(jù)挖掘方法
培訓(xùn)對象
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員。
2,牽涉到大數(shù)據(jù)實時處理的數(shù)據(jù)中心運行、規(guī)劃、設(shè)計負責(zé)人。
3,政府機關(guān),金融保險、移動和互聯(lián)網(wǎng)等大數(shù)據(jù)來源單位的負責(zé)人。
4,高校、科研院所牽涉到大數(shù)據(jù)與分布式數(shù)據(jù)處理的項目負責(zé)人。
課程目標(biāo)
1, 全面了解大數(shù)據(jù)實時處理技術(shù)的相關(guān)知識。
2,學(xué)習(xí)Spark的核心技術(shù)方法以及應(yīng)用特征。
3,深入使用MLLib在大數(shù)據(jù)挖掘和實時分析中的使用。
4,掌握MLlib相關(guān)機器學(xué)習(xí)和數(shù)據(jù)挖掘工具的使用。
課程大綱
第一講 Spark大數(shù)據(jù)實時處理技術(shù)
1)大數(shù)據(jù)處理技術(shù)
2)Spark實時處理技術(shù)
3)Spark生態(tài)系統(tǒng)BDAS
4)Spark架構(gòu)分析
第二講 Spark安裝配置及監(jiān)控
1)Ubuntu環(huán)境的準(zhǔn)備
2)Hadoop2.X和Scala
3)搭建Spark開發(fā)環(huán)境
4)Idea編譯和運行
5)Spark監(jiān)控管理
第3講 Scala編程語言和分布式計算模型
1) Scala編程語言
2) 操作基本數(shù)據(jù)類型
3)Spark計算模型和RDD
4)Transformation及Actions算子
5)Spark MLlib矩陣向量
第四講 Spark MLlib線性回歸和邏輯回歸算法
1)線性回歸算法
2)線性回歸代碼實例
3)邏輯回歸算法
4)邏輯回歸回歸代碼實例
5)線性回歸和邏輯回歸代碼實操
第五講 Spark MLlib貝葉斯分類算法
1) 貝葉斯分類算法原理
2) Spark貝葉斯分類源碼
3) Spark貝葉斯分類代碼示例
4) 貝葉斯分類代碼實操
第六講 Spark MLlib決策樹算法
1) 決策樹算法原理
2) Spark決策樹算法源碼
3) Spark決策樹算法代碼示例
4) 決策樹代碼實操
第七講 Spark MLlib聚類算法
1) K-Means聚類算法原理
2) Spark K-Means聚類算法源碼
3) SparkK-Means聚類代碼示例
4) 聚類算法代碼實操
第八講 Spark MLlib關(guān)聯(lián)規(guī)則算法
1) FPGrowth關(guān)聯(lián)規(guī)則算法原理
2) FPGrowth關(guān)聯(lián)規(guī)則算法源碼
3) FPGrowth關(guān)聯(lián)規(guī)則代碼示例
4) 關(guān)聯(lián)規(guī)則代碼實操
第九講 Spark MLlib個性化推薦算法
1) 協(xié)同過濾推薦算法原理
2) Spark協(xié)同過濾推薦源碼
3) Spark協(xié)同過濾推薦代碼示例
4) 推薦代碼實操
第十講 Spark MLlib神經(jīng)網(wǎng)絡(luò)算法
1) 神經(jīng)網(wǎng)絡(luò)算法原理
2) Spark神經(jīng)網(wǎng)絡(luò)算法源碼
3) Spark神經(jīng)網(wǎng)絡(luò)代碼示例
4) 神經(jīng)網(wǎng)絡(luò)代碼實操
楊老師
由業(yè)界知名大數(shù)據(jù)專家親自授課:
楊老師 主要研究網(wǎng)絡(luò)信息分析以及云計算相關(guān)技術(shù),長期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發(fā)經(jīng)驗。