5G&新技術(shù)
培訓(xùn)搜索引擎
數(shù)據(jù)分析培訓(xùn)班
數(shù)據(jù)分析培訓(xùn)班內(nèi)訓(xùn)基本信息:
數(shù)據(jù)分析培訓(xùn)班(6門課程,共18天)
(1)培訓(xùn)背景
隨著互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等科技的快速發(fā)展,經(jīng)濟發(fā)展已經(jīng)進入全球化時代,企業(yè)的命運與國際經(jīng)濟環(huán)境緊密聯(lián)系,如美國的經(jīng)濟危機會波及到全球各個國家與地區(qū)和企業(yè),國家和企業(yè)已經(jīng)不是孤立的存在。在經(jīng)濟全球化時代商業(yè)環(huán)境極其復(fù)雜,不僅要考慮國內(nèi)、國外經(jīng)濟環(huán)境,同時還要考慮不同國家的國家政策,不同民族的民族文化,不同宗教的宗教信仰等,更加加深入了商業(yè)環(huán)境的復(fù)雜程度。在極其復(fù)雜的國際商業(yè)環(huán)境中,作為大型企業(yè)領(lǐng)導(dǎo)者僅憑經(jīng)驗與智慧無法全面了解與掌控企業(yè)、了解國際化的商業(yè)環(huán)境,因此很難做出正確的企業(yè)戰(zhàn)略決策,甚至更無法做到企業(yè)精細化管理,更不可能做到高效運營,那么,如何突破因商業(yè)環(huán)境復(fù)雜度而導(dǎo)致的企業(yè)失控呢?并在復(fù)雜的商業(yè)競爭環(huán)境中脫穎而出并獲得最大利潤呢?答案是掌握企業(yè)數(shù)據(jù)和掌握國際化數(shù)據(jù),并建立高效的數(shù)據(jù)分析體系,探索數(shù)據(jù)、挖掘數(shù)據(jù)高效準(zhǔn)確的獲取國際化的經(jīng)濟環(huán)境狀況,洞察市場趨勢提前做出有利于企業(yè)的戰(zhàn)略決策,提高企業(yè)競爭力,規(guī)避市場風(fēng)險,數(shù)據(jù)分析則是提升企業(yè)管理水平,實現(xiàn)上述目標(biāo)的一種行之有效的方法。國際化的競爭就是信息的國際化競爭。隨著大數(shù)據(jù)、人工智能的快速發(fā)展,數(shù)據(jù)的價值越發(fā)突顯,并為海量的高并發(fā)的數(shù)據(jù)分析提供了新的工具與可行性,較以往的傳統(tǒng)數(shù)據(jù)分析工具更為有效,甚至傳統(tǒng)數(shù)據(jù)分析工具做不到的,大數(shù)據(jù)、人工智能都能做到。因此不僅僅企業(yè),社會各個方面也因大數(shù)據(jù)的價值而提高了對數(shù)據(jù)的關(guān)注程度,也加大了數(shù)據(jù)分析的投入力度。無論是企業(yè)管理、戰(zhàn)略決策、精準(zhǔn)營銷、精細化管理等都無處不體現(xiàn)著數(shù)據(jù)分析的重要性。
數(shù)據(jù)如此重要,如何建設(shè)一個高效的數(shù)據(jù)分析體系呢?至少要具備以下兩個條件:一是在宏觀層面上正確理解數(shù)據(jù)分析;二是豐富的IT系統(tǒng)建設(shè)經(jīng)驗、分布式技術(shù)和較強的數(shù)據(jù)技術(shù)能力。第一點尤為重要,因為一旦在思想和認識層面對數(shù)據(jù)分析體系理解有誤,那么即使精通于各種技術(shù)方案,所建立起來的也只是一堆技術(shù)架構(gòu)的粗糙堆砌,雖然也能達到部分?jǐn)?shù)據(jù)分析的效果,但必定會事倍功半。
(2)培訓(xùn)目標(biāo)
本次數(shù)據(jù)分析技術(shù)培訓(xùn)課程,整個課程體系設(shè)計完備,思路清晰,學(xué)員通過本次課程的系統(tǒng)性學(xué)習(xí)可以掌握如下技能:1) 了解數(shù)據(jù)分析的基礎(chǔ)知識及基本理論;
2) 結(jié)合Python語言學(xué)會數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理。掌握大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容;
3) 結(jié)合Python語言掌握數(shù)據(jù)分析與挖掘基礎(chǔ)。學(xué)習(xí)常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析。
4) 學(xué)習(xí)數(shù)據(jù)分析工具Python語言的數(shù)據(jù)分析實戰(zhàn)。
5) 掌握結(jié)構(gòu)化數(shù)據(jù)工具SQL的應(yīng)用及相關(guān)知識。
6) 學(xué)習(xí)大數(shù)據(jù)可視化技術(shù)。包括數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點概述,數(shù)據(jù)挖掘與可視化工具介紹(Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
7) 學(xué)習(xí)Python與數(shù)據(jù)分析實戰(zhàn)。包括Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機器學(xué)習(xí),Python數(shù)據(jù)分析案例分享等內(nèi)容。
(3)教學(xué)計劃
本系列課程總共由6門課程組成:教學(xué)設(shè)計 | NO. | 課程名稱 | 課程天數(shù) |
基礎(chǔ)理論 | 1 | 概率論與數(shù)理統(tǒng)計 | 1天 |
SQL語法基礎(chǔ)及進階 | 2 | 數(shù)據(jù)分析與挖掘基礎(chǔ) | 2天 |
Python入門 | 3 | Python環(huán)境準(zhǔn)備及相關(guān)數(shù)據(jù)分析庫(pandas、numpy、matplotlib、scipy)的安裝及應(yīng)用 | 2天 |
4 | Python語言基礎(chǔ)知識 | 1天 | |
5 | 正則表達式及Python編程 | 1天 | |
Python與數(shù)據(jù)分析實戰(zhàn) | 6 | 數(shù)據(jù)采集 | 1天 |
7 | 數(shù)據(jù)分析 | 4天 | |
8 | 爬蟲技術(shù)與實踐 | 4天 | |
數(shù)據(jù)可視化 | 9 | 大數(shù)據(jù)可視化 | 2天 |
(4)具體課程方案(含課程大綱)
課程1:概率論與數(shù)理統(tǒng)計-1天
【匹配關(guān)鍵知識點】課程目標(biāo)1:建立必要的概率論與數(shù)理統(tǒng)計基本知識素養(yǎng),掌握探索隨機現(xiàn)象統(tǒng)計規(guī)律的一般方法。
課程目標(biāo)2:掌握概率論與數(shù)理統(tǒng)計的基本概念、基本理論、基本方法和運算技能。包括概率論的基本概念、隨機變量、多維隨機變量、隨機變量的數(shù)字特征、數(shù)理統(tǒng)計的基本概念、參數(shù)估計等相關(guān)知識。熟悉數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)推斷的各種基本方法。
課程目標(biāo)3:掌握處理隨機現(xiàn)象的基本思想和方法,培養(yǎng)抽象概括、推理論證、嚴(yán)密的邏輯思維能力,以及使用概率論與數(shù)理統(tǒng)計的方法去分析和解決有關(guān)實際問題的能力。
【課程時間】
1天(8小時/天)
【課程簡介】
通過本課程的學(xué)習(xí),應(yīng)掌握概率論與數(shù)理統(tǒng)計的基本概念,了解它的基本理論和方法,從而使學(xué)生初步掌握處理隨機現(xiàn)象的基本思想和方法,培養(yǎng)學(xué)生運用概率統(tǒng)計方法分析和解決實際問題的能力,并且在知識傳授的同時起到價值引領(lǐng)的作用,積極培育和踐行社會主義核心價值觀,培養(yǎng)學(xué)生科學(xué)、嚴(yán)謹(jǐn)?shù)乃季S能力。
【課程特點】
教學(xué)中以課堂講授為主,以討論為輔。采用啟發(fā)式教學(xué)法,適當(dāng)運用討論式教學(xué)法。融入聯(lián)系應(yīng)用的案例式教學(xué)法,并倡導(dǎo)利用結(jié)合軟件技術(shù)解決實際問題的實驗式教學(xué)法。恰當(dāng)使用多媒體教學(xué)與傳統(tǒng)教學(xué)相結(jié)合的教學(xué)手段,充分運用教師對學(xué)生講授與學(xué)生間自由討論相結(jié)合、傳統(tǒng)解題訓(xùn)練與開放型問題探索相結(jié)合、以及實體課堂面對面交流與虛擬課堂數(shù)字信息交流相結(jié)合的交互式教學(xué)手段,合理利用網(wǎng)絡(luò)資源實施開放性教學(xué)手段,采用規(guī)范統(tǒng)考與多樣化考查相結(jié)合的考核手段。
【課程大綱】(1天*8小時)
時間 | 內(nèi)容 | 案例實踐與練習(xí) |
Day1 數(shù)據(jù)分析概述 |
1面向小白的統(tǒng)計學(xué):描述性統(tǒng)計(均值,中位數(shù),眾數(shù),方差,標(biāo)準(zhǔn)差,與常見的統(tǒng)計圖表) 2概率的基本概念(方差、分位數(shù)、隨機試驗、樣本空間、事件、頻率、概率、排列組合),古典概型 3條件概率與貝葉斯公式,獨立性 4微積分:隨機變量及其分布(二項分布,均勻分布,正態(tài)分布) 5多維隨機變量及其分布 6隨機變量的期望,方差與協(xié)方差 7大數(shù)定律、中心極限定理與抽樣分布 8從抽樣推測規(guī)律之一:點估計與區(qū)間估計 9從抽樣推測規(guī)律之二:參數(shù)估計 10基于正態(tài)總體的假設(shè)檢驗 11秩和檢驗 12預(yù)測未來的技術(shù):回歸分析 13時間序列分析 |
案例練習(xí): 研討: |
課程3:數(shù)據(jù)分析與挖掘基礎(chǔ)-6天
【匹配關(guān)鍵知識點】常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
【課程時間】
6天(8小時/天)
【課程簡介】
隨著大數(shù)據(jù)時代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,數(shù)據(jù)分析、數(shù)據(jù)建模、數(shù)據(jù)挖掘、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等重要性越發(fā)突出,本課程是針對大數(shù)據(jù)時代的特點,尹老師總結(jié)多年數(shù)據(jù)分析經(jīng)驗,而精心設(shè)計的課程,課程內(nèi)容涵蓋了數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計分析、數(shù)據(jù)挖掘、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等內(nèi)容,以及人工智能的應(yīng)用范圍、發(fā)展前景剖析。
【課程收益】
1、常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述;
2、描述型數(shù)據(jù)分析;
3、常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等。
【課程特點】
常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
【課程對象】
數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
希望加強數(shù)據(jù)分析能力的軟件開發(fā)人員
系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
具有2年以IT部門工作經(jīng)驗,將負責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(6天*8小時)
時間 | 內(nèi)容 | 案例實踐與練習(xí) |
Day1 常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述 |
1、 數(shù)據(jù)分析與建模的概念 2、 數(shù)據(jù)分析與建模過程 3、 數(shù)據(jù)分析模型開發(fā)過程 4、 數(shù)據(jù)建模概述 5、 機器學(xué)習(xí)概念 6、 機器學(xué)習(xí)算法剖析 7、 算法庫分類 8、 算法庫 9、 深度學(xué)習(xí) 10、 神經(jīng)網(wǎng)絡(luò) 11、 人工智能 12、 商業(yè)智能 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:數(shù)據(jù)分析的過程 |
Day2 描述型數(shù)據(jù)分析 |
1、 統(tǒng)計學(xué)基本概念 2、 統(tǒng)計數(shù)據(jù)的計量尺度 3、 常用基本統(tǒng)計量 4、 集中趨勢的描述指標(biāo) 5、 離散趨勢的描述指標(biāo) 6、 中心極限定理 7、 大數(shù)定律 8、 數(shù)據(jù)的分布 9、 正態(tài)分布的特征 10、 偏度和峰度 11、 檢測數(shù)據(jù)集的分布 12、 數(shù)據(jù)的分布擬合檢驗與正態(tài)性檢驗 13、 抽樣標(biāo)準(zhǔn) 14、 假設(shè)檢驗 15、 T檢驗 16、 置信區(qū)間 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:描述性數(shù)據(jù)分析 |
Day3 常見數(shù)據(jù)分析與挖掘算法 |
1、 數(shù)據(jù)挖掘的基本任務(wù) 2、 數(shù)據(jù)挖掘建模過程 a) 定義挖掘目標(biāo) b) 數(shù)據(jù)取樣 c) 數(shù)據(jù)探索 d) 數(shù)據(jù)預(yù)處理 e) 挖掘建模 f) 建立模型 g) 業(yè)務(wù)理解 h) 模型擬合 i) 訓(xùn)練集 j) 測試集 k) 模型評價 3、 常用的數(shù)學(xué)預(yù)測模型 a) 線性回歸 b) 回歸(預(yù)測)與分類 c) 決策樹與隨機森林 d) 聚類分析(kmeans) e) 關(guān)聯(lián)規(guī)則 f) 時序模式 g) 離群點檢測 h) 深度學(xué)習(xí) i) 人工智能 j) 神經(jīng)網(wǎng)絡(luò) 4、 案例:如何從數(shù)據(jù)中挖掘出有價值的信息 |
案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:常用數(shù)據(jù)分析方法與算法 |
Day4 樸素貝葉斯與回歸分析 |
第1個主題: 主成分分析和因子分析(深入剖析主成分分析及因子分析) 1、 主成分分析 2、 總體主成分 3、 樣本主成分 4、 主成分分析模型 5、 案例:主成分分析模型實現(xiàn) 6、 課堂實操:主成分分析模型實現(xiàn) 第2個主題: 方差分析(深入剖析方差分析方法及實現(xiàn)) 1、 單因素方差分析 2、 單因素方差分析模型 3、 因素效應(yīng)的顯著性檢驗 4、 因素各水平均值的估計與比較 5、 兩因素等重復(fù)試驗下的方差分析 6、 統(tǒng)計模型 7、 交互效應(yīng)及因素效應(yīng)的顯著性檢驗 8、 無交互效應(yīng)時各因素均值的估計與比較 9、 有交互效應(yīng)時因素各水平組合上的均值估計與比較 10、 兩因素非重復(fù)試驗下的方差分析 11、 金融案例:方差分析實現(xiàn) 12、 課堂實操:方差分析實現(xiàn) 第3個主題: Bayes統(tǒng)計分析(深入剖析Bayes統(tǒng)計分析) 1、 Baves統(tǒng)計模型 2、 Bayes統(tǒng)計分析的基本思想 3、 Bayes統(tǒng)計模型 4、 Bayes統(tǒng)計推斷原則 5、 先驗分布的Bayes假設(shè)與不變先驗分布 6、 共軛先驗分布 7、 先驗分布中超參數(shù)的確定 8、 Baves統(tǒng)計推斷 9、 參數(shù)的Bayes點估計 10、 Bayes區(qū)間估計 11、 Bayes假設(shè)檢驗 12、 案例:實現(xiàn)Bayes統(tǒng)計分析建模 13、 課堂實操:實現(xiàn)Bayes統(tǒng)計分析建模 第4個主題: 數(shù)學(xué)建模(深入剖析數(shù)學(xué)建模) 1、 數(shù)學(xué)建模 2、 數(shù)學(xué)預(yù)測模型 3、 模型評估 4、 模型參數(shù)優(yōu)化 第5個主題: 回歸分析與分類分析原理與應(yīng)用(深入剖析數(shù)據(jù)的回歸分析與分類分析的原理以及應(yīng)用) 1、 回歸與分類 2、 回歸分析概念 3、 線性回歸模型及其參數(shù)估計 4、 一元線性回歸 5、 一元線性回歸模型 6、 一元線性回歸模型求解參數(shù) 7、 損失函數(shù) 8、 求偏導(dǎo) 9、 回歸方程的顯著性檢驗 10、 殘差分析 11、 誤差項的正態(tài)性檢驗 12、 殘差圖分析 13、 統(tǒng)計推斷與預(yù)測 14、 回歸模型的選取 15、 窮舉法 16、 逐步回歸法 17、 嶺回歸分析 18、 一元線性回歸 19、 金融案例:一元線性回歸模型檢驗 20、 多元線性回歸概述 21、 多元線性回歸模型 22、 金融案例:多元線性回歸實現(xiàn)航空業(yè)信用打分和評級模型 第6個主題: Logistic回歸分析(剖析Logistic回歸與其它回歸分析方法) 1、 Logistic回歸介紹 2、 Logistic函數(shù) 3、 Logistic回歸模型 4、 案例:SPSS Logistic回歸實現(xiàn) 5、 課堂實操: Logistic回歸實現(xiàn)航空業(yè)欺詐預(yù)測模型 6、 課堂實操: Logistic回歸實現(xiàn)航空業(yè)風(fēng)險分析模型 第7個主題: 非線性回歸原理及應(yīng)用(剖析非線性回歸原理及應(yīng)用實踐) 1、 非線性回歸 2、 雙曲線函數(shù) 3、 冪函數(shù) 4、 指數(shù)函數(shù) 5、 對數(shù)函數(shù) 6、 S型曲線 7、 案例:非線性回歸實現(xiàn) 8、 課堂實操:非線性回歸實現(xiàn)航空業(yè)經(jīng)營分析和績效分析模型 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:主成分分析模型實現(xiàn) |
Day5 聚類分析與關(guān)聯(lián)規(guī)則挖掘 |
第1個主題: 數(shù)據(jù)建模常用距離(深入剖析數(shù)據(jù)建模過程中常用的距離模型) 1、 數(shù)據(jù)挖掘常用距離 2、 歐氏距離 3、 曼哈頓距離 4、 切比雪夫距離 5、 閔可夫斯基距離 6、 標(biāo)準(zhǔn)化歐氏距離 7、 馬氏距離 8、 夾角余弦 9、 漢明距離 10、 杰卡德距離& 杰卡德相似系數(shù) 11、 相關(guān)系數(shù)& 相關(guān)距離 12、 信息熵 第2個主題: 聚類分析與建模實現(xiàn)(深入剖析聚類分析以及通過SPSS聚類算法模型分析數(shù)據(jù)) 1、 聚類分析 2、 聚類算法 3、 樣品間相近性的度量 4、 快速聚類法 5、 快速聚類法的步驟 6、 用Lm距離進行快速聚類 7、 譜系聚類法 8、 類間距離及其遞推公式 9、 譜系聚類法的步驟 10、 變量聚類 11、 案例:SPSS聚類實現(xiàn)及繪圖 12、 案例:Kmeans應(yīng)用案例剖析 13、 課堂實操:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析 第3個主題: 關(guān)聯(lián)規(guī)則分析與實現(xiàn)(深入剖析關(guān)聯(lián)規(guī)則分析以及通過SPSS關(guān)聯(lián)規(guī)則算法模型分析數(shù)據(jù)) 1、 關(guān)聯(lián)規(guī)則 2、 支持度與置信度 3、 關(guān)聯(lián)規(guī)則挖掘的過程 4、 Apriori算法 5、 關(guān)聯(lián)規(guī)則案例 6、 支持度與置信度計算 7、 案例:SPSS實現(xiàn)關(guān)聯(lián)規(guī)則 8、 課堂實操:SPSS實現(xiàn)航空業(yè)數(shù)據(jù)關(guān)聯(lián)規(guī)則分析 |
案例練習(xí):通過編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析 |
Day6 決策樹與隨機森林 |
第1個主題: 決策樹分析與實現(xiàn)(深入剖析決策樹分析以及通過SPSS決策樹模型分析數(shù)據(jù)) 1、 決策樹分析 2、 決策樹 3、 決策樹構(gòu)成要素 4、 決策樹算法原理 5、 決策樹法的決策過程 6、 決策樹算法 7、 案例:實現(xiàn)決策樹分析 8、 課堂實操:實現(xiàn)航空業(yè)客戶細分模型 9、 隨機森林 第2個主題: 數(shù)據(jù)建模時序模式分析與實現(xiàn)(深入剖析時序模式分析) 1、 時序模式 2、 時間序列分析 3、 時間序列分析 4、 時間序列 5、 序列分析的三個階段 6、 課堂實操:實現(xiàn)航空業(yè)客戶流失模型 |
案例練習(xí):通過實現(xiàn)航空業(yè)客戶細分模型案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:實現(xiàn)航空業(yè)客戶細分模型 |
課程8:大數(shù)據(jù)可視化-2天
【匹配關(guān)鍵知識點】數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
【課程時間】
2天(8小時/天)
【課程簡介】
隨著互聯(lián)網(wǎng)、移動智能設(shè)備、云計算技術(shù)、大數(shù)據(jù)技術(shù)的迅猛發(fā)展,使人類產(chǎn)生與獲取數(shù)據(jù)的能力成數(shù)量級地增加,面對如此浩瀚的數(shù)據(jù)海洋,想通過人工分析大數(shù)據(jù)從而得到大數(shù)據(jù)中隱含的有價值的模式,幾乎是不可能的。因此人們需要借助新的技術(shù)挖掘大數(shù)據(jù)中所蘊含的價值,采用數(shù)據(jù)可視化技術(shù)絕對是一個明智的選擇。
隨著科學(xué)技術(shù)的不斷發(fā)展,大量的由計算機產(chǎn)生的中間數(shù)據(jù)都需要進行可視化處理,以求達到輔助分析、再現(xiàn)客觀事實的目的。通過視覺化呈現(xiàn)數(shù)據(jù),可揭示了令人驚奇的模式和觀察結(jié)果,某些數(shù)據(jù)是不可能通過簡單統(tǒng)計就能顯而易見的看到的模式和結(jié)論。正如作家、記者和信息設(shè)計師David McCandless 在TED 上說道:“通過視覺化,我們把信息變成了一道可用眼睛來探索的風(fēng)景線,一種信息地圖。當(dāng)你在迷失在信息中時,信息地圖非常實用”。由此足見數(shù)據(jù)可視化的價值。
無論獲得信息還是表達信息,最佳方式之一是通過視覺化方式,快速捕捉和展現(xiàn)信息要點與核心要義,這是數(shù)據(jù)可視化的價值點所在。
數(shù)據(jù)可視化技術(shù)有著廣闊的發(fā)展和應(yīng)用空間,越來越受到人們的關(guān)注。
【課程收益】
1、數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點概述;
2、數(shù)據(jù)挖掘與可視化工具介紹;
3、可視化案例分享
【課程特點】
數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
【課程對象】
數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
希望加強數(shù)據(jù)分析能力的軟件開發(fā)人員
系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
具有2年以IT部門工作經(jīng)驗,將負責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(2天*8小時)
時間 | 內(nèi)容 | 案例實踐與練習(xí) |
Day1 數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點概述 |
第1個主題: 數(shù)據(jù)可視化問題剖析(深入大數(shù)據(jù)時代數(shù)據(jù)可視化存在的問題) 1、 大數(shù)據(jù)特征vs數(shù)據(jù)可視化 2、 傳統(tǒng)數(shù)據(jù)可視化問題剖析 3、 傳統(tǒng)數(shù)據(jù)可視化工具特點剖析 第2個主題: 數(shù)據(jù)可視化概述(介紹數(shù)據(jù)可視化工具、特征及基礎(chǔ)架構(gòu)) 1、 數(shù)據(jù)可視化概念 2、 數(shù)據(jù)可視化作用 3、 數(shù)據(jù)可視化目標(biāo) 4、 數(shù)據(jù)可視化應(yīng)用 5、 數(shù)據(jù)維度和指標(biāo) 6、 圖表產(chǎn)生過程 7、 可視化的表現(xiàn)形式 8、 可視化的顯示 9、 可視化的色彩 10、 可視化案例實戰(zhàn):儀表盤制作 11、 標(biāo)準(zhǔn)圖表的表現(xiàn)能力 12、 標(biāo)準(zhǔn)圖表的選擇標(biāo)準(zhǔn) 13、 圖表制作原則 14、 可視化案例實戰(zhàn):數(shù)據(jù)占比柏拉圖繪制 15、 可視化的決定性因素 16、 數(shù)據(jù)可視化技巧 17、 數(shù)據(jù)化可視化工具 18、 創(chuàng)意性數(shù)據(jù)可視化 19、 虛擬實現(xiàn)技術(shù) 20、 防止過度可視化 21、 一圖勝千言 22、 可視化的升華:聲音 第3個主題: 可視化的探索性分析和數(shù)據(jù)挖掘工具(學(xué)習(xí)可視化數(shù)據(jù)挖掘工具) 1、 Tableau 2、 Excel 3、 ECharts 4、 QlikView 5、 R語言 6、 Python 7、 SPSS 8、 SAS 第4個主題: 數(shù)據(jù)可視化圖表詳解(通過實例講述數(shù)據(jù)可視化方法、過程及含義) 1、 散點圖 2、 雷達圖 3、 條形圖 4、 柱形圖 5、 餅圖 6、 直方圖 7、 箱線圖 8、 QQ圖 9、 柏拉圖制作 10、 儀表盤制作 11、 玫瑰圖制作 12、 熱力圖制作 13、 地圖制作 14、 文字云制作 15、 案例剖析 |
案例練習(xí):通過儀表盤制作案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:儀表盤制作 |
Day2 數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享 |
第1個主題: Tableau簡介 1、 Tableau歷史與趨勢剖析 2、 Tableau使用 3、 Tableau的數(shù)據(jù)類型介紹 4、 Tableau的數(shù)據(jù)結(jié)構(gòu)介紹 5、 Tableau數(shù)據(jù)的讀入和輸出 6、 Tableau數(shù)據(jù)庫的讀/寫 7、 Tableau與Kylin集成 8、 定性變量 9、 離散變量 10、 連續(xù)變量 11、 多元變量 12、 日期和時間數(shù)據(jù)的操作處理 第2個主題: 數(shù)據(jù)可視化應(yīng)用場景,具體案例分析 1、 淘寶24小時生活數(shù)據(jù)可視化案例 2、 無線淘寶數(shù)據(jù)可視化案例 3、 Google公司數(shù)據(jù)可視化案例 4、 Facebook用戶畫像可視化案例 5、 個人用戶畫像案例 第3個主題: 大數(shù)據(jù)可視化呈現(xiàn)ECharts實戰(zhàn)(通過一個完整的實例講述使用ECharts數(shù)據(jù)可視化的過程與方法) 1、 Echarts使用 2、 項目案例 3、 Echarts概述 4、 ECharts特性 5、 ECharts架構(gòu)圖 6、 整合 7、 How to use? 8、 Step1. 引入模塊加載器 9、 Step2. 設(shè)置具備大小的Dom 10、 Step3. 配置echarts模塊路徑 11、 Step4.動態(tài)加載echarts 12、 option的使用 13、 Interface 14、 setOption 15、 Option全局屬性 16、 title 17、 legend 18、 dataRange 19、 toolbox 20、 dataZoom 21、 grid 22、 xAxis/yAxis/axis 23、 color 24、 數(shù)值型 25、 類目型 26、 tooltip.formatter 27、 series 28、 高度個性化 29、 其它參考圖形 30、 熱力圖 31、 社交網(wǎng)絡(luò) 第4個主題: 分析結(jié)果呈現(xiàn)和分析報告撰寫 1、 合理的數(shù)據(jù)呈現(xiàn) 2、 報告分析模板 3、 如何撰寫一份優(yōu)秀的數(shù)據(jù)分析報告 |
案例研討:通過淘寶24小時生活數(shù)據(jù)可視化案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:淘寶24小時生活數(shù)據(jù)可視化案例 |
課程9:Python與數(shù)據(jù)分析實戰(zhàn)-13天
【匹配關(guān)鍵知識點】Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實戰(zhàn)等內(nèi)容。
【課程時間】
13天(8小時/天)
【課程簡介】
隨著大數(shù)據(jù)時代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,大數(shù)據(jù)領(lǐng)域如雨后春筍般的出現(xiàn)大量的新技術(shù),如Hadoop、Spark等技術(shù),其中Python語言已經(jīng)成為大數(shù)據(jù)技術(shù)中最為重要的一部分,被越來越多的企業(yè)所使用。Python語言的功能涵蓋了大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計分析、數(shù)據(jù)挖掘、機器學(xué)習(xí)、人工智能、大數(shù)據(jù)應(yīng)用開發(fā)等各種不同類型的計算操作,應(yīng)用范圍廣泛、前景非常廣闊。本課程是尹老師多年工作經(jīng)驗的總結(jié)和歸納,從實際業(yè)務(wù)案例為入口,使學(xué)員從理論層到實操層面系統(tǒng)的學(xué)習(xí)數(shù)據(jù)處理技術(shù),使學(xué)員深入理解Python語言等數(shù)據(jù)分析工具。通過本課程的學(xué)習(xí),學(xué)員即可以正確的分析企業(yè)的數(shù)據(jù),為管理者、決策層提供數(shù)據(jù)支撐。
【課程收益】
1、Python語言入門;
2、Python網(wǎng)絡(luò)編程;
3、Python網(wǎng)絡(luò)爬蟲;
4、Python機器學(xué)習(xí);
5、Python數(shù)據(jù)分析案例分享;
6、基于spark集群的python數(shù)據(jù)分析實戰(zhàn);
【課程特點】
Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實戰(zhàn)等內(nèi)容。
【課程對象】
數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
希望加強數(shù)據(jù)分析能力的軟件開發(fā)人員
系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
具有2年以IT部門工作經(jīng)驗,將負責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(13天*8小時)
時間 | 內(nèi)容 | 案例實踐與練習(xí) |
Day1~Day3 Python語言入門 |
第1個主題: Python語言基礎(chǔ)知識(介紹Python語言基礎(chǔ)知識,包括Python語言數(shù)據(jù)類型、基礎(chǔ)概念等) 1、 Python語言歷史與趨勢剖析 2、 Python語言安裝 3、 如何運行Python程序 4、 PyCharm開發(fā)環(huán)境介紹 5、 Anaconda3開發(fā)環(huán)境介紹(以Anaconda3作為程序演示環(huán)境,Python3作為演示語言) 6、 Python語言help()命令 7、 Python基本命令 8、 變量(Variables) 9、 表達式(Expressions) 10、 基本數(shù)據(jù)類型 11、 字符串與正則表達式 12、 Python條件表達式 13、 循環(huán)(loops) 14、 案例實戰(zhàn):正則表達式在爬蟲中應(yīng)用實例 15、 Python數(shù)據(jù)結(jié)構(gòu) 16、 Python創(chuàng)建數(shù)組 17、 Python矩陣運算 18、 Python語言語法結(jié)構(gòu) 19、 案例:Python語言實現(xiàn)運營商數(shù)據(jù)分析處理 第2個主題: Python函數(shù)(深入Python函數(shù)的編寫語言) 13、 Python函數(shù)介紹 14、 數(shù)據(jù)分析與建模過程 15、 Python語言定義函數(shù)規(guī)則 16、 Python語言自定義函數(shù) 17、 Python匿名函數(shù) 18、 Python內(nèi)置函數(shù) 19、 Python函數(shù)案例 第3個主題: Python類(class)(深入剖析Python類的原理) 1、 類(class)介紹 2、 Python多重繼承 3、 Python不支持函數(shù)重載 4、 Class and Instance Variables 5、 Method Objects 6、 Python類編寫案例實戰(zhàn) 第4個主題: Python異常處理(Exceptions)(深入剖析Python異常處理) 1、 異常處理(Exceptions)簡介 2、 Python標(biāo)準(zhǔn)異常類 3、 Python異常類編程案例實戰(zhàn)(爬蟲實例) 第5個主題: Python模塊(Modules)(深入剖析模塊(Modules)) 1、 Python模塊(Modules)介紹 2、 Python自定義模塊 3、 Python模塊的導(dǎo)入與添加 4、 Python標(biāo)準(zhǔn)函數(shù)庫模塊 5、 Python第三方模塊 第6個主題: Python文件讀寫(深入剖析Python文件讀寫) 1、 Python文件讀寫簡介 2、 Python讀寫方法介紹 3、 Python讀寫文本文件 4、 Python讀寫二進制文件 5、 Python讀寫json文件 6、 Python讀寫xml文件 第7個主題: Python操作關(guān)系型數(shù)據(jù)庫(深入剖析Python操作關(guān)系型數(shù)據(jù)) 1、 Python2安裝MySQL Connector 2、 Python3安裝MySQL Connector 3、 Python語言操作數(shù)據(jù)庫 4、 Python語言數(shù)據(jù)庫優(yōu)化 5、 案例:Python語言實現(xiàn)話務(wù)數(shù)據(jù)時間序列建模 |
案例練習(xí):通過Python語言實現(xiàn)運營商數(shù)據(jù)分析處理案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:Python語言實現(xiàn)運營商數(shù)據(jù)分析處理 |
Day4~Day5 Python網(wǎng)絡(luò)編程 |
第1個主題: 多線程編程 (用實戰(zhàn)實例介紹如何實現(xiàn)多線程) 1、 Python開發(fā)多線程的原理 2、 多線程創(chuàng)建 3、 線程鎖 4、 網(wǎng)絡(luò)應(yīng)用程序編程 5、 實例:比如生成發(fā)送電子郵件 第2個主題: Python網(wǎng)絡(luò)編程(介紹Python網(wǎng)絡(luò)編程) 1、 TCP/IP網(wǎng)絡(luò)介紹 2、 Socket基礎(chǔ)知識 3、 Socket客戶端服務(wù)器連接 4、 案例:聊天功能實戰(zhàn) 第3個主題: Python Web開發(fā)實戰(zhàn)(介紹Python Web實戰(zhàn)) 1、 Python Web開發(fā) 2、 Django框架介紹 3、 定義和使用模型 4、 Django MVC架構(gòu) 5、 Django開發(fā)環(huán)境搭建 6、 Django Session應(yīng)用 7、 Django框架應(yīng)用 8、 Django高級應(yīng)用 9、 案例:客戶通話歷史記錄查詢 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:網(wǎng)絡(luò)編程 |
Day6~Day7 Python網(wǎng)絡(luò)爬蟲 |
第1個主題: Python基礎(chǔ)知識和網(wǎng)絡(luò)程序基礎(chǔ)知識(介紹Python基礎(chǔ)知識和網(wǎng)絡(luò)程序基礎(chǔ)知識) 1、 Python語言簡介 2、 Python開發(fā)環(huán)境搭建和選擇 3、 IO編程 4、 進程和多線程基礎(chǔ)知識 5、 網(wǎng)絡(luò)編程和TCP協(xié)議 第2個主題: Web前端基礎(chǔ)知識(介紹Web前端基礎(chǔ)知識) 1、 Web程序的結(jié)構(gòu) 2、 Web前端的內(nèi)容 3、 HTML 4、 CSS 5、 JavaScript 6、 XPath 7、 Json 8、 HTTP協(xié)議標(biāo)準(zhǔn) 9、 HTTP頭和主體 10、 Cookie信息 第3個主題: 網(wǎng)絡(luò)爬蟲基礎(chǔ)知識(介紹網(wǎng)絡(luò)爬蟲基礎(chǔ)知識) 1、 網(wǎng)絡(luò)爬蟲概述 2、 網(wǎng)絡(luò)爬蟲及其應(yīng)用 3、 網(wǎng)絡(luò)爬蟲結(jié)構(gòu) 4、 HTTP請求的Python實現(xiàn) 5、 urllib2/urllib實現(xiàn) 6、 httplib/urllib實現(xiàn) 7、 更人性化的Requests 第4個主題: HTML解析(HTML解析原理介紹) 1、 初識Firebug 2、 安裝和配置Firebug 3、 正則表達式 4、 基本語法與使用 5、 Python中使用正則表達式 6、 BeautifulSoup概述 7、 安裝和配置BeautifulSoup 8、 BeautifulSoup的使用 9、 lxml的XPath解析 第5個主題: 基本的爬蟲程序開發(fā)(介紹基本的爬蟲程序開發(fā)) 1、 基礎(chǔ)爬蟲架構(gòu)及運行流程 2、 URL管理器 3、 HTML下載器 4、 HTML解析器 5、 數(shù)據(jù)存儲器 6、 爬蟲調(diào)度器 第6個主題: 協(xié)議分析(協(xié)議分析) 1、 Web端協(xié)議分析 2、 網(wǎng)頁登錄POST分析 3、 隱藏表單分析 4、 加密數(shù)據(jù)分析 5、 驗證碼問題 6、 IP代理 7、 Cookie登錄 8、 傳統(tǒng)驗證碼識別 9、 人工打碼 10、 滑動驗證碼 11、 PC客戶端抓包分析 12、 HTTPAnalyzer簡介 13、 蝦米音樂PC端API實戰(zhàn)分析 14、 App抓包分析 15、 Wireshark簡介 16、 酷我聽書App端API實戰(zhàn)分析 17、 API爬蟲:爬取mp3資源信息 第7個主題: Scrapy爬蟲框架(介紹Scrapy爬蟲框架) 1、 Scrapy爬蟲架構(gòu) 2、 安裝Scrapy 3、 創(chuàng)建cnblogs項目 4、 創(chuàng)建爬蟲模塊 5、 定義Item 6、 翻頁功能 7、 構(gòu)建ItemPipeline 8、 內(nèi)置數(shù)據(jù)存儲 9、 啟動爬蟲 10、 強化爬蟲 11、 調(diào)試方法 12、 異常 13、 控制運行狀態(tài) 14、 ItemLoader 15、 Item與ItemLoader 16、 輸入與輸出處理器 17、 ItemLoaderContext? 18、 請求與響應(yīng) 19、 下載器中間件 20、 Spider中間件 21、 擴展 22、 突破反爬蟲 |
案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:網(wǎng)絡(luò)爬蟲的實現(xiàn) |
Day8 Python的NumPy模塊 |
1、 NumPy 安裝 2、 NumPy Ndarray 對象 3、 NumPy 數(shù)據(jù)類型 4、 NumPy 數(shù)組屬性 5、 NumPy 創(chuàng)建數(shù)組 6、 NumPy 從已有的數(shù)組創(chuàng)建數(shù)組 7、 NumPy 從數(shù)值范圍創(chuàng)建數(shù)組 8、 NumPy 切片和索引 9、 NumPy 高級索引 10、 NumPy 廣播(Broadcast) 11、 NumPy 迭代數(shù)組 12、 Numpy 數(shù)組操作 13、 NumPy 位運算 14、 NumPy 字符串函數(shù) 15、 NumPy 數(shù)學(xué)函數(shù) 16、 NumPy 算術(shù)函數(shù) 17、 NumPy 統(tǒng)計函數(shù) 18、 NumPy 排序、條件刷選函數(shù) 19、 NumPy 字節(jié)交換 20、 NumPy 副本和視圖 21、 NumPy 矩陣庫(Matrix) 22、 NumPy 線性代數(shù) 23、 NumPy IO 24、 NumPy Matplotlib |
案例練習(xí):通過NumPy的案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:NumPy的數(shù)據(jù)處理 |
Day9 Python的Pandas模塊 |
1、 Pandas環(huán)境安裝配置 2、 Pandas數(shù)據(jù)結(jié)構(gòu) 3、 Pandas快速入門 4、 Pandas系列 5、 Pandas數(shù)據(jù)幀(DataFrame) 6、 Pandas面板(Panel) 7、 Pandas基本功能 8、 Pandas描述性統(tǒng)計 9、 Pandas函數(shù)應(yīng)用 10、 Pandas重建索引 11、 Pandas迭代 12、 Pandas排序 13、 Pandas字符串和文本數(shù)據(jù) 14、 Pandas選項和自定義 15、 Pandas索引和選擇數(shù)據(jù) 16、 Pandas統(tǒng)計函數(shù) 17、 Pandas窗口函數(shù) 18、 Pandas聚合 19、 Pandas缺失數(shù)據(jù) 20、 Pandas分組(GroupBy) 21、 Pandas合并/連接 22、 Pandas級聯(lián) 23、 Pandas日期功能 24、 Pandas時間差(Timedelta) 25、 Pandas分類數(shù)據(jù) 26、 Pandas可視化 27、 Pandas IO工具 28、 Pandas稀疏數(shù)據(jù) 29、 Pandas注意事項&竅門 30、 Pandas與SQL比較 |
案例練習(xí):通過Pandas使用案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:Pandas的使用方法 |
Day10 Python機器學(xué)習(xí) |
第1個主題: Python平臺下的機器學(xué)習(xí)開發(fā)技術(shù)(介紹Python平臺下的機器學(xué)習(xí)開發(fā)技術(shù)) 31、 Python平臺下的數(shù)據(jù)分析工具 32、 Python平臺下的數(shù)據(jù)分析工具概述 33、 NumPy數(shù)據(jù)處理 34、 NumPy案例 35、 Scipy數(shù)值計算 36、 SymPy符號處理 37、 Matplotlib繪制圖表 38、 Pandas數(shù)據(jù)分析、探索工具 39、 Pandas的DataFrame 40、 DataFrame的構(gòu)造 41、 StatsModels數(shù)據(jù)統(tǒng)計建模分析 42、 Scikit-Learn機器學(xué)習(xí)庫 43、 Keras人工神經(jīng)網(wǎng)絡(luò) 44、 Keras的設(shè)計原則 45、 Gensim文本挖掘庫 46、 OpenCV計算機視覺庫 47、 案例:Python語言實現(xiàn)基于聚類的圖像分割方法 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:Python語言實現(xiàn)基于聚類的圖像分割方法 |
Day11 Python機器學(xué)習(xí) |
第1個主題: 聚類模型原理與實現(xiàn)(深入剖析聚類原理以及通過Python語言實現(xiàn)聚類算法模型) 1、 聚類介紹 2、 聚類算法應(yīng)用場景 3、 聚類算法應(yīng)用案例 4、 樣品間相近性的度量 5、 快速聚類法 6、 快速聚類法的步驟 7、 用Lm距離進行快速聚類 8、 譜系聚類法 9、 類間距離及其遞推公式 10、 譜系聚類法的步驟 11、 變量聚類 12、 K-Means(K均值)聚類 13、 均值漂移聚類 14、 基于密度的聚類方法(DBSCAN) 15、 用高斯混合模型(GMM)的最大期望(EM)聚類 16、 凝聚層次聚類 17、 圖團體檢測(Graph Community Detection) 18、 案例:Python語言聚類實現(xiàn)及繪圖 19、 案例:Kmeans應(yīng)用案例剖析 20、 課堂實操:Python語言實現(xiàn)基于聚類的圖像分割方法 第2個主題: 決策樹模型原理與實現(xiàn)(深入剖析決策樹原理以及通過Python語言實現(xiàn)決策樹模型) 1、 決策樹介紹 2、 決策樹應(yīng)用場景 3、 決策樹應(yīng)用案例 4、 信息熵 5、 ID3算法 6、 C4.5算法 7、 CART算法 8、 決策樹算法 9、 剪枝 10、 過擬合與調(diào)參 11、 決策樹算法原理 12、 決策樹法的決策過程 13、 案例:Python語言實現(xiàn)決策樹模型 14、 課堂實操:Python語言實現(xiàn)決策樹模型 15、 隨機森林 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:Python語言實現(xiàn)基于聚類的圖像分割方法 |
Day12 Python數(shù)據(jù)分析案例分享 |
第1個主題: 隨機森林模型原理與實現(xiàn)(深入剖析隨機森林原理以及通過Python語言實現(xiàn)隨機森林模型) 1、 隨機森林介紹 2、 隨機森林的特點 3、 隨機森林的相關(guān)基礎(chǔ)知識 4、 信息、熵以及信息增益的概念 5、 隨機森林的生成 6、 隨機森林算法 7、 隨機森林算法原理 8、 袋外錯誤率(oob error) 9、 隨機森林應(yīng)用場景 10、 隨機森林應(yīng)用案例 11、 案例:Python語言實現(xiàn)隨機森林模型 12、 課堂實操:Python語言實現(xiàn)隨機森林模型 13、 xgboost 第2個主題: 支持向量機模型原理與實現(xiàn)(深入剖析支持向量機算法原理以及通過Python語言實現(xiàn)支持向量機模型) 1、 支持向量機介紹 2、 支持向量機應(yīng)用場景 3、 支持向量機應(yīng)用案例 4、 支持向量機算法 5、 支持向量機算法原理 6、 線性可分支持向量機 7、 間隔最大化和支持向量 8、 對偶問題求解 9、 柆格朗日函數(shù) 10、 非線性支持向量機和核函數(shù) a) 超平面 b) 線性核 c) 多項式核 d) 高斯核 e) 拉普拉斯核 f) sigmiod核 11、 線性支持向量機(軟間隔支持向量機)與松弛變量 12、 松馳因子 13、 案例:Python語言實現(xiàn)支持向量機模型 14、 課堂實操:Python語言實現(xiàn)基于SVM的字符識別方法 第3個主題: 神經(jīng)網(wǎng)絡(luò)模型原理與實現(xiàn)(深入剖析神經(jīng)網(wǎng)絡(luò)算法原理以及通過Python語言實現(xiàn)神經(jīng)網(wǎng)絡(luò)模型) 1、 神經(jīng)網(wǎng)絡(luò)介紹 2、 神經(jīng)網(wǎng)絡(luò)概念 3、 神經(jīng)網(wǎng)絡(luò)發(fā)展歷史 4、 神經(jīng)網(wǎng)絡(luò)的別名 5、 神經(jīng)網(wǎng)絡(luò)研究的主要內(nèi)容 6、 神經(jīng)網(wǎng)絡(luò)基本構(gòu)成 7、 神經(jīng)網(wǎng)絡(luò)模擬人的智能行為的四個方面 8、 神經(jīng)網(wǎng)絡(luò)的特點 9、 學(xué)習(xí)能力 10、 適應(yīng)性問題 11、 神經(jīng)網(wǎng)絡(luò)基本網(wǎng)絡(luò)模型 12、 單層網(wǎng)絡(luò) 13、 多層網(wǎng)絡(luò) 14、 循環(huán)網(wǎng)絡(luò) 15、 基本網(wǎng)絡(luò)結(jié)構(gòu)特點 16、 典型訓(xùn)練算法 17、 運行方式 18、 典型問題解決方法 19、 感知機 20、 線性神經(jīng)網(wǎng)絡(luò) 21、 BP神經(jīng)網(wǎng)絡(luò) 22、 RBF網(wǎng)絡(luò) 23、 競爭網(wǎng)絡(luò) 24、 反饋神經(jīng)網(wǎng)絡(luò) 25、 隨機神經(jīng)網(wǎng)絡(luò) 26、 遺傳算法 27、 PSO與神經(jīng)網(wǎng)絡(luò)優(yōu)化 28、 自定義深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 29、 深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法 30、 深度框架的損失函數(shù) 31、 課堂實操:Python語言實現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法 |
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:Python語言實現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法 |
Day13 基于spark集群的python數(shù)據(jù)分析實戰(zhàn) |
第1個主題: 基于Spark集群的Python的數(shù)據(jù)分析實戰(zhàn) 1、 基于Python開發(fā)Spark 程序概述 2、 基于Python開發(fā)Spark 程序算法庫介紹 3、 基于Python開發(fā)Spark 程序架構(gòu)剖析 4、 基于Python開發(fā)Spark 程序機器學(xué)習(xí)算法剖析 5、 數(shù)據(jù)類型 6、 基本統(tǒng)計算法 7、 分類與回歸 8、 協(xié)同過濾 9、 聚類 10、 降維 11、 特征提取與轉(zhuǎn)換 12、 頻繁模式挖掘 13、 評價指標(biāo) 14、 基于Python開發(fā)Spark 程序編程 15、 基于Python開發(fā)Spark 程序APIs介紹 16、 基于Python開發(fā)Spark 程序機器學(xué)習(xí)算法應(yīng)用實戰(zhàn) 17、 基于Python開發(fā)Spark 程序?qū)崙?zhàn)案例:數(shù)據(jù)聚類分析案例剖析 |
案例練習(xí):通過基于Python開發(fā)Spark 程序?qū)崙?zhàn)案例:數(shù)據(jù)聚類分析案例剖析,剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。 研討:數(shù)據(jù)聚類分析案例 |
(5)教學(xué)實驗
數(shù)據(jù)分析概述:1、大數(shù)據(jù)企業(yè)應(yīng)用障礙分析
數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理:
案例練習(xí):通過數(shù)據(jù)整理的編程和應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。
案例練習(xí):通過淘寶雙十一案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。
案例研討:通過數(shù)據(jù)挖掘案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。
研討:數(shù)據(jù)挖掘
案例練習(xí):通過企業(yè)實踐案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。
研討:企業(yè)實踐案例分享
案例練習(xí):通過數(shù)據(jù)模型的應(yīng)用案例剖析案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點和要點。
研討:數(shù)據(jù)模型的應(yīng)用案例剖析
數(shù)據(jù)分析與挖掘基礎(chǔ):
1、課堂實操:數(shù)據(jù)整理的編程和應(yīng)用
2、企業(yè)OLAP模型設(shè)計案例剖析
3、實例分享:淘寶雙十一
4、實例分享:騰訊QQ
5、實例分享:百度文庫
6、實例分享:打車大戰(zhàn)
7、實驗:Pig的實用案例
8、實驗:Hive安裝部署
9、實驗:Sqoop安裝
10、實驗:Sqoop Shell
11、實驗:FLume大數(shù)據(jù)架構(gòu)案例分享及實戰(zhàn)演練
12、實驗:企業(yè)實踐案例分享
R語言數(shù)據(jù)分析實戰(zhàn):
1、實驗:安裝R語言
2、實驗:R語言編程案例
3、實驗:R語言的繪圖功能
4、實操:R和MySQL的交互
5、實操:R和Oracle的交互
6、實操:R和Excel的交互
7、案例:蒙特卡羅模擬的應(yīng)用
8、案例1:汽車數(shù)據(jù)描述統(tǒng)計分析
9、案例2:財政收入與稅收描述統(tǒng)計分析
10、案例:蒙特卡羅模擬的應(yīng)用
11、實操:R語言實現(xiàn)蒙特卡羅求圓周率
12、實操:R語言一元線性回歸模型檢驗
13、實操:R語言實現(xiàn)多元線性回歸
14、實操:R語言非線性回歸
15、案例:用戶離網(wǎng)預(yù)測
16、案例:中國稅收收入增長案例分析
17、案例:新教學(xué)方法的效果
18、案例:信用卡違約預(yù)測
19、案例分享:文章分類
大數(shù)據(jù)工具介紹之Hadoop:
1、實例分享:馬云預(yù)測經(jīng)濟危機案例剖析
2、實例分享:雙十一億背后的開源技術(shù)
3、實驗:Hadoop集群部署
4、實驗:CLI操作HDFS
5、實驗:Java操作HDFS
6、實驗:MapReduce命令操作
7、實驗:MapReduce程序打包并在命令行運行
8、實驗:動手編寫MapReduce程序
大數(shù)據(jù)工具介紹之Spark:
1、編程實戰(zhàn):第一個Scala 程序
2、編程實戰(zhàn):編程Scala程序?qū)嵗?br /> 3、編程實戰(zhàn):Scala函數(shù)編程實例
4、編程實戰(zhàn):Scala語言復(fù)雜數(shù)據(jù)類型編程實戰(zhàn)
5、編程實戰(zhàn):用SBT對Scala項目打包與發(fā)布
6、實驗:Spark集群部署
7、實驗:Scala編寫Spark程序
8、實驗:Python編寫Spark程序
9、實驗:Spark Shell
10、編程實戰(zhàn):Spark基礎(chǔ)操作編程實戰(zhàn)
11、企業(yè)級案例:Spark Streaming與Kafka整合實現(xiàn)數(shù)據(jù)實時數(shù)據(jù)分析處理設(shè)計與分析
Pyspark集群調(diào)度與數(shù)據(jù)處理:
1、編程實戰(zhàn):Spark基礎(chǔ)操作編程實戰(zhàn)
2、PySpark MLlib實戰(zhàn)案例:數(shù)據(jù)聚類分析案例剖析
3、案例:Python編寫Spark大數(shù)據(jù)程序
大數(shù)據(jù)可視化:
1、可視化案例實戰(zhàn):數(shù)據(jù)占比柏拉圖繪制
2、可視化案例實戰(zhàn):儀表盤制作
3、實驗:柏拉圖制作
4、實驗:儀表盤制作
5、實驗:玫瑰圖制作
6、實驗:熱力圖制作
7、實驗:地圖制作
8、實驗:文字云制作
9、淘寶24小時生活數(shù)據(jù)可視化案例
10、無線淘寶數(shù)據(jù)可視化案例
11、Google公司數(shù)據(jù)可視化案例
12、Facebook用戶畫像可視化案例
13、個人用戶畫像案例
14、如何撰寫一份優(yōu)秀的數(shù)據(jù)分析報告
Python與數(shù)據(jù)分析實戰(zhàn):
1、案例實戰(zhàn):正則表達式在爬蟲中應(yīng)用實例
2、案例:Python語言實現(xiàn)運營商數(shù)據(jù)分析處理
3、實驗:Python語言自定義函數(shù)
4、案例:Python語言實現(xiàn)蒙特卡羅求圓周率
5、課堂實操:數(shù)據(jù)整理的編程和應(yīng)用
6、案例:Python語言實現(xiàn)購物藍關(guān)聯(lián)規(guī)則分析
7、課堂實操:Python語言實現(xiàn)隨機森林模型
8、課堂實操:Python語言實現(xiàn)金融數(shù)據(jù)時間序列建模
9、課堂實操:基于余弦相似度的精準(zhǔn)營銷
10、案例分享:文章分類
11、案例:Python編寫Spark大數(shù)據(jù)程序
大慶油田技術(shù)研究院高級內(nèi)訓(xùn)講師
(原)中興通訊學(xué)院高級講師;
北大計算機、北郵通信雙學(xué)位
15年嵌入式硬件、軟件開發(fā)和系統(tǒng)架構(gòu)設(shè)計總監(jiān)
有8年多的“云大智物”開發(fā)及實施經(jīng)驗。曾供職于巨龍通信、大唐電信,PHILIPS三星聯(lián)合研發(fā)中心等
【工作經(jīng)歷】
長期從事智慧家居、智慧養(yǎng)老、物聯(lián)網(wǎng)應(yīng)用、移動互聯(lián)網(wǎng)應(yīng)用研發(fā)工作,曾負責(zé)北京市科委,大慶油田數(shù)據(jù)化等多個重點項目,發(fā)表相關(guān)論文多篇,授權(quán)及申請物聯(lián)網(wǎng)方面的專利10多個。目前主要從事智慧家居、智慧養(yǎng)老、車聯(lián)網(wǎng)、交通物流、物聯(lián)網(wǎng)應(yīng)用平臺以及相關(guān)應(yīng)用方面的研究,實戰(zhàn)派資深講師。
蘭州交大成教學(xué)院等高校特聘技術(shù)類講師;,參與了我國自主通信標(biāo)準(zhǔn)TD-SCDMA的標(biāo)準(zhǔn)編寫工作,是最早一批參與TD-SCDMA研究的技術(shù)人員;歷任高級軟件開發(fā)工程師,系統(tǒng)架構(gòu)師,物聯(lián)網(wǎng)架構(gòu)師,嵌入式開發(fā)主管等職位,目前是教授級高工,已進入北京市、深圳市專家?guī)烀?,深圳市物?lián)網(wǎng)協(xié)會資深專家。
【培訓(xùn)特點】
理論基礎(chǔ)深厚,邏輯思維能力強,擁有豐富的企業(yè)授課經(jīng)驗,對企業(yè)員工培養(yǎng)具有深刻認識。授課過程中,緊密結(jié)合成人教育特點,靈活運用豐富案例,善于以點帶面,啟發(fā)思維。授課風(fēng)格互動性和實操性很強,注重講師與學(xué)員之間的互動性,使得課堂氛圍輕松愉快,倡導(dǎo)分享和共同進步,深受到學(xué)員的歡迎。
上一篇:工業(yè)互聯(lián)網(wǎng)
下一篇:創(chuàng)新業(yè)務(wù)解決方案