◎系所教育目標: 1、具備理論與實務之專業管理人才。
2、建立寬廣與正確之服務人生態度。
3、追求全人教育以及重視專業訓練。 |
◎核心能力 | 關聯性 |
1.企業管理專業能力 | 3 關聯性中等 |
2.獨立思考創新能力 | 5 關聯性最強 |
3.溝通領導合作能力 | 3 關聯性中等 |
4.國際觀與外語能力 | 3 關聯性中等 |
5.人文關懷服務能力 | 1 關聯性最弱 |
◎本學科內容概述: 巨量資料分析 本課程目標是讓對巨量資料有興趣的同學可以了解巨量資料的相關技術與應用,課程包含巨量資料計算環境的建置、資料自動化收集、資料整理分析技術與Spark的實作。 讓學生可以迅速掌握巨量資料程式設計的重點,聚焦於巨量資料的程式架構,透過一系列的巨量資料程式實作,加強學生在巨量資料時代的實作能力,並運用創意來開發巨量資料的應用,最後讓同學可以順利進入巨量資料分析的領域。 |
◎本學科教學內容大綱: 1. 網頁爬取與解析 2. 數據資料存取與讀取 3. 數據資料分析與視覺化 4. Numpy數據運算 5. Pandas資料處理 6. Spark運算架構 7. RDD程式設計 8. Spark SQL 及 DataFrame 9. Spark 機器學習套件 |
◎本學科學習目標: 本課程目標是讓對巨量資料有興趣的同學可以了解巨量資料的相關技術與應用,課程包含巨量資料計算環境的建置、資料自動化收集、資料整理分析技術與Spark的實作。 讓學生可以迅速掌握巨量資料程式設計的重點,聚焦於巨量資料的程式架構,透過一系列的巨量資料程式實作,加強學生在巨量資料時代的實作能力,並運用創意來開發巨量資料的應用,最後讓同學可以順利進入巨量資料分析的領域。 |
◎教學進度: |
週次 | 主題 | 教學內容 | 教學方法 |
01 02/21 | 課程介紹 | 巨量資料的相關技術與應用 | 講授、討論。 |
02 02/28 | 228和平紀念日 | 228和平紀念日 | 228和平紀念日。 |
03 03/06 | 金融大數據
Power BI | (1)金融大數據實務應用
(2)智慧金融
(3)Power BI工作流程
(4)Power BI 三大模組與服務 | 操作/實作、講授、討論。 |
04 03/13 | 數據資料分析與視覺化 | (1)儀表板(Dashboard)工作區介紹
(2)操作報表物件的技巧 | 操作/實作、講授、討論。 |
05 03/20 | 數據資料存取與讀取 | (1)數據工程(Data Engineer)- Power Query
(2)Power Query自動化作業 | 操作/實作、講授、討論。 |
06 03/27 | 資料建模 | (1)Power Pivot
(2)數據分析語言 - DAX | 操作/實作、講授、討論。 |
07 04/03 | 校外研習活動 | 校外研習活動 | 校外研習活動。 |
08 04/10 | Power BI管理服務 | (1)Power BI Desktop
(2)Power BI雲端工作區 | 操作/實作、講授、討論。 |
09 04/17 | 期中考 | 期中考 | 期中考。 |
10 04/24 | 網頁爬取與解析 | (1)Python環境
(2)資料爬取
(3)網頁解析
(4)瀏覽器自動化操作 | 操作/實作、講授、討論。 |
11 05/01 | Pandas資料處理 | (1)Pandas Series的建立與取值
(2)Pandas DataFrame的建立與操作 | 操作/實作、講授、討論。 |
12 05/08 | Spark運算架構 | (1)Driver Program
(2)Cluster運算
(3)Spark元件 | 操作/實作、講授、討論。 |
13 05/15 | Python Spark上的RDD程式設計 | (1)RDD基礎概念
(2)RDD實例
(2)惰性運算 | 操作/實作、講授、討論。 |
14 05/22 | Spark SQL 及 DataFrame | (1)篩選資料
(2)排序資料
(3)群組資料
(4)Join關聯資料 | 操作/實作、講授、討論。 |
15 05/29 | Spark 機器學習套件(I) | (1)Spark MLlib介紹
(2)推薦演算法
(3)決策樹二元分類 | 操作/實作、講授、討論。 |
16 06/05 | Spark 機器學習套件(II) | (1)迴歸分析
(2)GBT Regression
(3)模型評估 | 操作/實作、講授、討論。 |
17 06/12 | 巨量資料期末專案報告 | 巨量資料期末專案報告 | 操作/實作、口頭報告、討論、線上程式練習。 |
18 06/19 | 巨量資料期末專案報告 | 巨量資料期末專案報告 | 操作/實作、口頭報告、討論、線上程式練習。 |
◎課程要求: 基礎程式設計,熟Python者佳 |
◎成績考核 課堂參與討論10% 期中考30% 書面報告15% 口頭報告15% 操作/實作20% 作業/習題演練10% |
◎參考書目與學習資源 謝邦昌, 蘇志雄, 蕭育仁, 宋龍華,Power BI金融大數據分析應用:貼近產業實務,掌握決策效率,碁峰, 2021
文淵閣工作室, Python大數據特訓班(第二版):資料自動化收集、整理、分析、儲存與應用實戰,碁峰, 2020
林大貴,Python+Spark 2.0+Hadoop機器學習與大數據分析實戰,博碩出版社,2016 |
◎教材講義 請改以帳號登入校務系統選擇全校課程查詢方能查看教材講義 |