國立嘉義大學112學年度第2學期教學大綱

課程代碼11223830032上課學制大學部
課程名稱巨量資料分析 Big Data Analytics授課教師 (師資來源)林土量(資管系)
學分(時數)3.0 (3.0)上課班級企管系4年甲班
先修科目必選修別選修
上課地點B棟 D02-407 授課語言國語
證照關係巨量資料分析師晤談時間星期2第7節~第8節, 地點:新民校區 D01-813 星期3第7節~第8節, 地點:新民校區 D01-813
課程大網網址https://web085004.adm.ncyu.edu.tw/Syllabus/Syllabus_Rpt.aspx?CrsCode=11223830032
備 註
本課程之教學主題、內容或活動是否與性別平等議題有相關之處:否本課是否使用原文教材或原文書進行教學:否

◎系所教育目標:
1、具備理論與實務之專業管理人才。
2、建立寬廣與正確之服務人生態度。
3、追求全人教育以及重視專業訓練。
◎核心能力關聯性
1.企業管理專業能力3 關聯性中等
2.獨立思考創新能力5 關聯性最強
3.溝通領導合作能力3 關聯性中等
4.國際觀與外語能力3 關聯性中等
5.人文關懷服務能力1 關聯性最弱
◎本學科內容概述:
巨量資料分析 本課程目標是讓對巨量資料有興趣的同學可以了解巨量資料的相關技術與應用,課程包含巨量資料計算環境的建置、資料自動化收集、資料整理分析技術與Spark的實作。 讓學生可以迅速掌握巨量資料程式設計的重點,聚焦於巨量資料的程式架構,透過一系列的巨量資料程式實作,加強學生在巨量資料時代的實作能力,並運用創意來開發巨量資料的應用,最後讓同學可以順利進入巨量資料分析的領域。
◎本學科教學內容大綱:
1. 網頁爬取與解析 2. 數據資料存取與讀取 3. 數據資料分析與視覺化 4. Numpy數據運算 5. Pandas資料處理 6. Spark運算架構 7. RDD程式設計 8. Spark SQL 及 DataFrame 9. Spark 機器學習套件
◎本學科學習目標:
本課程目標是讓對巨量資料有興趣的同學可以了解巨量資料的相關技術與應用,課程包含巨量資料計算環境的建置、資料自動化收集、資料整理分析技術與Spark的實作。 讓學生可以迅速掌握巨量資料程式設計的重點,聚焦於巨量資料的程式架構,透過一系列的巨量資料程式實作,加強學生在巨量資料時代的實作能力,並運用創意來開發巨量資料的應用,最後讓同學可以順利進入巨量資料分析的領域。
◎教學進度:
週次主題教學內容教學方法
01
02/21
課程介紹巨量資料的相關技術與應用講授、討論。
02
02/28
228和平紀念日228和平紀念日228和平紀念日。
03
03/06
金融大數據
Power BI
(1)金融大數據實務應用
(2)智慧金融
(3)Power BI工作流程
(4)Power BI 三大模組與服務
操作/實作、講授、討論。
04
03/13
數據資料分析與視覺化(1)儀表板(Dashboard)工作區介紹
(2)操作報表物件的技巧
操作/實作、講授、討論。
05
03/20
數據資料存取與讀取(1)數據工程(Data Engineer)- Power Query
(2)Power Query自動化作業
操作/實作、講授、討論。
06
03/27
資料建模(1)Power Pivot
(2)數據分析語言 - DAX
操作/實作、講授、討論。
07
04/03
校外研習活動校外研習活動校外研習活動。
08
04/10
Power BI管理服務(1)Power BI Desktop
(2)Power BI雲端工作區
操作/實作、講授、討論。
09
04/17
期中考期中考期中考。
10
04/24
網頁爬取與解析(1)Python環境
(2)資料爬取
(3)網頁解析
(4)瀏覽器自動化操作
操作/實作、講授、討論。
11
05/01
Pandas資料處理(1)Pandas Series的建立與取值
(2)Pandas DataFrame的建立與操作
操作/實作、講授、討論。
12
05/08
Spark運算架構(1)Driver Program
(2)Cluster運算
(3)Spark元件
操作/實作、講授、討論。
13
05/15
Python Spark上的RDD程式設計(1)RDD基礎概念
(2)RDD實例
(2)惰性運算
操作/實作、講授、討論。
14
05/22
Spark SQL 及 DataFrame(1)篩選資料
(2)排序資料
(3)群組資料
(4)Join關聯資料
操作/實作、講授、討論。
15
05/29
Spark 機器學習套件(I)(1)Spark MLlib介紹
(2)推薦演算法
(3)決策樹二元分類
操作/實作、講授、討論。
16
06/05
Spark 機器學習套件(II)(1)迴歸分析
(2)GBT Regression
(3)模型評估
操作/實作、講授、討論。
17
06/12
巨量資料期末專案報告巨量資料期末專案報告操作/實作、口頭報告、討論、線上程式練習。
18
06/19
巨量資料期末專案報告巨量資料期末專案報告操作/實作、口頭報告、討論、線上程式練習。
◎課程要求:
基礎程式設計,熟Python者佳
◎成績考核
課堂參與討論10%
期中考30%
書面報告15%
口頭報告15%
操作/實作20%
作業/習題演練10%
◎參考書目與學習資源
謝邦昌, 蘇志雄, 蕭育仁, 宋龍華,Power BI金融大數據分析應用:貼近產業實務,掌握決策效率,碁峰, 2021
文淵閣工作室, Python大數據特訓班(第二版):資料自動化收集、整理、分析、儲存與應用實戰,碁峰, 2020
林大貴,Python+Spark 2.0+Hadoop機器學習與大數據分析實戰,博碩出版社,2016
◎教材講義
請改以帳號登入校務系統選擇全校課程查詢方能查看教材講義
1.請尊重智慧財產權、使用正版教科書並禁止非法影印。
2.請重視性別平等教育之重要性,在各項學生集會場合、輔導及教學過程中,隨時向學生宣導正確的性別平 等觀念及尊重多元性別,並關心班上學生感情及生活事項,隨時予以適當的輔導,建立學生正確的性別平等意識。