ETH官方钱包

前往
大廳
主題

[心得分享] 清大數據科學學分學程修課心得

鋼鐵智乃 | 2022-09-12 22:23:21 | 巴幣 2316 | 人氣 3623

數據科學學分學程需要修滿至少 18 學分的課程,其中核心課程 (基本數學&程式) 至少 9 學分。

首先,這篇的觀察角度是以資工系學生的角度來說明,修課方向也會以程式為主、統計為輔。
如果要看統計為主的修課心得推這篇 dcard 的熱門留言: https://www.dcard.tw/f/nthu/p/232315194

資工系修數據科學學分學程會相對輕鬆許多,因為最多可抵學生主修 9 學分的課程,所以只需要額外再修 9 學分即可。我是選擇程設一、資料結構跟 ML 的主修課程來抵免,加上兩學期 ECON 的統計學打好統計基底,再選一門其他科系的選修課程 (我選 ISS 的 BACS (計算統計在商業上的應用)) 就可以完成學分學程,因此我覺得這個學分學程是相對好拿的,而且 CS 的學生也相對沒有程式的門檻,因為其他課都磨練的很好了,會比較好上手。

這個學程大致上可以這樣安排 :  (底線的是研究所課程)

大一
大一必修較多,先把 GPA 打穩比較重要
資工選修: Python 程式語言入門 ( 推薦度: 4/5, 5/5 for beginner )
如果大一對 Python 不熟悉的非常推薦修這門入門課紮實打好程式底子

大二
資工選修: 數值分析 or 科學計算 ( 推薦度: 3/5 )
主要課程內容是去用近似解求出原本複雜度很高的 operation, ex. 反矩陣,數學課
推薦化工所周佳駿教授開的科學計算,人很好考試也不難。

學分學程: 統計學 or 統計資料分析 ( 推薦度: 5/5 )
我修的 ECON 統計學好處是二上統計學(一)的課程內容剛好可以跟下學期資工必修的機率連接上,但是我修的教授跑取臺大了,聽說剩下的教授有些有點風評不佳,聽說 QF 的統計教得不錯。
統計資料分析事由統計所的趙蓮菊教授開設的,會實作到很多 R,評價也是相當的好,有興趣的可以自行上網查閱。

其他課程: 統計思維與分析 ( 推薦度: 4/5 )
大甜大涼的通識課,但我真心覺得他的統計知識講得太快,難怪期中考沒幾個人會寫
期末 project 的自由分析可以讓你有第一個自己分析 data 的 project ,不矢可以好把握。

自學課程: Bekerly University: Data 100 ( 推薦度: 5/5 )
衷心大推這門課程
這門課把每天的進度都規畫好了 (暑假可以用 4 倍速安排進度),這門課程涵蓋了:
* pandas, numpy 基本操作 / 基礎 SQL
* EDA  / 統計 / ML
程式基礎練習的非常非常多,好好做完功力一定會上一層樓。

大三/大四
資工選修: ML (機器學習概論) or DL (深度學習) ( 推薦度: 5/5 )
ML: 一般難度,適合沒基礎的人,但是很難點到。
DL: 地獄難度,適合想整學期都過得很充實的人,會實際參加 3-4 個Competition。

資工其餘選修: ( 推薦度: 3~5/5 )
看對哪方面有興趣,有 CV (電腦視覺)、NLP (自然語言處理) 、 MIR (音樂資訊檢索) 或 Fintech 等等的課程都可以去關注一下,不過要注意的是三上的主科 loading 不輕 ( OS+Algo ) ,選課的時候自己衡量一下別操死自己。
其他電資所 (ISA, COM...) 的課程也可以去看看,含金量很高但 loading 應該都不輕。

學分學程: (ISS) BACS (計算統計在商業上的應用) ( 推薦度: 5/5 )
我覺得這門課給我最大的收穫是用 geometry 的角度來解釋統計學,還有源源不絕的每週 R Homework。
詳細心得一樣見 dcard : https://www.dcard.tw/f/nthu/p/232315194

其他課程: (STAT) 生物數據分析 ( 推薦度: 4/5 )
這門課分成三個部分:
* Spatial Data Analysis
* NLP (word2vec, )
* Biodiversity Analysis
建議統計基礎要比較扎實,要做 2 個自由研究並 oral presentation。
ps. 給分很甜

自修課程:
* 下學期學期中-末: Business Analytics Using Forecasting ( 推薦度: 4/5 )
時間序列分析入門清大線上 6 週課程,快速帶一下一些 model,像 ARIMA 之類的。
個人覺得 loading 就是每天花 20 分鐘以下的小課程 (如果不做程式實作),也算是探索型好課程之一。

* 暑假: SQL 自修
清大資工的資料庫系統概論主要是教如何打造資料庫而不是使用資料庫,所以可以花一點暑假時間學習一下。
個人推薦 coursera 上 UC Davis 的 "SQL for Data Science",大量練習看著 ER Model 查詢與篩選資料,修完還有證書拿。

其他還有一些課程像 Data Science/Data Mining/Network Science 等等的其他課程是比較進階的課程,有餘力或是時間空閒的話可以挑戰看看充實自己。
這樣修完四年會感覺相當充實,不過有個缺點就是你會修很多碩班的課,Loading 在其他必選修的加乘下會變得很吃力,所以一定要好好審慎評估自己的能力!

共勉之。

創作回應

菠蘿麵包
推推推[e19] [e19] [e19] [e19] [e19] [e19] [e19]
2022-09-12 22:25:03
鋼鐵智乃
謝謝 OwO
2022-09-12 23:58:53
☆呆~呆★
您好,可以請教您data100的課程是如何自學的嗎?它好像把課程影片和作業都鎖起來了,不知道您當初是看哪一個年度的呢?感謝><[e3]
2022-11-13 21:57:15
鋼鐵智乃
fa20 (fall 2020)。我猜fa22鎖是因為現在改回實體上課了吧。至於 hw 的 notebook 檔案用 github 找找看應該都有
2022-11-13 22:26:32

更多創作