高中統計有學過「數據標準化」:其實就是大學常講的 Z-Score (Z-分數),又稱為「Standard Score (標準分數)」。英文維基上稱此方法是一種「Standardizing」或是「Normalizing、Normalization」
其中 Normalization 又是統計學的專業用語,和高中的認知相同,就是將不同比例的資料可以映射至相同的比例尺做比較。除了 Z-Score,另一個常用的方法是「Min-max Feature Scaling」,以及其他五花八門的方法 https://en.wikipedia.org/wiki/Normalization_(statistics)
數據分析上 (統計、大數據、機器學習、深度學習) Normalization 就是分析資料前需要做的一個步驟,又稱為「資料預處理」,然而不知為何中文文章或書籍也會把 Normalization 翻譯為「正規化」,也許是想形容此方法是在「使各種規格統一」之類的意思吧。但問題是這個名字也造成許多混淆,不同領域都有所謂的「正規化」,而且不光是中文模糊,連英文也常常叫作 Normalization,但本質上又是不同的東西。例如:機器學習 (Machine Learning) 領域針對 Cost Function 的某種調整方法也稱為正規化;資料庫對資料表的處理也稱為正規化;正規語言與自動機不但有正規化語言,也仍有一個演算法步驟叫作正規化。這種現象如同 Synchronization (同步) 已經被各種領域用爛了 (每個人心中都有自己的 Synchronization )。
難道不能取別的名字嗎?(′?ω?`)