OpenCV中庫函數(shù)的作用:歸一化。

中文名

歸一化

拼音

guī yī huà

基本介紹

定義與作用

歸一化就是要把需要處理的數(shù)據(jù)經(jīng)過處理后(通過某種算法)限制在你需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保證程序運(yùn)行時(shí)收斂加快。歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計(jì)分布性。歸一化在0-1之間是統(tǒng)計(jì)的概率分布,歸一化在某個(gè)區(qū)間上是統(tǒng)計(jì)的坐標(biāo)分布。歸一化有同一、統(tǒng)一和合一的意思。

目的

簡而言之,是使得沒有可比性的數(shù)據(jù)變得具有可比性,同時(shí)又保持相比較的兩個(gè)數(shù)據(jù)之間的相對(duì)關(guān)系,如大小關(guān)系;或是為了作圖,原來很難在一張圖上作出來,歸一化后就可以很方便地給出圖上的相對(duì)位置等。

在使用機(jī)器學(xué)習(xí)算法的數(shù)據(jù)預(yù)處理階段,歸一化也是非常重要的一個(gè)步驟。例如在應(yīng)用SVM之前,縮放是非常重要的。Sarle的神經(jīng)網(wǎng)絡(luò)FAQ的第二部分(1997)闡述了縮放的重要性,大多數(shù)注意事項(xiàng)也適用于SVM??s放的最主要優(yōu)點(diǎn)是能夠避免大數(shù)值區(qū)間的屬性過分支配了小數(shù)值區(qū)間的屬性。另一個(gè)優(yōu)點(diǎn)是能避免計(jì)算過程中的數(shù)值復(fù)雜度。因?yàn)殛P(guān)鍵值通常依賴特征向量的內(nèi)積(inner products),例如,線性核和多項(xiàng)式核,屬性的大數(shù)值可能會(huì)導(dǎo)致數(shù)值問題。推薦將每個(gè)屬性線性縮放到區(qū)間[-1,+1]或者[0, 1]。

當(dāng)然,必須使用同樣的方法縮放訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。例如,假設(shè)把訓(xùn)練數(shù)據(jù)的第一個(gè)屬性從[-10,+10]縮放到[-1, +1],那么如果測(cè)試數(shù)據(jù)的第一個(gè)屬性屬于區(qū)間[-11, +8],必須將測(cè)試數(shù)據(jù)轉(zhuǎn)變成[-1.1, +0.8]。