Loss Function
linear classification์์ Weight๋ฅผ ์
๋ ฅ์ผ๋ก ๋ฐ์์ Weight์ ๊ฒฐ๊ณผ๊ฐ ์ ๋ต ๊ฐ๊ณผ ์ผ๋ง๋ ์ฐจ์ด๊ฐ ๋๋์ง ๋ณด์ฌ์ค์ผ๋ก์จ ์ผ๋ง๋ ์์ธก์ ํ๋์ง ์ ๋ํํ์ฌ ๋ณด์ฌ์ฃผ๋ ํจ์๋ฅผ ์๋ฏธํ๋ค.
Loss Function์ ์์ธก๊ฐ๊ณผ ์ค์ ๋ผ๋ฒจ๊ฐ์ ๋ฃ์ด ํ๊ท ์ ๊ตฌํด ์ ์ฒด loss ๊ฐ์ ๊ตฌํ๋ ์๋ฆฌ
: ์ฌ์ฉํ Loss Function
: input ์ด๋ฏธ์ง์ score
: ์ ๋ต score
: ํจ์๋ฅผ ์ฌ์ฉํด์ ๋์จ ํด๋์ค์ ์ ์
: ํด๋์ค์ ์
ย
ย
Multiclass SVM Loss
SVM(์ํฌํธ ๋ฒกํฐ ๋จธ์ )์ย ๊ธฐ๊ณ ํ์ต์ ๋ถ์ผ ์ค ํ๋๋ก ํจํด ์ธ์, ์๋ฃ ๋ถ์์ ์ํย ์ง๋ ํ์ตย ๋ชจ๋ธ์ด๋ค. ์ด๋ฌํ SVM์ ๋คํญ ๋ถ๋ฅ์์๋ ์ฌ์ฉํ๋๋ฐ ์ด๋ฅผ multiclsss SVM์ด๋ผ๊ณ ํ๋ฉฐ, ์ฌ๊ธฐ์ ์ฌ์ฉ๋๋ loss funtion์ hinge loss๋ผ๊ณ ํ๋ค.
์์ธํ ๋ด์ฉ์ Multiclass SVM Loss ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ์์ค.
ย
ย
Softmax (Multinomial logistic regression)
Multiclass SVM์์ score๋ ์๋ฏธ๋ฅผ ๊ฐ์ง ์๊ธฐ ๋๋ฌธ์ ์ ๋ต ํด๋์ค์์ ๋ ๋์ score๋ฅผ ์ป๊ธฐ๋ง ํ๋ฉด ๋์๋ค. ํ์ง๋ง Softmax์ ๊ฒฝ์ฐ์๋ ํ๋ฅ ๋ถํฌ๋ฅผ ์ด์ฉํด socre ์์ฒด์ ์๋ฏธ๋ฅผ ๋ถ์ฌํ๋ค. ์ด๋ฌํ Softmax๋ ๋ฅ๋ฌ๋ ์ ๊ฒฝ๋ง ์ถ๋ ฅ์ธต์์ ์ฃผ๋ก ์ฌ์ฉํ๋ ํ์ฑํจ์์ด๋ค.
์์ธํ ๋ด์ฉ์ Softmax ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ์์ค.
ย
Regularization
์ฐ๋ฆฌ๊ฐ ๊ตฌํ Weight๋ Train data์ ๋ง์ถฐ์ ธ ์๊ธฐ์, Test data์์๋ Train data๋ฅผ ํตํด์ ๊ตฌํ Weight๊ณผ ๋ค๋ฅผ ์ ์๋ค.
Train data์์ ์ฐ๋ฆฌ๊ฐ ๊ตฌํ ๊ฒ์ ์ผ์ชฝ์ ํ๋์ ๊ทธ๋ํ๋ผ๊ณ ํ๊ณ ์ค์ Test๋ฅผ ํ์ ๋ ์ค๋ฅธ์ชฝ ๊ทธ๋ํ์์ ๋ณด์ด๋ ์ด๋ก์ ๋ค๋ชจ์ ๊ฐ์ด ์์ธกํ์ง ๋ชปํ ์ํฉ์ด ๋์ค๊ฒ ๋๋ค. ์ด๋ฌํ ๊ฒฝ์ฐ๋ Train์ ๋ง์ถฐ์ ธ Test๊ฐ์ ์ ํ๋๊ฐ ๋ฎ์์ง๋๊ฒ์ Overfitting(๊ณผ์ ํฉ)์ด๋ผ๊ณ ํ๋ค. Train data์ Overfitting๋๋ ๊ฒฐ๊ณผ๋ฅผ ๋ง๊ธฐ ์ํด Regularization์ ์ฌ์ฉํ๋ค. Regularization ์ ์๋์ ๊ฐ์ด ์ฌ์ฉํ๋ฉฐ, ํน์ ๊ฐ์ค์น๊ฐ ๋๋ฌด ๊ณผ๋ํ๊ฒ ์ปค์ง์ง ์๋๋ก ํ์ต์์ผ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋์ด๋๋ฐ ๋์์ ์ค๋ค.
ย
ย
์ข
๋ฅ
- L1 Regularization
- L2 Regularization
- Max Norm Regularization
- Dropout
- Batch Normalization
ย
๊ฐ์ฅ ๋ณดํธ์ ์ผ๋ก ์ฌ์ฉํ๋ Regularization์ผ๋ก Weight decay๋ผ๊ณ ๋ ํ๋ค. ๋ถ๋ฅ๊ธฐ์ ๋ณต์ก๋๋ฅผ ์๋์ ์ผ๋ก w1, w2 ์ค ์ด๋ค ๊ฐ์ด ๋ ๋งค๋๋ฌ์ด์ง ์ธก์ ํ๋ค. ํน์ ์์์ ์์กดํ๊ธฐ ๋ณด๋ค ๋ชจ๋ ์์๊ฐ ๊ณจ๊ณ ๋ฃจ ์ํฅ์ ๋ฏธ์น๊ธธ ์ํ ๋ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๊ฐ์ค์น๊ฐ ์ ๋ฐ์ ์ผ๋ก ์๊ณ ๊ณ ๋ฅด๊ฒ ๋ถ์ฐ๋ ํํ๋ก ์งํ๋์ด Overfitting์ ์ค์ผ ์ ์๋ค.
ย
์์ธํ ๋ด์ฉ์ Regularization (์ ๊ทํ) ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ์์ค.
ย