Image Classification

Image Classification

์ •์˜


์‹œ์Šคํ…œ์ด ์ด๋ฏธ์ง€ ์ธํ’‹์„ ๋ฐ›์œผ๋ฉด, ์ด๋ฏธ์ง€๋ฅผ ๋ณด๊ณ  ๊ธฐ์กด ์‹œ์Šคํ…œ์— ๋ฏธ๋ฆฌ ์ •ํ•ด๋†“์€ ์นดํ…Œ๊ณ ๋ฆฌ ์‹œ์Šคํ…œ์—์„œ ๊ฐ€์žฅ ์•Œ๋งž์€ ๊ฒƒ์„ ๊ณ ๋ฅด๋Š” ๊ณผ์ œ๋‹ค. ์ปดํ“จํ„ฐ ๋น„์ „๋ถ„์•ผ์˜ ํ•ต์‹ฌ ๊ณผ์ œ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.
ย 

๋ฌธ์ œ์ 

์˜๋ฏธ๋ก ์  ์ฐจ์ด๋กœ ์ธํ•ด ๋‹ค์–‘ํ•œ ๋ถ„๋ฅ˜ ์˜ค๋ฅ˜ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ์ฆ‰, ์ธ๊ฐ„์ด ์ด๋ฏธ์ง€๋ฅผ ๋ณด๋Š” ๊ฒƒ๊ณผ ๋‹ฌ๋ฆฌ ์ปดํ“จํ„ฐ๋Š” ํฐ ๊ฒฉ์ž๋ชจ์–‘์˜ ์ˆซ์ž์ง‘ํ•ฉ์œผ๋กœ ์ธ์‹ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฏธ์ง€์— ๋ฏธ๋ฌ˜ํ•œ ๋ณ€ํ™”๋งŒ ์ƒ๊ฒจ๋„, ์ปดํ“จํ„ฐ ์ž…์žฅ์—์„œ๋Š” ํ”ฝ์…€๊ฐ’ ์ „์ฒด๊ฐ€ ๋ชจ๋‘ ๋ณ€ํ™”ํ•œ๋‹ค๊ณ  ์ธ์‹ํ•˜๊ฒŒ ๋œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ 6๊ฐ€์ง€ ์–ด๋ ค์›€์— ๋Œ€์‘ํ•ด์•ผํ•œ๋‹ค.

  • ์นด๋ฉ”๋ผ ์œ„์น˜ ๋ณ€ํ™”(Viewpoint Variation): ๊ฐ™์€ ๋Œ€์ƒ์ด๋”๋ผ๋„ ์นด๋ฉ”๋ผ ์œ„์น˜๊ฐ€ ๋‹ฌ๋ผ์ง€๋ฉด ์ด๋ฏธ์ง€๊ฐ€ ๋‹ฌ๋ผ์ง€์ง€๋งŒ, ์ด๋ฅผ ๋™์ผํ•˜๊ฒŒ ์ธ์‹ํ•ด์•ผํ•œ๋‹ค.
  • ์กฐ๋ช… ์กฐ๊ฑด (Illumination conditions): ์กฐ๋ช…์ด ์–ด๋‘ก๋“ ์ง€ ๋ฐ๋“ ์ง€ ๊ฐ„์— ๋Œ€์ƒ์„ ๋™์ผํ•˜๊ฒŒ ์ธ์‹ํ•ด์•ผํ•œ๋‹ค.
  • ํ˜•ํƒœ ๋ณ€ํ™” (Deformation): ๋Œ€์ƒ์˜ ํฌ์ฆˆ๊ฐ€ ๋‹ฌ๋ผ์ง€๋”๋ผ๋„ ๋™์ผํ•˜๊ฒŒ ์ธ์‹ํ•ด์•ผํ•œ๋‹ค.
  • ๊ฐ€๋ ค์ง (Occlusion): ๋Œ€์ƒ์˜ ์ผ๋ถ€๊ฐ€ ๊ฐ€๋ ค์ ธ๋„ ๊ทธ๊ฒƒ์ด ๋™์ผํ•œ ๋Œ€์ƒ์ž„์„ ํƒ์ง€ํ•ด์•ผํ•œ๋‹ค.
  • ๋ฐฐ๊ฒฝ๊ณผ ๋น„์Šทํ•œ ๊ฒฝ์šฐ (Background Clutter): ๋Œ€์ƒ๊ณผ ๋ฐฐ๊ฒฝ์ด ์œ ์‚ฌํ•ด๋ณด์ผ ๋•Œ, ์ด๋“ค์„ ๊ตฌ๋ถ„ํ•ด๋‚ผ ์ˆ˜ ์žˆ์–ด์•ผํ•œ๋‹ค.
  • ๊ฐ™์€ ํด๋ž˜์Šค ๋‚ด์˜ ์ฐจ์ด (Intra-class Variation) : ๊ฐ™์€ ๋Œ€์ƒ์ด๋”๋ผ๋„ ์ƒ๊น€์ƒˆ, ์ƒ‰, ๋‚˜์ด, ํฌ๊ธฐ๊ฐ€ ์ œ๊ฐ๊ธฐ ๋‹ค๋ฅด๋ฏ€๋กœ ์ด๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์ธ์ง€ํ•ด์•ผํ•œ๋‹ค.
ย 

Data-Driven Approach


์ปดํ“จํ„ฐ์—๊ฒŒ ์ด๋ฏธ์ง€์™€ ๋ผ๋ฒจ์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ์…‹์„ ๋˜์ ธ์ฃผ๊ณ , ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•ด ํ›ˆ๋ จ์‹œํ‚จ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ƒˆ๋กœ์šด ์ด๋ฏธ์ง€๋“ค์— ๋Œ€ํ•ด ๋ถ„๋ฅ˜๊ธฐ๊ฐ€ ์˜ˆ์ธกํ•˜๋ฉฐ ์„ฑ๋Šฅ์„ ์—…๋Žƒํ•˜๋Š” ์›๋ฆฌ๋‹ค. ์ด๋Š” ๋”ฅ๋Ÿฌ๋‹๋ณด๋‹ค ํฐ ๋จธ์‹ ๋Ÿฌ๋‹ ์ „๋ฐ˜์— ์ ์šฉ๋˜๋Š” ๊ฐœ๋…์ด๊ธฐ๋„ ํ•˜๋‹ค.
# Data-driven approach ํ•จ์ˆ˜ ํ‘œํ˜„ def train(train_images, train_labels): # ์ด๋ฏธ์ง€์— ๋งž์ถฐ ๋ผ๋ฒจ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต return model def predict(model, test_images): # ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ํ…Œ์ŠคํŠธ ๋ผ๋ฒจ์„ ์˜ˆ์ธก return test_labels

Nearest Neighbor

โš ๏ธย ์ฃผ์˜! ์‹ค์šฉ์ ์ธ ๋ชฉ์ ๋ณด๋‹ค ๊ต์œก ํ•™์Šต์šฉ์œผ๋กœ ์ฃผ๋กœ ์“ฐ์ด๋Š” ๊ฐœ๋…์ด๋‹ค.
์ž์„ธํ•œ ๋‚ด์šฉ์€ Nearest Neighbor ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์‹œ์˜ค.
ย 

K-Nearest Neighbors (KNN)

โš ๏ธย ์ฃผ์˜! Computer Vision ๋ถ„์•ผ์—๋Š” ์“ฐ์ด์ง€ ์•Š๋Š” ๊ฐœ๋…์ด๋‹ค.
Nearest Neighbor ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๋ฌธ์ œ์ ์„ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด ๋งŒ๋“ค์–ด์ง„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค.
์ž์„ธํ•œ ๋‚ด์šฉ์€ K-Nearest Neighbors ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์‹œ์˜ค.
ย 

L1๊ฑฐ๋ฆฌ (๋งจํ•ดํŠผ ๊ฑฐ๋ฆฌ)

์ž์„ธํ•œ ๋‚ด์šฉ์€ L1๊ฑฐ๋ฆฌ (๋งจํ•ดํŠผ ๊ฑฐ๋ฆฌ) ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์‹œ์˜ค.
ย 

L2๊ฑฐ๋ฆฌ (์œ ํด๋ฆฌ๋””์–ธ ๊ฑฐ๋ฆฌ)

์ž์„ธํ•œ ๋‚ด์šฉ์€ L2๊ฑฐ๋ฆฌ (์œ ํด๋ฆฌ๋””์–ธ ๊ฑฐ๋ฆฌ) ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์‹œ์˜ค.
ย 

Parametric approach: Linear Classifier


notion image

์›๋ฆฌ

  • ์ด๋ฏธ์ง€๋ฅผ ์ž…๋ ฅ ๋ฐ›์œผ๋ฉด(X), ๊ฐ€์ค‘์น˜ ํŒŒ๋ผ๋ฏธํ„ฐ(W)์™€ ๊ณฑํ•˜์—ฌ ์นดํ…Œ๊ณ ๋ฆฌ score ๊ฐ’(f(x,w))์— bias๋ฅผ ๋”ํ•ด ๊ณ„์‚ฐํ•˜์—ฌ ๊ฐ๊ฐ์˜ ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ๋ถ„๋ฅ˜๋  ์ ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.
๐Ÿฅ‘
= ์ด๋ฏธ์ง€ ๋งคํŠธ๋ฆญ์Šค๋ฅผ ํ•˜๋‚˜์˜ ์นผ๋Ÿผ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•œ ๊ฐ’ (Dx1) = ๊ฐ€์ค‘์น˜ = ํŽธํ–ฅ ๋ฒกํ„ฐ(bias term). ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋ฌด๊ด€ํ•œ ์ƒ์ˆ˜ํ•ญ
ย 

Linear Classifier์ด ์ž˜ ๋™์ž‘ํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ

  • ํ•œ ํด๋ž˜์Šค ๋‚ด์— ๋‹ค์–‘ํ•œ ํŠน์ง•๋“ค์ด ์กด์žฌํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ชจ๋“ ๊ฒƒ์„ ํ‰๊ท ํ™”์‹œ์ผœ ํ•˜๋‚˜์˜ ํ…œํ”Œ๋ฆฟ๋งŒ์„ ํ•™์Šตํ•œ๋‹ค.
    • ์ด๋ฏธ์ง€๋Š” ๊ณ ์ฐจ์›์ด๊ธฐ ๋•Œ๋ฌธ์— ์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค (Paritiy Problem)
  • ํ•œ ํด๋ž˜์Šค๊ฐ€ ๋‹ค์–‘ํ•œ ๊ณต๊ฐ„์— ๋ถ„ํฌํ•  ์ˆ˜ ์žˆ๋‹ค (Multimodal problem)
์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ์˜ˆ์‹œ1
์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ์˜ˆ์‹œ1
์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ์˜ˆ์‹œ2
์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ์˜ˆ์‹œ2
์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ์˜ˆ์‹œ3
์ผ์ฐจํ•จ์ˆ˜ ์ง์„ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ์˜ˆ์‹œ3
ย 
ย