Convolutional Neural Networks์˜ ์—ญ์‚ฌ

Convolutional Neural Networks์˜ ์—ญ์‚ฌ

ย 

CNN์˜ ์—ญ์‚ฌ


Hubel๊ณผ Wiesel์˜ ๋‰ด๋Ÿฐ ์—ฐ๊ตฌ (1950๋…„๋Œ€)

  • ๊ณ ์–‘์ด ๋‡Œ์˜ ๋ฐ˜์‘์„ ์•Œ์•„๋ณด๋Š” ์‹คํ—˜์„ ํ†ตํ•ด์„œ ๋‰ด๋Ÿฐ์ด oriented edges์™€ shapes์— ๋ฐ˜์‘ํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ์•„๋ƒˆ๋‹ค. ํ”ผ์งˆ ๋‚ด๋ถ€์— ์ง€ํ˜•์  ๋งคํ•‘์ด ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๋ฐํ˜€๋ƒˆ๋Š”๋ฐ, ํ”ผ์งˆ ๋‚ด ์„œ๋กœ ์ธ์ ‘ํ•ด์žˆ๋Š” ์„ธํฌ๋“ค์ด visual field ์•ˆ์— ์–ด๋–ค ์ง€์—ญ์„ฑ์„ ๋„๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.
  • ๋˜ํ•œ, ๋‰ด๋Ÿฐ๋“ค์ด ๊ณ„์ธต ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์•Œ์•„๋ƒˆ๋‹ค. ์‹œ๊ฐ์‹ ํ˜ธ๊ฐ€ ๊ฐ€์žฅ ๋จผ์ € ๋„๋‹ฌํ•˜๋Š” ๊ณณ์ธ Retinal ganglion ์ด๋ผ๋Š” ๊ณณ์˜ ๊ฐ€์žฅ ์ƒ์œ„์— ๋‹ค์–‘ํ•œ ๋ชจ์„œ๋ฆฌ์˜ ๋ฐฉํ–ฅ๊ณผ ๋น›์˜ ๋ฐฉํ–ฅ์— ๋ฐ˜์‘์„ ํ•˜๋Š” Simple Cell๋“ค์ด ์œ„์น˜ํ•ด์žˆ๋Š”๋ฐ, ์ด ์„ธํฌ๋“ค์€ Complex Cell๊ณผ ์—ฐ๊ฒฐ๋˜์–ด์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณต์žกํ•œ ์„ธํฌ๋“ค์€ ๋น›์˜ ๋ฐฉํ–ฅ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์›€์ง์ž„์—์„œ๋„ ๋ฐ˜์‘์„ ํ•œ๋‹ค. ์ด์ฒ˜๋Ÿผ ๋ณต์žก๋„๊ฐ€ ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ Hyper Complex Cell๋“ค์ด ๋˜์–ด๊ฐ€๋ฉด์„œ ๋์ ๊ณผ ๊ฐ™์€ ๊ฒƒ์—๋„ ๋ฐ˜์‘ํ•˜๊ฒŒ ๋œ๋‹ค.
ย 

Fukushima์˜ Neocognitron (1980)

  • ์œ„์˜ simple/complex cells์˜ ์•„์ด๋””์–ด๋ฅผ ์‚ฌ์šฉํ•œ ์ตœ์ดˆ์˜ ๋‰ด๋Ÿด๋„ท์ด๋‹ค.
ย 

Yann LeCun์˜ LeNet-5 (1998)

  • ๋‰ด๋Ÿด๋„ท ํ•™์Šต์„ ์œ„ํ•ด ์—ญ์ „ํŒŒ์™€ gradient-based learning์„ ์ตœ์ดˆ๋กœ ์ ์šฉํ•œ ์‚ฌ๋ก€๋‹ค. ์‹ค์ œ๋กœ ๋ฌธ์„œ์ธ์‹๊ณผ ์šฐํŽธ๋ฒˆํ˜ธ ์ธ์‹์— ์‚ฌ์šฉํ•˜์˜€๋‹ค.
ย 

Alex Krizhevsky์˜ AlexNet (2012)

  • AlexNet์ด ๊ฐœ๋ฐœ๋œ ๋•๋ถ„์— Imagenet๊ณผ ๊ฐ™์€ ๋Œ€ํ˜• ๋ฐ์ดํ„ฐ ์…‹์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์œผ๋ฉฐ, GPU์˜ ๋ณ‘๋ ฌ ์ปดํ“จํŒ… ์„ฑ๋Šฅ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ๋‹ค.
ย 
๐Ÿฅ‘
์œ„์™€ ๊ฐ™์€ ์—ญ์‚ฌ๋ฅผ ๊ฐ€์ง„ ConvNet์€ ์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰, ๊ฐ์ฒด ํƒ์ง€ (์˜๋ฃŒ ์ด๋ฏธ์ง€ ํ•ด์„ ๋ฐ ์ง„๋‹จ, ์€ํ•˜ ๋ถ„๋ฅ˜, ๊ฑฐ๋ฆฌ ํ‘œ์ง€ํŒ ์ธ์‹, ์ž์œจ์ฃผํ–‰์ž๋™์ฐจ ๊ฐ์ฒด ํƒ์ง€), ์ด๋ฏธ์ง€ ์บก์…”๋‹, ์˜ˆ์ˆ ์ž‘ํ’ˆ ์ƒ์„ฑ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ์ด ๋œ๋‹ค.
ย