Neural Network

Neural Network

ย 
์‹ ๊ฒฝ๋ง์€ ์šฐ๋ฆฌ ๋‡Œ์˜ ์‹ ๊ฒฝ๋ง ๊ตฌ์กฐ์—์„œ ์•„์ด๋””์–ด๋ฅผ ์–ป์€ ํ•จ์ˆ˜๋“ค์˜ ์ง‘ํ•ฉ(class)์ด๋‹ค. ๋น„์„ ํ˜•์˜ ๋ณต์žกํ•œ ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ๊ฐ„๋‹จํ•œ ํ•จ์ˆ˜๋“ค์„ ๊ณ„์ธต์ ์œผ๋กœ ์—ฌ๋Ÿฌ๊ฐœ ์Œ“์•„ ์˜ฌ๋ฆฐ ๊ตฌ์กฐ์ด๋‹ค. ์ด์ „์—๋Š” ๋น„๊ต์  ๊ฐ„๋‹จํ•œ linear function์„ ์ฃผ๋กœ ๊ตฌํ–ˆ์ง€๋งŒ, ํ˜„์žฌ ์ด linear function์˜ ์ค‘๊ฐ„๊ฐ’์— ๋น„์„ ํ˜• ํ•จ์ˆ˜๋ฅผ ์˜ฌ๋ฆฐ 2-layer Neural Network๊ฐ€ ์ฃผ๋ฅผ ์ด๋ฃจ์–ด ๋น„์„ ํ˜•์˜ ๋ณ€ํ™˜์ด ์ค‘์š”ํ•ด์กŒ๋‹ค.
ย 
โš ๏ธย ์ฃผ์˜! ์ƒ๋ฌผํ•™์  ์‹ ๊ฒฝ๋ง๊ณผ Neural Networks์˜ ๊ตฌ์กฐ๋Š” ๋‹ค๋ฅด๋‹ค.
  • ์ƒ๋ฌผํ•™์  ์‹ ๊ฒฝ๋ง์€ ์ •๋ง ๋‹ค์–‘ํ•œ ๊ตฌ์กฐ๊ฐ€ ์žˆ๋‹ค.
  • Dendrite๊ฐ€ linearํ•œ ๊ณ„์‚ฐ์ด ์•„๋‹Œ non-linear computations๋„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค.
  • Synapses๋Š” ํ•˜๋‚˜์˜ weight๊ฐ€ ์•„๋‹ˆ๋ผ ๋ณต์žกํ•œ ์‹œ์Šคํ…œ์ผ ์ˆ˜ ์žˆ๋‹ค.
  • Activation function์„ ํ†ตํ•ด์„œ ์–ป์€ rate๋“ค์ด ์ ์ ˆํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค. Activation function์„ ์‚ฌ์šฉํ•˜๋ฉด ์ž…๋ ฅ๊ฐ’์— ๋Œ€ํ•œ ์ถœ๋ ฅ๊ฐ’์ด linearํ•˜๊ฒŒ ๋‚˜์˜ค์ง€ ์•Š์œผ๋ฏ€๋กœ linear classifier๋ฅผ non-linear classifier๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.
์ž์„ธํ•œ ๋‚ด์šฉ์€ Activation Function ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์‹œ์˜ค.
ย 

Neural Networks์˜ Architectures

notion image
2-Layer-NN or 1-hidden-layer NN
ํ–‰๋ ฌ ๊ณฑ์…ˆ์„ ํ•˜๋Š” ์™„์ „ํžˆ ์—ฐ๊ฒฐ๋œ ๋‘ ์„ ํ˜• layer๋กœ ์ด๋ฃจ์–ด์ง„๋‹ค. ํ–‰๋ ฌ ๊ณฑ์˜ ์ˆ˜๋ฅผ ์„ธ๋Š” ๋Œ€์‹  hidden-layer ๋ฒกํ„ฐ๋ฅผ ์…€ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— NN ์ทจ๊ธ‰ํ•œ๋‹ค.
ย 
3-Layer-NN or 2-hidden-layer NN
๋‹ค์Œ ์ฑ•ํ„ฐ ์—์„œ ์ด์–ด์„œ ํ™•์ธํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ย