๐Ÿฆ™

#2 LLaMA๊ฐ€ ์ฃผ๋ชฉ ๋ฐ›๋Š” ์ด์œ 

๋‚ ์งœ
Aug 16, 2023
์ž‘์„ฑ์ž
์‹œ์ฆŒ
Season 2
Issue
Issue 2
cleanUrl: 'newsletter/s2/2'

๐Ÿ“”ย Cover Story

LLaMA๊ฐ€ ์ฃผ๋ชฉ ๋ฐ›๋Š” ์ด์œ 

์ด๋Ÿฐ ๋‚ด์šฉ์ด ๋‹ด๊ฒจ ์žˆ์–ด์š”!
  • LLaMA ์ด์ „ ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ๋Ÿ‰ํ™” / ์ตœ์ ํ™”์˜ ์—ฐ๊ตฌ ํ๋ฆ„์„ ์งš์–ด๋ดค์–ด์š”.
  • LLaMA๊ฐ€ ์ฃผ๋ชฉ ๋ฐ›๋Š” 3๊ฐ€์ง€ ํŠน์ง•(1.์ถ”๋ก  ๋น„์šฉ ์ ˆ๊ฐ 2.์˜คํ”ˆ ์†Œ์Šค 3. LLaMA 2-Chat)์„ ์ •๋ฆฌํ–ˆ์–ด์š”.
  • ChatGPT์™€ ์ฐจ๋ณ„ํ™”๋œ LLaMA๊ฐ€ ํ™œ์šฉ์„ฑ์„ ๋ถ„์„ํ–ˆ์–ด์š”.
์š”์ฆ˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ํ•ซํ•œ ๋ชจ๋ธ์€ ๋ฐ”๋กœย LLaMA(๋ผ๋งˆ)์ž…๋‹ˆ๋‹ค. LLaMA๋ฅผ ์ฒ˜์Œ ๋“ค์–ด๋ณด์…จ๋‹ค๊ณ ์š”? LLaMA๋Š” Meta๊ฐ€ ์ง€๋‚œ 2์›” ์„ ๋ณด์ธ ์–ธ์–ด ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. LLaMA๋Š” ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ(70B)๋กœ๋„ GPT-3(175B)์„ ๋›ฐ์–ด ๋„˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์˜€๋Š”๋ฐ์š”. ๊ฒŒ๋‹ค๊ฐ€ ์ด๋ฅผ ๋ˆ„๊ตฌ๋‚˜ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœํ•˜๋ฉด์„œ ๊ธฐ์—…๊ณผ ์—ฐ๊ตฌ์ž๋“ค ์‚ฌ์ด์—์„œ ํ™”์ œ๊ฐ€ ๋์Šต๋‹ˆ๋‹ค.
์ด์ „๊นŒ์ง€๋Š”ย ๋” ๋งŽ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋ชจ๋ธ์ด ๋” ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค๋Š” ํ‰์ด ์ง€๋ฐฐ์ ์ด์—ˆ๋Š”๋ฐ LLaMA๋Š”ย ์ž‘์€ ๋ชจ๋ธ๋„ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์คฌ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด LLaMA๋Š” ์–ด๋–ป๊ฒŒ ๋” ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ๋„ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ผ ์ˆ˜ ์žˆ์—ˆ์„๊นŒ์š”? LLaMA์™€ LLaMA 2 ๋…ผ๋ฌธ ๋‚ด์šฉ์„ ๊ธฐ๋ฐ˜์œผ๋กœ LLaMA ์‹œ๋ฆฌ์ฆˆ์˜ ํŠน์ง•์„ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.
๐Ÿค”
์ž ๊น! ํŒŒ๋ผ๋ฏธํ„ฐ? ๊ทธ๊ฒŒ ๋ญ”๋ฐ?
ํŒŒ๋ผ๋ฏธํ„ฐ(Parameter)๋Š” ๋ณดํ†ตย ๋งค๊ฐœ๋ณ€์ˆ˜๋กœ ๋ฒˆ์—ญํ•˜๋Š”๋ฐ์š”. ์—ฌ๊ธฐ์„œ๋Š” AI ๋ชจ๋ธ์˜ ํ•™์Šต ๊ฐ€์ค‘์น˜๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. AI ๋ชจ๋ธ์€ ์‚ฌ์‹ค ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์€ ์–‘์˜ ์ˆซ์ž๋“ค๋กœ ์ด๋ค„์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ˆซ์ž๋“ค(๊ฐ€์ค‘์น˜)์„ ์กฐ๊ธˆ์”ฉ ์กฐ์ •ํ•˜๋ฉด์„œ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๊ฐ’์ด ๋‚˜์˜ค๋„๋ก ์˜ˆ์ธกํ•˜๋Š” ๊ณผ์ •์ด ๋ฐ”๋กœ AI์˜ ํ•™์Šต์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์„ ๋” ์ž˜ ํ•™์Šตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฌผ๋ก , ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋งŽ๋‹ค๊ณ  ํ•ญ์ƒ ์ข‹์€ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ๋„ˆ๋ฌด ๋งŽ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ–๋Š” ๊ฒฝ์šฐ ๊ฐ€์ค‘์น˜๊ฐ€ ์ด๋ฏธ ํ•™์Šตํ•œ ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์— ๊ณผ๋„ํ•˜๊ฒŒ ๋งž์ถฐ์ ธ ์žˆ์–ด, ์˜คํžˆ๋ ค ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ๋Š” ์ž˜ ๋งžํžˆ์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์–ด์š”. ์ด๋ฅผ ๊ณผ์ ํ•ฉ(Overfitting) ๋ฌธ์ œ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ผ ์ ์ ˆํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

LLaMA ์ด์ „์˜ ๊ฒฝ๋Ÿ‰ํ™” ์—ฐ๊ตฌ๋“ค

notion image
ย 
LLaMA ์ด์ „๋ถ€ํ„ฐ ๋ชจ๋ธ ๊ฒฝ๋Ÿ‰ํ™”๋ฅผ ์œ„ํ•œ ๋…ธ๋ ฅ์€ ์ด์–ด์ ธ์™”์Šต๋‹ˆ๋‹ค. ๊ทธ ๋ถ„๊ธฐ์ ์—๋Š” DeepMind์˜ ์—ฐ๊ตฌ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹น์‹œ ์—ฐ๊ตฌ ํ๋ฆ„์€ ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ํ‚ค์›Œ ์„ฑ๋Šฅ์„ ๋†’์ด์ž๋Š” ๋ฐ ๊ฐ€๊นŒ์› ์Šต๋‹ˆ๋‹ค. DeepMind๋Š” 2021๋…„ ๋งย Gopher๋ฅผ ๊ณต๊ฐœํ•˜๋ฉด์„œ ๋ชจ๋ธ์˜ ํฌ๊ธฐ(ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜)์— ๋”ฐ๋ผ ์„ฑ๋Šฅ์„ ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์‰ฝ๊ฒŒ ์˜ˆ์ƒํ•  ์ˆ˜ ์žˆ๋“ฏ, ๋งŽ์€ ์˜์—ญ์—์„œ ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ํ‚ค์šฐ๋Š” ๊ฒƒ์ด ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๋„์›€์ด ๋œ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๋ฐํ˜€๋ƒˆ์Šต๋‹ˆ๋‹ค.
์ดํ›„ 2022๋…„ 3์›”์— ์ด์–ด์ง„ ์—ฐ๊ตฌ์—์„œ๋Š” Gopher ๋ชจ๋ธ์„ ๋”์šฑ ์ตœ์ ํ™”ํ•˜์—ฌย Chinchilla๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. DeepMind ์—ฐ๊ตฌ์ง„๋“ค์€ Gopher(280B) ๋ชจ๋ธ์ด ์ถฉ๋ถ„ํžˆ ํ•™์Šต๋˜์ง€ ์•Š์•˜๋‹ค๊ณ  ํŒ๋‹จํ•œ ๊ฒƒ์ธ๋ฐ์š”. ๊ฐ™์€ ์—ฐ์‚ฐ๋Ÿ‰์œผ๋กœ ๋” ๊ฐ€๋ณ๊ณ  ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•œ ๊ฒƒ์ด์ฃ .
๊ทธ๋ž˜์„œ ์—ฐ๊ตฌ์ง„์€ ์—ฌ๋Ÿฌ ์‹คํ—˜์„ ํ†ตํ•ด ํŒŒ๋ผ๋ฏธํ„ฐ ํฌ๊ธฐ์™€ ํ•™์Šต ๋ฐ์ดํ„ฐ ์ˆ˜๋ฅผ ์ ์ ˆํžˆ ์กฐ์ ˆํ•˜๋ฉฐ ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋Š” ๊ด€๊ณ„๋ฅผ ์ฐพ์•˜์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ Chinchilla ๋ชจ๋ธ์€ Gopher์™€ ๋™์ผํ•œ ์ปดํ“จํŒ… ์ž์›์„ ํ™œ์šฉํ•˜๋ฉด์„œ๋„, 4๋ฐฐ ์ ์€ 70B์˜ ํŒŒ๋ผ๋ฏธํ„ฐ์— 4๋ฐฐ ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์—ฌ Gopher๋ณด๋‹ค ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋” ๊ฐ€๋ณ๊ณ  ๋” ๋˜‘๋˜‘ํ•œ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

LLaMA์˜ 3๊ฐ€์ง€ ํŠน์ง•

notion image
1) ๋” ์ €๋ ดํ•œ ์ถ”๋ก  ๋น„์šฉ
LLaMA๋Š” ์—ฌ๊ธฐ์„œ ํ•œ ๋ฐœ ๋” ๋‚˜์•„๊ฐ”์Šต๋‹ˆ๋‹ค. ํ•™์Šต ๋น„์šฉ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ถ”๋ก  ๋น„์šฉ๊นŒ์ง€ ๊ณ ๋ คํ•œ ๊ฒƒ์ธ๋ฐ์š”. ํ•™์Šต์—์„œ ๊ทธ๋Ÿฌํ•œ ๊ฒƒ์ฒ˜๋Ÿผ ์–ผ๋งˆ๋‚˜ ๋น ๋ฅด๊ฒŒ, ์ €๋ ดํ•˜๊ฒŒ ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋„ ์ค‘์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋•Œย ์ถ”๋ก (Inference)์ด๋ž€, ์‚ฌ์ „ํ•™์Šต ์ดํ›„์—ย ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ•˜๋Š” ๊ณผ์ •์„ ๋งํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋“ค์˜ ๋ชจ๋ธ์— ์š”์ฒญํ•˜๋ฉด ์‚ฌ์ „ ํ•™์Šต๋œ ์ •๋ณด์— ๋”ฐ๋ผ ์ถ”๋ก ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋†“๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
LLaMA๋Š” Chinchilla ์—ฐ๊ตฌ ๊ฒฐ๊ณผ์™€ ๋‹ค๋ฅด๊ฒŒ ๋” ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ(7B)๋กœ ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ(1T; 1 Trillion)๋ฅผ ํ•™์Šตํ•˜์—ฌ ์„ฑ๋Šฅ์„ ๋Œ์–ด์˜ฌ๋ ธ์Šต๋‹ˆ๋‹ค. ๋‹น์žฅ ํ•™์Šต ์‹œ๊ฐ„์€ ์กฐ๊ธˆ ๊ฑธ๋ฆฌ๋”๋ผ๋„ ์žฅ๊ธฐ์ ์œผ๋กœ๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋” ์ž‘์€ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๊ฒƒ์ด ์œ ์ง€ ๋ฐ ์ถ”๋ก  ๋น„์šฉ์„ ์ ˆ๊ฐํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋œ๋‹ค๊ณ  ๋ณธ ๊ฒƒ์ž…๋‹ˆ๋‹ค.
Meta์˜ ์ด๋Ÿฐ ์ƒ๊ฐ์€ ์šฐ์—ฐ์ด ์•„๋‹™๋‹ˆ๋‹ค. ChatGPT์˜ ๋“ฑ์žฅ ์ดํ›„,ย AI ์„œ๋น„์Šค ์ด์šฉ๋ฅ ์ด ๋งค์šฐ ๋†’์•„์ง€๋ฉด์„œ ์ถ”๋ก  ๋น„์šฉ์„ ์ ˆ๊ฐํ•˜๋ ค๋Š” ์‹œ๋„๊ฐ€ ์ด์–ด์กŒ๋Š”๋ฐ์š”. AI ์„œ๋น„์Šค๊ฐ€ ์ ์ฐจ ๋ณดํŽธํ™”๋˜๋ฉด์„œ ์—ฐ๊ตฌ ๊ด€์ ๋„ ๋‹ฌ๋ผ์ง„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.
2) ๋ˆ„๊ตฌ๋‚˜ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์˜คํ”ˆ ์†Œ์Šค
Meta๋Š” LLaMA ์ด์ „๋ถ€ํ„ฐ AI ๋ฏผ์ฃผํ™”์— ๊ด€์‹ฌ์ด ๋งŽ์•˜์Šต๋‹ˆ๋‹ค.ย ์†Œ์ˆ˜ ์–ธ์–ด ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ ๋ฒˆ์—ญ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๊ฑฐ๋‚˜,ย ์ž์ฒด์ ์œผ๋กœ ๊ฐœ๋ฐœํ•œ ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ์„ ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ๋˜ ์ ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. (๋ฌผ๋ก , ์„ฑ๋Šฅ์€ ์•„์‰ฝ๋‹ค๋Š” ํ‰์ด ์ง€๋ฐฐ์ ์ด์—ˆ์Šต๋‹ˆ๋‹ค.)
LLaMA๋ฅผ ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์ €์ž‘๊ถŒ ๋ฌธ์ œ๋„ ํ•ด๊ฒฐํ•ด์•ผ ํ–ˆ์Šต๋‹ˆ๋‹ค. Meta์˜ ์—ฐ๊ตฌ์ง„์€ LLaMA์˜ ์‚ฌ์ „ํ•™์Šต์„ ์œ„ํ•ด ๋ˆ„๊ตฌ๋‚˜ ์ ‘๊ทผ์ด ๊ฐ€๋Šฅํ•œ ์˜คํ”ˆ ์†Œ์Šค ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ํฌ๋กค๋ง์ด ํ—ˆ์šฉ๋œ ๋ฐ์ดํ„ฐ, arXiv์— ๊ฒŒ์žฌ๋œ ๋…ผ๋ฌธ, GitHub์— ๊ณต์œ ๋œ ์ฝ”๋“œ ๊ฐ™์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์—ฌ๊ธฐ์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.
์˜คํ”ˆ ์†Œ์Šค ๋ฐ์ดํ„ฐ๋กœ๋งŒ ํ•™์Šตํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์˜คํ”ˆ ์†Œ์Šค ๋ชจ๋ธ๋กœ ๋ฐฐํฌํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฒŒ๋‹ค๊ฐ€ LLaMA 2๋Š” ์ƒ์—…์  ์ด์šฉ๊นŒ์ง€ ๊ฐ€๋Šฅํ•˜๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ˆ„๊ตฌ๋‚˜ LLaMA ๋ชจ๋ธ์„ ์ˆ˜์ •ํ•ด์„œ ๋ฐฐํฌํ•˜๊ณ , ๋ˆ๋„ ๋ฒŒ ์ˆ˜ ์žˆ๊ฒŒ ๋œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.
3) ChatGPT๋ฅผ ์œ„ํ˜‘ํ•˜๋Š” LLaMA 2-Chat
์ง€๋‚œ 7์›”์— ๊ณต๊ฐœ๋œ LLaMA 2๋„ ๋งˆ์ฐฌ๊ฐ€์ง€์ž…๋‹ˆ๋‹ค. LLaMA 2์—์„œ๋Š” ์ฑ„ํŒ… ๋ชจ๋ธ(LLaMA 2-Chat)๋„ ๊ฐ™์ด ๊ณต๊ฐœํ–ˆ๋Š”๋ฐ์š”. ๊ฐœ์ธ ์ •๋ณด๊ฐ€ ๋‹ด๊ธด Meta์˜ ๋ฐ์ดํ„ฐ๋„ ํ™œ์šฉํ•˜์ง€ ์•Š์•˜๊ณ  ๋ฐ์ดํ„ฐ์— ๊ฐœ์ธ์— ๋Œ€ํ•œ ์ •๋ณด๋Š” ์ œ๊ฑฐํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ–ˆ๋‹ค๊ณ  ๋ฐํ˜”์Šต๋‹ˆ๋‹ค.
LLaMA ๋ชจ๋ธ์€ Transformer ๊ธฐ๋ฐ˜์˜ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์•ฝ๊ฐ„ ์ˆ˜์ •ํ•œ ์ •๋„์— ๋ถˆ๊ณผํ•ฉ๋‹ˆ๋‹ค. LLaMA 2๋„ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์—๋Š” ํฐ ์ฐจ์ด๋Š” ์—†์œผ๋‚˜ ํ•™์Šต ๋ฐฉ์‹์„ ์กฐ๊ธˆ ๋” ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค.
  1. LLaMA๋ณด๋‹ค ๋” 40% ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ–ˆ๊ณ 
  1. ์ž…๋ ฅ ๋ฐ›๋Š” Context์˜ ๊ธธ์ด๋ฅผ 2๋ฐฐ ๊ธธ๊ฒŒ ํ–ˆ์œผ๋ฉฐ
  1. Grouped-Query Attention(GQA)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ถ”๋ก  ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค.
LLaMA 2-Chat์„ ๊ณต๊ฐœํ•˜๋ฉด์„œ ๋‹ต๋ณ€ ์ƒ์„ฑ ๋ฐฉ์‹๋„ ์ œ์•ˆํ–ˆ๋Š”๋ฐ์š”. SFT(Supervised Fine-tuning), RLHF, GhostAttention ๋“ฑ ์ด์™€ ๊ด€๋ จ๋œ ์ž์„ธํ•œ ์ •๋ณด๋Š” ๋”ฅ ๋‹ค์ด๋ธŒ ๋ธ”๋กœ๊ทธ์—์„œ ํ™•์ธํ•ด์ฃผ์„ธ์š”!

LLaMA 2-Chat์˜ ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚˜๋‹ค๊ณ  ํ•˜์ง€๋งŒ ์•„์ง ChatGPT๋ฅผ ๋›ฐ์–ด๋„˜๊ธฐ๋Š” ์–ด๋ ค์›Œ ๋ณด์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‘˜์„ ๊ฐ™์€ ์„ ์ƒ์— ๋†“๊ณ  ๋น„๊ตํ•˜๋Š” ๊ฒƒ์€ ๋ฌด๋ฆฌ์ž…๋‹ˆ๋‹ค. ๋ฒ”์šฉ์ ์ธ ๋ชฉ์ ์œผ๋กœ ํ•™์Šต๋œ ChatGPT์™€ ๋‹ค๋ฅด๊ฒŒ LLaMA๋Š” ์„ฑ๋Šฅ์„ ์–ด๋А ์ •๋„๋กœ ์œ ์ง€ํ•˜๋ฉด์„œ ๊ฐ ์‚ฌ์šฉ์ž์˜ ๋ชฉ์ ์— ๋งž๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ฐฐํฌํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ๊ธฐ์—…์ด๋‚˜ ์—ฐ๊ตฌ์ž๋“ค์€ ๊ณต๊ฐœ๋œ LLaMA๋ฅผ ๊ทธ๋Œ€๋กœ ํ™œ์šฉํ•˜๊ธฐ๋ณด๋‹ค๋Š” ํŒŒ์ธ ํŠœ๋‹(Fine-tuning)์„ ๊ฑฐ์ณ ๊ทธ๋“ค๋งŒ์˜ ์ฑ—๋ด‡์„ ๊ตฌ์ถ•ํ•˜๋„๋ก ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ChatGPT์— ๋น„ํ•ด LLaMA๊ฐ€ ๊ฐ–๋Š” ์žฅ์ ์€ ๋ฌด์—‡์ผ๊นŒ์š”? ์™œ ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚œ ChatGPT๋ฅผ ๋‘๊ณ  LLaMA์— ์ฃผ๋ชฉํ•˜๋Š” ๊ฒƒ์ผ๊นŒ์š”?
์•ž์„œ ์„ค๋ช…ํ•œ ๊ฒƒ์ฒ˜๋Ÿผ LLaMA์™€ ๊ฐ™์ด ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ์ ์€ ๋ชจ๋ธ์€ ํ•™์Šต๊ณผ ์ถ”๋ก (Inference) ๋น„์šฉ์„ ๋‚ฎ์ถœ ์ˆ˜ ์žˆ๋‹ค๋Š” ํฐ ์žฅ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฒŒ๋‹ค๊ฐ€ ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœ๋˜์–ด ์žˆ์–ด ๊ธฐ์—…์ด ์ž์ฒด์ ์ธ ์ฑ—๋ด‡ ๋ชจ๋ธ์„ ๋ณด์œ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ถ”๊ฐ€์ ์ธ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜๋”๋ผ๋„ ๋‹ค๋ฅธ ์„œ๋ฒ„์— ๋ฏผ๊ฐํ•œ ์ •๋ณด๋ฅผ ๋„˜๊ธธ ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค.
์•ž์œผ๋กœ ํ•™์Šต ๋ฐฉ๋ฒ•์ด ๊ฐ„๋‹จํ•ด์ง€๊ณ  ์ผ๋ถ€ ๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ๋„ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค๋ฉด ๋ˆ„๊ตฌ๋‚˜ ์‰ฝ๊ฒŒ ์ž์‹ ๋งŒ์˜ ์ฑ—๋ด‡์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค๋ฉด, ๋ณธ์ธ์˜ ์นด์นด์˜คํ†ก ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์‹œ์ผœ์„œ ์ž๊ธฐ์ฒ˜๋Ÿผ ๋Œ€ํ™”ํ•˜๋Š” ์ฑ—๋ด‡์ด๋ผ๋“ ๊ฐ€, ํ•™์Šต์ž๋ฃŒ๋ฅผ ํ•™์Šต์‹œ์ผœ ๊ณต๋ถ€๋ฅผ ๋„์™€์ฃผ๋Š” ์ฑ—๋ด‡์ฒ˜๋Ÿผ์š”. LLaMA๋Š” ๊ทธ ์ฒซ๊ฑธ์Œ์ž…๋‹ˆ๋‹ค.

๐Ÿ™Œย deep daiv. ์ƒˆ๋กœ์šด ๊ธ€

Humans of daiv. #2 ๊ฐ•๋ˆํ˜

์—ฌ๋Ÿฌ๋ถ„์€ ์ธ์ƒ์˜ ํ„ฐ๋‹ ํฌ์ธํŠธ๋ฅผ ๋งž์ดํ•œ ์ ์ด ์žˆ๋‚˜์š”? ์‚ถ์˜ ๋งค ์ˆœ๊ฐ„์€ ๋„์ „์ด์ง€๋งŒ ๋Œ์ด์ผœ๋ณด๋ฉด ์œ ๋… ๊ธฐ์–ต์— ๋‚จ๋Š” ์ˆœ๊ฐ„๋“ค์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๊ทธ๋Ÿฐ ์ˆœ๊ฐ„๋“ค์ด ๋ชจ์—ฌ ์ƒˆ๋กœ์šด ํ•˜๋ฃจ๋ฅผ ๋งŒ๋“ค์–ด ๋‚ธ๋‹ค๊ณ  ์ƒ๊ฐํ•ด์š”. ๋”ฅ ๋‹ค์ด๋ธŒ ํ™œ๋™์„ ์ธ์ƒ์˜ ํ„ฐ๋‹ ํฌ์ธํŠธ๋กœ ๋งž์•„, AI ์„ธ๊ณ„์— ๋”ฅ ๋‹ค์ด๋ธŒํ•˜๊ณ  ์žˆ๋Š” ๊ฐ•๋ˆํ˜์„ ๋งŒ๋‚˜ ๊ทผํ™ฉ์„ ๋ฌผ์–ด๋ดค์Šต๋‹ˆ๋‹ค.
๐Ÿ“จ
๋ฌธ์˜์‚ฌํ•ญ manager@deepdaiv.com