Generative AI, ์ƒ์„ฑ ๋ชจ๋ธ ํ†บ์•„๋ณด๊ธฐ(2) - GPT-3
๐ŸŽจ

Generative AI, ์ƒ์„ฑ ๋ชจ๋ธ ํ†บ์•„๋ณด๊ธฐ(2) - GPT-3

Created
Feb 24, 2023
Editor
์œ ํ˜„ ์‹ 

INTRO


์•ˆ๋…•ํ•˜์„ธ์š”๐Ÿซก
์˜ค๋Š˜์€ Generative AI ์‹œ๋ฆฌ์ฆˆ์˜ ๋‘ ๋ฒˆ์งธ ์ด์•ผ๊ธฐ, ์ดˆ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ GPT-3์— ๋Œ€ํ•ด ํ•จ๊ป˜ ์•Œ์•„๋ด…์‹œ๋‹ค.
๋ชจ๋‘ ์–ด๋””์„ ๊ฐ€ ํ•œ ๋ฒˆ์ฏค ์ด ์ฑ…์„ ๋ณธ ์ ์ด ์žˆ์„ ๊ฒ๋‹ˆ๋‹ค๐Ÿ˜ฎ ๋ฐ”๋กœ ํžˆ๋ธŒ๋ฆฌ๋Œ€ ์—ญ์‚ฌํ•™๊ณผ ๊ต์ˆ˜ โ€˜์œ ๋ฐœ ํ•˜๋ผ๋ฆฌโ€™์˜ ์„ธ๊ณ„์ ์ธ ๋ฒ ์ŠคํŠธ์…€๋Ÿฌ <์‚ฌํ”ผ์—”์Šค>๋ผ๋Š” ์ฑ…์ธ๋ฐ์š”. ๋œฌ๊ธˆ์—†์ด ์ด ์ฑ…์„ ์†Œ๊ฐœํ•˜๋Š” ์ด์œ ๋Š”, 2022๋…„ 10์›”์— ์ถœ๊ฐ„ ์†Œ์‹์ด ์ „ํ•ด์ง„ <์‚ฌํ”ผ์—”์Šค 10์ฃผ๋…„ ํŠน๋ณ„ํŒ>์— ์ถ”๊ฐ€๋œ ๐Ÿ“œ์„œ๋ฌธ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.
"์ธ๊ณต์ง€๋Šฅ์˜ ์‹œ๋Œ€, ์ƒˆ๋กœ์šด ์ด์•ผ๊ธฐ๊ฐ€ ํ•„์š”ํ•˜๋‹ค"๋ผ๋Š” ์ œ๋ชฉ์˜ย ์„œ๋ฌธ์—๋Š” ๊ทธ๊ฐ„ ์ธ๋ฅ˜์˜ ๊ธฐ์›๊ณผ ์ž ์žฌ๋ ฅ์„ ํƒ๊ตฌํ•ด์˜จ ํ•˜๋ผ๋ฆฌ์˜ ๊ณ ๋ฏผ์„ ๊ทธ๋Œ€๋กœ ์••์ถ•ํ•ด ๋†“์€ ๋“ฏํ•œ ๋‚ด์šฉ์ด ๋‹ด๊ฒจ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ“œ
โ€œ๋‚˜๋Š” ๋‹ค์‹œ ์ถœ๋ฐœ์ ์œผ๋กœ ๋Œ์•„๊ฐ€ ์ƒ์ƒ ์†์˜ ์งˆ์„œ์™€ ์ง€๋ฐฐ์  ๊ตฌ์กฐ๋ฅผ ์ฐฝ์กฐํ•ด ๋‚ด๋Š” ์ธ๋ฅ˜์˜ ๋…ํŠนํ•œ ๋Šฅ๋ ฅ์„ ์žฌ๊ฒ€ํ† ํ•ด์•ผ๊ฒ ๋‹ค๋Š” ์ƒ๊ฐ์ด ๋“ค์—ˆ๋‹ค.โ€ย -'์‚ฌํ”ผ์—”์Šค' 10์ฃผ๋…„ ํŠน๋ณ„ํŒ ์„œ๋ฌธ ์ผ๋ถ€
ํ•˜๋ผ๋ฆฌ๊ฐ€ '์‚ฌํ”ผ์—”์Šค' ํŠน๋ณ„ํŒ์„ ํŽด ๋‚ด๋ฉด์„œ ๋А๊ผˆ๋˜ ๋ฐ”๊ฐ€ ์ž˜ ์ •๋ฆฌ๋˜์–ด ์žˆ์ฃ . ์ด ์„œ๋ฌธ์€ ๋ˆ„๊ฐ€ ๋ด๋„ ํ•˜๋ผ๋ฆฌ๊ฐ€ ์“ด ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค. โ—ํ•˜์ง€๋งŒ, ์‹ค์ œ ํ•˜๋ผ๋ฆฌ๊ฐ€ ์“ด ์„œ๋ฌธ์€ ์œ„ ์„œ๋ฌธ ๋ฐ”๋กœ ์•„๋ž˜์— ๋ถ™์–ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ“œ
"์œ„ ๊ธ€์€ ๋‚˜, ์œ ๋ฐœ ๋…ธ์•„ ํ•˜๋ผ๋ฆฌ๊ฐ€ ์“ด ๊ฒƒ์ด ์•„๋‹ˆ๋‹ค. ๋‚˜์ฒ˜๋Ÿผ ์“ฐ๋ผ๋Š” ์ฃผ๋ฌธ์„ ๋ฐ›์€ ๊ฐ•๋ ฅํ•œ ์ธ๊ณต์ง€๋Šฅ์ด ์“ด ๊ฒƒ์ด๋‹ค."
์‚ฌ์‹ค, ํ•˜๋ผ๋ฆฌ๋Š”ย 'AI๊ฐ€ ๋‚˜์˜ ๊ธ€์“ฐ๊ธฐ๋ฅผ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์„๊นŒ'ย ๋ผ๋Š” ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต์„ ์–ป๊ธฐ ์œ„ํ•ด ์‹คํ—˜์„ ํ•˜๋‚˜ ํ–ˆ์Šต๋‹ˆ๋‹ค.ย <์‚ฌํ”ผ์—”์Šค> ์ถœ๊ฐ„ 10์ฃผ๋…„์„ ๊ธฐ๋…ํ•˜๋Š” ์„œ๋ฌธ์„ "ํ•˜๋ผ๋ฆฌ ์Šคํƒ€์ผ"๋กœ ์จ ๋‹ฌ๋ผ'๊ณ ย GPT-3์—๊ฒŒ ์ฃผ๋ฌธํ•œ ๊ฒƒ์ด์ฃ . GPT-3๋Š” ํ•˜๋ผ๋ฆฌ์˜ ์ฑ…๊ณผ ๋…ผ๋ฌธ, ์ธํ„ฐ๋ทฐ ๋“ฑ์„ ๋Œ์–ด๋ชจ์•„ ์„œ๋ฌธ์„ ์™„์„ฑํ–ˆ๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋Š” ๊ฝค๋‚˜ ๋†€๋ผ์› ์Šต๋‹ˆ๋‹ค. ์œ„ ์‚ฌ์ง„์—์„œ ๋ณด์…จ๋‹ค์‹œํ”ผ, AI๊ฐ€ ์ผ๋‹ค๊ณ  ์ง์ž‘ํ•˜๊ธฐ ํž˜๋“ค ๋งŒํผ ์ž์—ฐ์Šค๋Ÿฌ์šด ๊ธ€์ด ์™„์„ฑ๋˜์—ˆ๊ณ , ์–ด๋– ํ•œ ์ˆ˜์ • ์—†์ด <์‚ฌํ”ผ์—”์Šค> 10์ฃผ๋…„ ํŠน๋ณ„ํŒ์˜ ์„œ๋ฌธ์œผ๋กœ ์ถœ๊ฐ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
ย 
๐Ÿ’ก
GPT-3๊ฐ€ ์–ด๋–ค ๋ชจ๋ธ์ธ์ง€ ๊ฐ์ด ์กฐ๊ธˆ ์˜ค์‹œ๋‚˜์š”?
๋งž์Šต๋‹ˆ๋‹ค.ย GPT-3๋Š”ย ํ…์ŠคํŠธ ์ƒ์„ฑ AI ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. โ€˜Generative Pre-trained Transformer 3โ€™์˜ ์•ฝ์ž๋กœ, ์‚ฌ์ „ ํ•™์Šต๋œ Transformer๋ฅผ ์ด์šฉํ•˜์—ฌ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์ง€๋‚œ๋ฒˆ Generative AI์˜ ์ฒซ ๋ฒˆ์งธ ์ด์•ผ๊ธฐ๋กœ ๋‹ค๋ฃจ์—ˆ๋˜ย GAN์„ ๋น„๋กฏํ•ด GPT-3 ์ด์ „์˜ ๋‹ค๋ฅธ ์ƒ์„ฑ ๋ชจ๋ธ๋“ค๊ณผ ๋‹ค๋ฅธ ์ ์€ย GPT-3๊ฐ€ ๐Ÿ™†๐Ÿปโ€โ™€๏ธ'์ดˆ๊ฑฐ๋Œ€' ๋ชจ๋ธ์ด๋ผ๋Š” ์ ์ž…๋‹ˆ๋‹ค. 2020๋…„ OpenAI๊ฐ€ ๋ฐœํ‘œํ•œ ์ตœ์ดˆ์˜ ์ดˆ๊ฑฐ๋Œ€ AI ๋ชจ๋ธ GPT-3๋ฅผ ๊ธฐ์ ์œผ๋กœ ์ˆ˜๋งŽ์€ ๋Œ€๊ธฐ์—…์—์„œ ์•ž๋‹คํˆฌ์–ด ์ดˆ๊ฑฐ๋Œ€ AI ๋ชจ๋ธ์„ ๋ฐœํ‘œํ•˜๊ธฐ๋„ ํ–ˆ์—ˆ์ฃ . ๋Œ€ํ‘œ์ ์œผ๋กœ ๊ตฌ๊ธ€์˜ Switch Transformers, ์นด์นด์˜ค์˜ KoGPT, ๋„ค์ด๋ฒ„์˜ HyperCLOVA๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ •๋„๋ฉด GPT-3๊ฐ€ ์ดˆ๊ฑฐ๋Œ€ AI ๋ชจ๋ธ ์‹œ์žฅ์— ๋ถˆ์„ ์ง€ํ•€ ๋„ํ™”์„ ๊ณผ ๊ฐ™์€ ์—ญํ• ์„ ํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.
์ž, ์ด์ œย GPT-3๊ฐ€ ๋„๋Œ€์ฒด ๋ฌด์—‡์ธ์ง€, ๐Ÿ™†๐Ÿปโ€โ™€๏ธ'์ดˆ๊ฑฐ๋Œ€ ๋ชจ๋ธ'์„ย ํ‚ค์›Œ๋“œ๋กœ ์‚ผ์•„ ์ž์„ธํžˆ ๋“ค์—ฌ๋‹ค๋ด…์‹œ๋‹ค.
ย 
ย 
[ ๋ชฉ์ฐจ ]
ย 
ย 

1. ์ดˆ๊ฑฐ๋Œ€ AI ๋ชจ๋ธ


๐Ÿ’ก
'์ดˆ๊ฑฐ๋Œ€' AI ๋ชจ๋ธ, ๋ฌด์—‡์ด ๊ฑฐ๋Œ€ํ•˜๋‹ค๋Š” ๊ฑธ๊นŒ์š”?
๐Ÿ‘๐Ÿป
๋ฐ”๋กœ, ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ 'ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜'์ž…๋‹ˆ๋‹ค.
๐Ÿ™†๐Ÿปโ€โ™€๏ธ์ดˆ๊ฑฐ๋Œ€ AI์˜ ์‹œ์ž‘์€,ย '๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์— ์ตœ๋Œ€ํ•œ ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์‹œ์ผœ๋ณด์ž'๋Š” ์‹œ๋„์—์„œ ๋น„๋กฏ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œย ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ์Šค์Šค๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๊ฒŒ ๋œ ๊ฒƒ์ด์ฃ .
์‹ค์ œ๋กœย GPT-3๋Š” ์ธํ„ฐ๋„ท์—์„œ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ๊ฑฐ์˜ ๋ชจ๋“  ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด ์‚ฌ์ „ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ปค๋จผ ํฌ๋กค๋ง(Common Crawling), ์œ„ํ‚คํ”ผ๋””์•„ ๋“ฑ์œผ๋กœ๋ถ€ํ„ฐ ์–ป์€ ํ…์ŠคํŠธ๋ฅผ ํฌํ•จํ•ด ํ•™์Šต์— ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ ์…‹์ด ๋ฌด๋ ค 3,000์–ต ๊ฐœ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.
์—ฌ๊ธฐ์„œ, ๋ชจ๋ธ์— ์ž…๋ ฅ๋˜๋Š”ย ๋ฐ์ดํ„ฐ๊ฐ€ ๋Š˜์–ด๋‚˜๋ฉด ๋‹น์—ฐํžˆ ๋ชจ๋ธ ๋‚ด์—์„œ ์ผ์–ด๋‚˜๋Š”ย ์—ฐ์‚ฐ์˜ ์ˆ˜๋„ ๋งŽ์•„์ง€๊ฒ ์ฃ ? ๐ŸŒ€ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋ฐ”๋กœ ๊ทธ ์—ฐ์‚ฐ์— ์“ฐ์ด๋Š” ๋ชจ๋ธ ๋‚ด๋ถ€์˜ ๋ณ€์ˆ˜์ž…๋‹ˆ๋‹ค. ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ๊ฐย ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ๊ฐ’์„ ์ตœ์ ํ™”ํ•˜๋Š” ๊ฒƒ์ด ๊ณง ์šฐ๋ฆฌ๊ฐ€ ํ”ํžˆย ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚จ๋‹ค๊ณ  ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ๋ง์ธ ์…ˆ์ž…๋‹ˆ๋‹ค.
์ดˆ๊ฑฐ๋Œ€ AI๋Š” ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผย ์ˆ˜์ฒœ์–ต ๊ฐœ์—์„œย ์ˆ˜์กฐ ๊ฐœ๊นŒ์ง€ ๋Š˜๋ฆฐ ๊ฒƒ์„ ๋งํ•ฉ๋‹ˆ๋‹ค. ์œ„์˜ ์ž๋ฃŒ๋ฅผ ๋ณด๋ฉด, ์šฐ๋ฆฌ์˜ย GPT-3๋Š” 1,750์–ต ๊ฐœ, ๋„ค์ด๋ฒ„์˜ย Hyperclova๋Š” 2,040์–ต ๊ฐœ, ๊ตฌ๊ธ€์˜ย LaMDA๋Š” 1์กฐ 6,000์–ต ๊ฐœ๋‚˜ ๋˜๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ย 
๐Ÿ™†๐Ÿปโ€โ™€๏ธ์ดˆ๊ฑฐ๋Œ€ AI์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋‹ค๋ฅธ AI ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ•ด ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ๊ฒƒ์ธ์ง€ ์ž˜ ์™€๋‹ฟ์ง€ ์•Š๋Š”๋‹ค๊ณ ์š”?
์œ„ ๊ทธ๋ฆผ์˜ ์˜ค๋ฅธ์ชฝ ์ƒ๋‹จ์— ํ™€๋กœ ์žˆ๋Š” ๊ฒƒ์ด OpenAI์˜ GPT-3์ž…๋‹ˆ๋‹ค.
notion image
ย 
๋ฐ‘๋ถ€๋ถ„์„ ํ™•๋Œ€ํ•˜๋ฉด ์ด๋ ‡์Šต๋‹ˆ๋‹ค. GPT-3์˜ ์ „์‹ ์ธ GPT, GPT-2๋„ ๋ณด์ด๊ณ , ๊ตฌ๊ธ€์˜ BERT, Microsoft์˜ Turing-NLG๋„ ์žˆ๋„ค์š”. GPT-3๊ฐ€ ์–ผ๋งˆ๋‚˜ ํ˜์‹ ์ ์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผ ๋Š˜๋ ธ๋Š”์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์ด๋ ‡๊ฒŒ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ˆ˜๋ฅผ ๋Š˜๋ฆฌ๋Š” ์ด์œ ๋Š”, ์ด๋ก ์ƒ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋งŽ์„์ˆ˜๋ก AI์˜ ์ง€๋Šฅ์ด ๋†’์•„์ง€๊ณ , ๋” ์ •๊ตํ•œ ํ•™์Šต์„ ํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.
๐Ÿ’ก
์ •๋ฆฌํ•˜์ž๋ฉด, '์ดˆ๊ฑฐ๋Œ€' ๋ชจ๋ธ์ด๋ž€, ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ย ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ย '์ดˆ๊ฑฐ๋Œ€'ํ•˜๋‹ค๋Š” ๊ฒƒ์ด๊ณ , ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋งŽ์„์ˆ˜๋ก AI์˜ ์„ฑ๋Šฅ์ด ์ข‹์•„์ง€๋Š” ๊ฒฝํ–ฅ์„ ๋ณด์ธ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๊ฒ ๋„ค์š”.
ย 
ย 

2. GPT-3์˜ ํ…์ŠคํŠธ ์ƒ์„ฑ ์›๋ฆฌ


๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์™€ 1,750์–ต ๊ฐœ๋‚˜ ๋˜๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง€๊ณ  GPT-3๋Š” ์–ด๋–ป๊ฒŒ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ• ๊นŒ์š”?
๊ธฐ๋ณธ์ ์œผ๋กœ GPT-3๋Š” ์–ธ์–ด ๋ชจ๋ธ(Language Model)์ž…๋‹ˆ๋‹ค. ์–ธ์–ด ๋ชจ๋ธ์ด๋ž€, ์‰ฝ๊ฒŒ ๋งํ•ด ๊ธฐ๊ณ„๊ฐ€ ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜๊ณ  ๊ตฌ์‚ฌํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” AI ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์ผ์ƒ์ƒํ™œ์—์„œ ๋ณผ ์ˆ˜ ์žˆ๋Š” ์˜ˆ๋กœ, โ€˜์‹œ๋ฆฌโ€™๋‚˜ โ€˜๋น…์Šค๋น„โ€™์™€ ๊ฐ™์€ ์Œ์„ฑ ๋น„์„œ, ์ฑ—๋ด‡ ๋˜๋Š” ์ž๋™ ๋ฒˆ์—ญ ๋“ฑ์ด AI ์–ธ์–ด ๋ชจ๋ธ๋กœ ๋งŒ๋“ค์–ด์ง„ ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค.
์กฐ๊ธˆ ๋” ๊ตฌ์ฒด์ ์œผ๋กœ ์‚ดํŽด๋ณด๋ฉด, AI ์–ธ์–ด ๋ชจ๋ธ์ด ํ•˜๋Š” ์ผ์€ ๋‹จ์–ด๋“ค๋กœ ์ด๋ฃจ์–ด์ง„ ํ…์ŠคํŠธ(์‹œํ€€์Šค)์— ํ™•๋ฅ ์„ ํ• ๋‹นํ•˜๋Š” ์ผ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์–ด๋–ค ํ…์ŠคํŠธ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ, ์–ธ์–ด ๋ชจ๋ธ์ด ๊ฐ ๋‹จ์–ด์— ํ™•๋ฅ ์„ ๋ถ€์—ฌํ•จ์œผ๋กœ์จ ๋‹ค์Œ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด์ฃ . ์ด๋ ‡๊ฒŒ ๋‹ค์Œ์— ์˜ฌ ๋‹จ์–ด๋ฅผ ํ•˜๋‚˜์”ฉ ์˜ˆ์ธกํ•˜๋Š” ๊ณผ์ •์„ ๋ฐ˜๋ณตํ•ด ๊ฐ€์žฅ ์ž์—ฐ์Šค๋Ÿฌ์šด ๋‹จ์–ด ์‹œํ€€์Šค๋ฅผ ์ฐพ์•„๋‚ด๋Š” ์ž‘์—…์„ ์–ธ์–ด ๋ชจ๋ธ๋ง(Language Modeling)์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.
๋‹จ์–ด ์‹œํ€€์Šค์— ํ™•๋ฅ ์„ ๋ถ€์—ฌํ•˜๋Š” ์ผ์ด ์™œ ํ•„์š”ํ• ๊นŒ์š”? ์–ด๋–ค ํ…์ŠคํŠธ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ, ์šฐ๋ฆฌ ์ธ๊ฐ„์€ ๊ทธ๊ฐ„ ์‚ด์•„์˜ค๋ฉด์„œ ์ถ•์ ํ•ด ์˜จ ๊ฒฝํ—˜์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•ด๋‹น ํ…์ŠคํŠธ์˜ ๋งฅ๋ฝ์„ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํŒŒ์•…ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ํŠน๋ณ„ํ•œ ๋…ธ๋ ฅ์„ ๋“ค์ด์ง€ ์•Š์•„๋„ ๋งฅ๋ฝ์„ ํ†ตํ•œ ์œ ์ถ”๊ฐ€ ๊ฐ€๋Šฅํ•˜์ฃ .
์˜ˆ๋ฅผ ๋“ค์–ด, โ€œ๋”ฅ๋‹ค์ด๋ธŒ๋Š” ํฅ๋ฏธ๋กœ์šด ๋”ฅ๋Ÿฌ๋‹ ๋…ผ๋ฌธ๋“ค์„ ____.โ€๋ผ๋Š” ๋ฌธ์žฅ์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ๋นˆ์นธ์— ์ ์ ˆํ•œ ๋ง์€ ๋ฌด์—‡์ผ๊นŒ์š”? 1. ์†Œ๊ฐœํ•œ๋‹ค 2. ํŒŒ๊ดดํ•œ๋‹ค 3. ๋จน๋Š”๋‹ค 4. ์ข‹๋‹ค 5. ์•„๋‹ˆ๋‹ค
1๋ฒˆ โ€œ์†Œ๊ฐœํ•œ๋‹คโ€๊ฐ€ ๊ฐ€์žฅ ์ž์—ฐ์Šค๋Ÿฝ์Šต๋‹ˆ๋‹ค. ๋„ˆ๋ฌด ์‰ฝ์ฃ ?๐Ÿ˜… ์ด์ œ ์ปดํ“จํ„ฐ์—๊ฒŒ ๊ฐ™์€ ๋ฌธ์ œ๋ฅผ ๋ƒˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ด ๋ด…์‹œ๋‹ค. ์ปดํ“จํ„ฐ์—๊ฒŒ๋Š” ๋ชจ๋“  ํ…์ŠคํŠธ๊ฐ€ ๊ทธ์ € 0๊ณผ 1๋กœ ์ด๋ฃจ์–ด์ง„ ์ฝ”๋“œ์— ๋ถˆ๊ณผํ•  ๋ฟ์ž…๋‹ˆ๋‹ค. ์ˆซ์ž๋กœ ํ‘œํ˜„๋œ ๋ช…ํ™•ํ•œ ๊ธฐ์ค€์ด ์žˆ์–ด์•ผ ์œ ์ถ”๊ฐ€ ๊ฐ€๋Šฅํ•˜์ฃ . ๊ทธ๋ž˜์„œ, ํ•™์Šต์„ ํ†ตํ•ด ๋‹จ์–ด์— ํ™•๋ฅ ์„ ๋ถ€์—ฌํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ํ™•๋ฅ ์ด ์ปดํ“จํ„ฐ๊ฐ€ โ€˜์ž์—ฐ์Šค๋Ÿฌ์›€โ€™์„ ํŒ๋‹จํ•  ์ฒ™๋„๊ฐ€ ๋˜์–ด์ฃผ๋Š” ๊ฒƒ์ด์ฃ .
๋งŒ์ผ ํ•™์Šต์ด ๋œ ์–ธ์–ด ๋ชจ๋ธ์—๊ฒŒ ์œ„ ๋ฌธ์ œ๊ฐ€ ์ฃผ์–ด์ง„๋‹ค๋ฉด, ํ•ด๋‹น ๋ชจ๋ธ์€ ๋จผ์ € ๋นˆ์นธ์— ๋“ค์–ด๊ฐˆ ํ›„๋ณด ๋‹จ์–ด๋“ค์ด ๋นˆ์นธ์— ์˜ฌ ํ™•๋ฅ ์„ ๊ฐ๊ฐ ๋ถ€์—ฌํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. 1๋ฒˆ โ€˜์†Œ๊ฐœํ•œ๋‹คโ€™๋Š” 95%, 2๋ฒˆ โ€˜ํŒŒ๊ดดํ•œ๋‹คโ€™๋Š” 23%, โ€ฆ ๋“ฑ๋“ฑ ๋ชจ๋“  ํ›„๋ณด์— ๋Œ€ํ•ด ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•œ ๋’ค ๊ฐ€์žฅ ๋†’์€ ํ™•๋ฅ ์„ ๊ฐ€์ง„ ํ›„๋ณด๋ฅผ ์ฑ„ํƒํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•™์Šต์ด ์ž˜ ๋œ ๋ชจ๋ธ์ด๋ผ๋ฉด ๋‹น์—ฐํžˆ 1๋ฒˆ โ€˜์†Œ๊ฐœํ•œ๋‹คโ€™๋ฅผ ๊ฐ€์žฅ ๋†’์€ ํ™•๋ฅ ๋กœ ์˜ˆ์ธกํ•˜๊ฒ ์ฃ ?
์ •๋ฆฌํ•˜์ž๋ฉด, ์–ธ์–ด ๋ชจ๋ธ GPT-3๊ฐ€ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹์€ ์ฃผ์–ด์ง„ ์‹œํ€€์Šค๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, ํ™•๋ฅ ์— ๊ธฐ๋ฐ˜ํ•ด, โ€˜๋‹ค์Œ์— ์˜ฌ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกโ€™ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. N ๊ฐœ์˜ ๋‹จ์–ด๋ฅผ ๊ฐ€์ง€๊ณ  N+1๋ฒˆ์งธ์— ์˜ฌ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์ด์ฃ . ์ดํ•ด๋ฅผ ๋•๊ธฐ ์œ„ํ•ด, GPT-3๊ฐ€ ํ•˜๋Š” ์ผ์„ ์•„์ดํฐ์˜ ์ž๋™ ์™„์„ฑ ๊ธฐ๋Šฅ์— ๋น„์œ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ›„๋ณด๊ฐ€ ๋˜๋Š” ๋‹จ์–ด ์ค‘ ๊ฐ€์žฅ ์ž์—ฐ์Šค๋Ÿฌ์šด(๋†’์€ ํ™•๋ฅ ์„ ๊ฐ€์ง„) ๋‹จ์–ด๋งŒ์„ ๊ณ„์† ์„ ํƒํ•ด ๋‚˜๊ฐ€๋ฉฐ ํ…์ŠคํŠธ๋ฅผ ์™„์„ฑํ•ด ๋‚˜๊ฐ€๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
notion image
ย 
ย 

3. GPT-3์˜ ๊ธฐ๋ฐ˜, Transformer ๊ตฌ์กฐ


์•ž์„œ GPT-3๋ฅผ ๋น„๋กฏํ•œ ์–ธ์–ด ๋ชจ๋ธ๋“ค์ด ํ™•๋ฅ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค์Œ์— ์˜ฌ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•œ๋‹ค๊ณ  ๋ง์”€๋“œ๋ ธ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด, GPT-3๋Š” ์ด ํ™•๋ฅ ์„ ์–ด๋–ป๊ฒŒ ๊ณ„์‚ฐํ•˜๋Š” ๊ฑธ๊นŒ์š”? ๊ทธ ํ•ต์‹ฌ์€ GPT-3์˜ ๊ธฐ๋ฐ˜์ธ Transformer์— ์žˆ์Šต๋‹ˆ๋‹ค. Transformer๋Š” 2017๋…„ ๊ตฌ๊ธ€์ด ๋ฐœํ‘œํ•œ ๋…ผ๋ฌธ โ€˜Attention Is All You Needโ€™์—์„œ ์†Œ๊ฐœ๋œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋กœ, ํ˜„์žฌ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ถ„์•ผ์—์„œ ๋งค์šฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•˜๊ณ  ์žˆ๋Š” ๋ชจ๋ธ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.
notion image
โ˜๐Ÿป๋จผ์ €, Transformer๋Š” ํฌ๊ฒŒ ์ธ์ฝ”๋”(์™ผ์ชฝ)์™€ ๋””์ฝ”๋”(์˜ค๋ฅธ์ชฝ) ๋‘ ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ธ์ฝ”๋”์—์„œ๋Š” ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ์ด๋ฅผ ๋ฒกํ„ฐํ™” ์‹œํ‚ค๊ณ , ๋””์ฝ”๋”์—์„œ๋Š” ๋ฒกํ„ฐํ™”๋œ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋˜ ๋‹ค๋ฅธ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•ด ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์‚ดํŽด๋ณด๊ณ  ์žˆ๋Š” GPT-3๋Š” ์ด ์ค‘์—์„œ๋„ ๋””์ฝ”๋”๋งŒ์„ ์Œ“์•„ ์˜ฌ๋ฆฐ ๊ฒƒ์ธ๋ฐ์š”. ๋””์ฝ”๋”๋งŒ์„ ์‚ฌ์šฉํ–ˆ๋‹ค๋Š” ๊ฒƒ์€, ์ถฉ๋ถ„ํ•œ ์–‘์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์ „์— ํ•™์Šต์‹œํ‚จ ๋’ค, ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ์ด ๋“ค์–ด์™”์„ ๋•Œ ๋ฒกํ„ฐํ™”๋œ ๋‚ด์šฉ์„ ๋ฐ”ํƒ•์œผ๋กœ ๊ทธ์— ํ•ด๋‹นํ•˜๋Š” ํ…์ŠคํŠธ๋ฅผ ์ƒˆ๋กœ ์ƒ์„ฑํ•ด ๋‚ด๋Š” ๋ฐ์— ์ดˆ์ ์ด ๋งž์ถฐ์ ธ ์žˆ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฐธ๊ณ ๋กœ ๋ฒกํ„ฐํ™”(Vectorizing)๋ž€, ์‰ฝ๊ฒŒ ๋งํ•ด ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ธ๊ฐ„์ด ์ดํ•ดํ•˜๊ธฐ ์‰ฌ์šด ํ˜•ํƒœ(ํ…์ŠคํŠธ)์—์„œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ์ดํ•ดํ•˜๊ธฐ ์‰ฌ์šด ํ˜•ํƒœ(๋ฒกํ„ฐ)๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •์„ ๋งํ•ฉ๋‹ˆ๋‹ค.
โœŒ๐ŸปTransformer์˜ ๋˜ ๋‹ค๋ฅธ ํŠน์ง•์œผ๋กœ Attention ๊ธฐ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. Attention ์ด๋ž€, โ€˜ํ•ด๋‹น ์‹œํ€€์Šค์˜ ์–ด๋А ๋ถ€๋ถ„์— ์ง‘์ค‘ํ•  ๊ฒƒ์ธ๊ฐ€โ€™์™€ ๊ด€๋ จ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์ด ํ…์ŠคํŠธ ๋ฒˆ์—ญ์„ ํ•  ๋•Œ์—๋„, ๋งค ์ˆœ๊ฐ„ ๋ชจ๋“  ๋‹จ์–ด์— ์ง‘์ค‘ํ•˜์ง€ ์•Š์ฃ . ํ˜„์žฌ ๋ฒˆ์—ญํ•˜๋ ค๋Š” ๋‹จ์–ด์™€ ๊ด€๋ จ ์žˆ๋Š” ๋‹จ์–ด์— ๊ฐ€์žฅ ์ง‘์ค‘ํ•˜๋ฉด์„œ ๋ฒˆ์—ญ์„ ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์ด ์ ์„ ์ด์šฉํ•œ ๊ฒƒ์ด Attention ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. GPT ๊ณ„์—ด ๋ชจ๋ธ์—์„œ ์‚ฌ์šฉํ•˜๋Š” Attention์€ Self Attention์„ ์—ฌ๋Ÿฌ ๋ฒˆ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•˜๋Š” Multi-Head Attention์ธ๋ฐ์š”. Self Attention์€, ๊ฐ„๋‹จํžˆ ๋งํ•ด ์‹œํ€€์Šค ๋‚ด ๋‹จ์–ด๋“ค ๊ฐ„์˜ ์—ฐ๊ด€์„ฑ์„ ํŒŒ์•…ํ•ด ์ ์ˆ˜๋กœ ๋‚˜ํƒ€๋‚ด๋Š” ์ž‘์—…์„ ๋งํ•ฉ๋‹ˆ๋‹ค. ์ด ์ ์ˆ˜(Attention Score)๋ฅผ ํ†ตํ•ด ํ˜„์žฌ ์‹œ์ ์—์„œ ์–ด๋–ค ๋‹จ์–ด์— ์ง‘์ค‘ํ•ด์•ผ ํ• ์ง€ ์•Œ ์ˆ˜ ์žˆ๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด์ฃ .
์ด์ œ ์œ„ ๊ทธ๋ฆผ์„ ์ž์„ธํžˆ ๋ณด๋ฉด, Transformer์˜ ๋””์ฝ”๋” ์•ˆ์— Embedding, Positional Encoding, Multi-Head Attention, Feed Forward ๋“ฑ ์—ฌ๋Ÿฌ layer๊ฐ€ ์žˆ๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์–ด๋–ค ํ…์ŠคํŠธ๋ฅผ ์ž…๋ ฅํ•˜๋ฉด, ์ด layer๋“ค๋กœ ๊ตฌ์„ฑ๋œ N ๊ฐœ์˜ ๋””์ฝ”๋” ๋ธ”๋ก๋“ค์„ ๊ฑฐ์ณ ์ตœ์ข…์ ์œผ๋กœ ์˜ˆ์ธก๋œ ํ™•๋ฅ , ์ฆ‰ Output Probabilities๊ฐ€ ๋˜์–ด ๋‚˜์˜ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์˜ ๋ชฉํ‘œ๋Š” GPT-3์— ๋Œ€ํ•œ ์ „๋ฐ˜์ ์ธ ์ดํ•ด์ด๋ฏ€๋กœ, Transformer์— ๋Œ€ํ•œ ์„ค๋ช…์€ ์—ฌ๊ธฐ์„œ ๋งˆ๋ฌด๋ฆฌํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค๐Ÿ™‚
๐Ÿ’ก
์ค‘์š”ํ•œ ๊ฒƒ์€ Transformer์˜ ๋””์ฝ”๋”๊ฐ€ ์ผ๋ จ์˜ layer๋“ค์„ ๊ฑฐ์ณ ์ตœ์ข…์ ์œผ๋กœ ๋’ค์— ์˜ฌ ๋‹จ์–ด์— ๋Œ€ํ•œ ์˜ˆ์ธก ๊ฒฐ๊ณผ๋ฅผ ์ถœ๋ ฅํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค!
ย 
ย 

4. GPT-3๊ฐ€ ์ผ์œผํ‚จ ๋ณ€ํ™”


GPT-3๋Š” ํŠน์ •ํ•œ ๋ชฉ์ ์— ๋งž์ถฐ ์„ค๊ณ„๋œ AI๊ฐ€ ์•„๋‹ˆ๋ผ, ์–ด๋– ํ•œ ๋ชฉ์ ์˜ ์ž‘์—…์—๋„ ์ค€์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๋ฒ”์šฉ ์ธ๊ณต์ง€๋Šฅ(AGI, Artificial General Intelligence) ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋ฐ”๋‘‘์„ ๋‘๋Š” ์ผ์—๋งŒ ํŠนํ™”๋œ โ€˜์•ŒํŒŒ๊ณ โ€™์™€ ๋‹ฌ๋ฆฌ, ์ธ๊ฐ„๊ณผ ๋น„์Šทํ•œ ์ง€๋Šฅ์œผ๋กœ ์‚ฌ๊ณ ํ•˜๊ณ  ํŒ๋‹จํ•˜๋ฉฐ ํญ๋„“์€ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” AI๋ผ๋Š” ๋œป์ž…๋‹ˆ๋‹ค.
GPT-3 ์ด์ „์˜ ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ๋“ค์—์„œ๋Š”, ์ˆ˜ํ–‰ํ•˜๊ณ ์ž ํ•˜๋Š” ์ž‘์—…์— ๋งž๊ฒŒ ์ถ”๊ฐ€๋กœ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜๋Š” Fine-Tuning(๋ฏธ์„ธ ์กฐ์ •) ๊ณผ์ •์ด ํ•„์š”ํ–ˆ๋Š”๋ฐ์š”. ์ด๋ฅผ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ์…‹์„ ๋งŒ๋“œ๋Š” ๋ฐ์—๋„ ์ƒ๋‹นํ•œ ์ž์›๊ณผ ๋น„์šฉ์ด ๋“ค์–ด๊ฐ„๋‹ค๋Š” ๋ฌธ์ œ์ ์ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.
๊ทธ๋Ÿฌ๋‚˜ GPT-3๋Š” โ€˜์ดˆ๊ฑฐ๋Œ€โ€™ ๋ชจ๋ธ์ด๋ผ๋Š” ๋ช…์ƒ‰์— ๋งž๊ฒŒ โ€˜์ดˆ๊ฑฐ๋Œ€โ€™ํ•œ ๋ฐ์ดํ„ฐ ์…‹์„ ์ด์šฉํ•ด ํ•™์Šต๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, Fine-Tuning์„ ๊ฑฐ์น˜์ง€ ์•Š๊ณ , ๋ช‡ ๊ฐ€์ง€ ์˜ˆ์‹œ๋งŒ ๋ฐ›์•„ ๋ฐ”๋กœ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” Few-Shot Learning ๋ฐฉ์‹์œผ๋กœ๋„ ์›ฌ๋งŒํ•œ ์„ฑ๋Šฅ์„ ๋‚ธ๋‹ค๋Š” ์ด์ ์„ ๊ฐ€์ง‘๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ˆ˜ํ–‰ํ•˜๊ณ ์ž ํ•˜๋Š” ํŠน์ • ์ž‘์—…, ์ฆ‰ Downstream Task๋ฅผ ์–ด๋–ป๊ฒŒ ์ˆ˜ํ–‰ํ•  ๊ฒƒ์ธ๊ฐ€์— ์žˆ์–ด, ๋ชจ๋ธ์—๊ฒŒ ์ ์ ˆํ•œ ์งˆ๋ฌธ์„ ํ•จ์œผ๋กœ์จ ๋‹ต์„ ์ด๋Œ์–ด๋‚ด๋Š” ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง(Prompt Engineering)์˜ ์ค‘์š”์„ฑ ๋˜ํ•œ ์ƒˆ๋กญ๊ฒŒ ๋Œ€๋‘๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
โ€˜ํ”„๋กฌํ”„ํŠธโ€™ ํ•˜๋ฉด ๋– ์˜ค๋ฅด๋Š”, ์š”์ฆ˜ ๊ฐ€์žฅ ํ™”์ œ๊ฐ€ ๋˜๊ณ  ์žˆ๋Š” ๋ชจ๋ธ์ด ์žˆ์Šต๋‹ˆ๋‹ค. 2022๋…„ 11์›” ๊ณต๊ฐœ๋˜์–ด ํ˜„์žฌ ๊ฐ€์žฅ ๋งŽ์€ ํ™”์ œ์™€ ๋…ผ๋ž€์„ ๋ถˆ๋Ÿฌ์ผ์œผํ‚ค๊ณ  ์žˆ๋Š” ๋Œ€ํ™”ํ˜• ์ธ๊ณต์ง€๋Šฅ ChatGPT์ธ๋ฐ์š”. ์ด ๋˜ํ•œ ํ”„๋กฌํ”„ํŠธ์— ํ…์ŠคํŠธ๋ฅผ ์ž…๋ ฅํ•˜๋ฉด, ๊ทธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€์ด ์ถœ๋ ฅ๋˜๋Š” ๋ฐฉ์‹์ด์ฃ . ChatGPT๋„ GPT-3๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก , ์—„๋ฐ€ํžˆ ๋งํ•˜๋ฉด GPT-3๋ฅผ ์„œ๋น„์Šค ๊ฐ€๋Šฅํ•œ ์ฑ—๋ด‡์œผ๋กœ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ์˜ค๋ฅ˜๋ฅผ ๊ต์ •ํ•˜๊ณ , ํŽธํ–ฅ์„ ์™„ํ™”ํ•ด ์—…๊ทธ๋ ˆ์ด๋“œํ•œ GPT-3.5๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์ฃ . ์–ด์จŒ๋“ , ๋งˆ์น˜ ์‚ฌ๋žŒ์ด ์“ด ๊ฒƒ ๊ฐ™์€ ๊ธ€์„ ๋งŒ๋“ค์–ด๋‚ด๋ฉฐ ์—ฐ์ผ ์„ธ์ƒ์„ ๋†€๋ผ๊ฒŒ ํ•˜๊ณ  ์žˆ๋Š” ChatGPT์˜ ์ €๋ณ€์—๋„ GPT-3๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฏธ๊ตญ์˜ ์œ ๋‹ˆ์ฝ˜ ๊ธฐ์—… Jasper(์žฌ์Šคํผ)๋Š” GPT-3๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์นดํ”ผ ๋ผ์ดํŠธ๋ฅผ ๋งŒ๋“ค์–ด์ฃผ๋Š” ์ฝ˜ํ…์ธ  ์ƒ์„ฑ ๋„๊ตฌ Jasper.ai๋ฅผ 2021๋…„ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋Š” Jasper ์„œ๋น„์Šค๋ฅผ ์ด์šฉํ•ด ๋ธ”๋กœ๊ทธ ๊ธ€, ์†Œ์…œ ๋ฏธ๋””์–ด ๊ฒŒ์‹œ๋ฌผ, ์ด๋ฉ”์ผ ๋“ฑ ๊ฐœ์ธ ๋˜๋Š” ๊ธฐ์—…์˜ ๋””์ง€ํ„ธ ์ฝ˜ํ…์ธ ์— ํฌํ•จ๋  ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•˜๋Š”๋ฐ์š”. ๋ฏธ๊ตญ์˜ ๋น„์ฆˆ๋‹ˆ์Šค ์ „๋ฌธ ๋งค์ฒด ์ž‰ํฌ(Inc.)๋Š” 2022๋…„ 8์›”, Inc.5000์„ ํ†ตํ•ด Jasper๋ฅผ โ€˜๊ฐ€์žฅ ๋น ๋ฅด๊ฒŒ ์„ฑ์žฅํ•˜๋Š” ๋ฏธ๊ตญ์˜ ๋ฏผ๊ฐ„ ๊ธฐ์—… ์ค‘ ํ•˜๋‚˜โ€™๋กœ ์„ ์ •ํ•˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” GPT-3๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์„œ๋น„์Šค๊ฐ€ ๋‹จ์ˆœํžˆ ์‚ฌ์‹ค์„ ์ „๋‹ฌํ•˜๋Š” ํ…์ŠคํŠธ๋ฅผ ๋„˜์–ด, ์ฐฝ์ž‘์„ฑ์„ ์š”ํ•˜๋Š” ๋ถ„์•ผ์—์„œ๋„ ํšจ์œจ์ ์œผ๋กœ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•ด ๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ๋œปํ•ฉ๋‹ˆ๋‹ค.
๊ตญ๋‚ด์—์„œ๋„ GPT-3๋ฅผ ์ด์šฉํ•œ ํ•œ๊ตญ์–ด ๋ชจ๋ธ ๊ฐœ๋ฐœ์ด ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ๋Œ€ํ‘œ์ ์œผ๋กœ ์นด์นด์˜ค๋ธŒ๋ ˆ์ธ์˜ KoGPT์™€ SKํ…”๋ ˆ์ฝค์˜ ์—์ด๋‹ท์ด ์žˆ์Šต๋‹ˆ๋‹ค. KoGPT๋Š” ์นด์นด์˜ค์˜ ์žํšŒ์‚ฌ์ธ ์นด์นด์˜ค๋ธŒ๋ ˆ์ธ์—์„œ 21๋…„ 11์›” ๋ฐœํ‘œ๋œ ๋ชจ๋ธ์ด๊ณ , ์—์ด๋‹ท์€ SKํ…”๋ ˆ์ฝค์—์„œ 22๋…„ 5์›” ๋ฐœํ‘œ๋œ ๋ชจ๋ธ๋กœ, ๋‘ ๋ชจ๋ธ ๋ชจ๋‘ GPT-3์˜ โ€˜ํ•œ๊ตญ์–ด ํŠนํ™” ๋ฒ„์ „โ€™์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. GPT-3๊ฐ€ ์˜์–ด๋กœ๋งŒ ์‚ฌ์ „ ํ•™์Šต๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, GPT-3๋ฅผ ์ด์šฉํ•œ ํ•œ๊ตญ์–ด ์„œ๋น„์Šค๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ด์™€ ๊ฐ™์€ ํ•œ๊ตญ์–ด ํŠนํ™” ๋ชจ๋ธ์˜ ํ•„์š”์„ฑ์ด ํด ์ˆ˜๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์„ ๊ธฐ์ ์œผ๋กœ ๊ตญ๋‚ด์—์„œ๋„ GPT-3๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋งŽ์€ ํ•œ๊ตญ์–ด ์„œ๋น„์Šค๊ฐ€ ๊ฐœ๋ฐœ๋  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ๊ทธ ์˜๋ฏธ๊ฐ€ ํฌ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ย 
ย 

OUTRO


์ง€๊ธˆ๊นŒ์ง€ ์ดˆ๊ฑฐ๋Œ€ ์–ธ์–ด ์ƒ์„ฑ ๋ชจ๋ธ, GPT-3์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์•˜์Šต๋‹ˆ๋‹ค๐Ÿ™‚ GPT-3๋Š” ๋ชจ๋ธ์˜ ๊ทœ๋ชจ์™€ ๊ทธ ์„ฑ๋Šฅ์œผ๋กœ ๋งŽ์€ ๊ด€์‹ฌ์„ ๋ฐ›์œผ๋ฉฐ, AI ์—…๊ณ„์— ์ƒˆ๋กœ์šด ํ˜์‹ ์„ ๋ถˆ๋Ÿฌ์ผ์œผ์ผฐ์ฃ . GPT-3 ๊ธฐ๋ฐ˜ ์„œ๋น„์Šค๋“ค์˜ ํ™œ์•ฝ์ƒ์„ ๋ณด๋ฉฐ, ์•ž์œผ๋กœ ์–ผ๋งˆ๋‚˜ ๋” โ€˜์ธ๊ฐ„๋‹ค์šดโ€™ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ๋“ค์ด ๋‚˜์˜ฌ์ง€ ์ •๋ง ๊ธฐ๋Œ€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค๐Ÿค”
ย 
๐Ÿ’ฌ
The GPT-3 hype is way too much. Itโ€™s impressive (thanks for the nice compliments!) but it still has serious weaknesses and sometimes makes very silly mistakes. AI is going to change the world, but GPT-3 is just a very early glimpse. We have a lot still to figure out. - OpenAI CEO Sam Altman
๋งˆ์ง€๋ง‰์œผ๋กœ GPT-3๋ฅผ ๊ฐœ๋ฐœํ•œ OpenAI ์‚ฌ์˜ ๋Œ€ํ‘œ Sam Altman์ด ํŠธ์œ„ํ„ฐ์— ๋‚จ๊ธด ๋ง์„ ์†Œ๊ฐœํ•˜๋ฉฐ ์ด๋ฒˆ ํฌ์ŠคํŒ…์„ ๋งˆ๋ฌด๋ฆฌํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. Sam Altman์— ๋”ฐ๋ฅด๋ฉด, GPT-3๋Š” ์—ฌ์ „ํžˆ ์•ฝ์ ์ด ์žˆ๊ณ , ์‹ค์ˆ˜๋ฅผ ํ•˜๊ธฐ๋„ ํ•˜๋ฉฐ, AI๊ฐ€ ์„ธ์ƒ์„ ๋ฐ”๊พธ๋Š” ์—ฌ์ •์— GPT-3๊ฐ€ ๊ทธ์ € ์ฒซ ๋ฐœ์„ ๋‚ด๋”” ๊ฒƒ๋ฟ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. GPT-3๋ฅผ ๋น„๋กฏํ•œ AI ์ƒ์„ฑ ๋ชจ๋ธ๋“ค์ด ๋งˆ์น˜ โ€˜์š”์ˆ ์ง€ํŒก์ดโ€™ ๊ฐ™์•„ ๋ณด์ด๋Š” ์š”์ฆ˜์ด์ง€๋งŒ, ์šฐ๋ฆฌ๋Š” ์•„์ง ๋‚˜์•„๊ฐ€์•ผ ํ•  ๊ธธ์ด ๋งŽ์ด ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค. Generative AI์˜ ๋ฐœ์ „์€ ํ˜„์žฌ์ง„ํ–‰ํ˜•์ž…๋‹ˆ๋‹ค!๐Ÿซก
ย 
ย 
notion image
์—๋””ํ„ฐ ์œ ํ˜„ ์‹ 
ย 
ย 
ย 

์ฐธ๊ณ ๋ฌธํ—Œ ๋ฐ ์ถœ์ฒ˜


[1] GPT-3 ๊ด€๋ จ ๋…ผ๋ฌธ: [2005.14165] Language Models are Few-Shot Learners (arxiv.org)
ย 
ย 
๐Ÿ“จ
๋ฌธ์˜์‚ฌํ•ญ manager@deepdaiv.com
ย