INTRO
์๋
ํ์ธ์๐ซก
์ค๋์ Generative AI ์๋ฆฌ์ฆ์ ๋ ๋ฒ์งธ ์ด์ผ๊ธฐ, ์ด๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ GPT-3์ ๋ํด ํจ๊ป ์์๋ด
์๋ค.
๋ชจ๋ ์ด๋์ ๊ฐ ํ ๋ฒ์ฏค ์ด ์ฑ
์ ๋ณธ ์ ์ด ์์ ๊ฒ๋๋ค๐ฎ ๋ฐ๋ก ํ๋ธ๋ฆฌ๋ ์ญ์ฌํ๊ณผ ๊ต์ โ์ ๋ฐ ํ๋ผ๋ฆฌโ์ ์ธ๊ณ์ ์ธ ๋ฒ ์คํธ์
๋ฌ <์ฌํผ์์ค>๋ผ๋ ์ฑ
์ธ๋ฐ์. ๋ฌ๊ธ์์ด ์ด ์ฑ
์ ์๊ฐํ๋ ์ด์ ๋, 2022๋
10์์ ์ถ๊ฐ ์์์ด ์ ํด์ง <์ฌํผ์์ค 10์ฃผ๋
ํน๋ณํ>์ ์ถ๊ฐ๋ ๐์๋ฌธ ๋๋ฌธ์
๋๋ค.
"์ธ๊ณต์ง๋ฅ์ ์๋, ์๋ก์ด ์ด์ผ๊ธฐ๊ฐ ํ์ํ๋ค"๋ผ๋ ์ ๋ชฉ์ย ์๋ฌธ์๋ ๊ทธ๊ฐ ์ธ๋ฅ์ ๊ธฐ์๊ณผ ์ ์ฌ๋ ฅ์ ํ๊ตฌํด์จ ํ๋ผ๋ฆฌ์ ๊ณ ๋ฏผ์ ๊ทธ๋๋ก ์์ถํด ๋์ ๋ฏํ ๋ด์ฉ์ด ๋ด๊ฒจ ์์ต๋๋ค.
โ๋๋ ๋ค์ ์ถ๋ฐ์ ์ผ๋ก ๋์๊ฐ ์์ ์์ ์ง์์ ์ง๋ฐฐ์ ๊ตฌ์กฐ๋ฅผ ์ฐฝ์กฐํด ๋ด๋ ์ธ๋ฅ์ ๋
ํนํ ๋ฅ๋ ฅ์ ์ฌ๊ฒํ ํด์ผ๊ฒ ๋ค๋ ์๊ฐ์ด ๋ค์๋ค.โย -'์ฌํผ์์ค' 10์ฃผ๋
ํน๋ณํ ์๋ฌธ ์ผ๋ถ
ํ๋ผ๋ฆฌ๊ฐ '์ฌํผ์์ค' ํน๋ณํ์ ํด ๋ด๋ฉด์ ๋๊ผ๋ ๋ฐ๊ฐ ์ ์ ๋ฆฌ๋์ด ์์ฃ . ์ด ์๋ฌธ์ ๋๊ฐ ๋ด๋ ํ๋ผ๋ฆฌ๊ฐ ์ด ๊ฒ์ผ๋ก ๋ณด์
๋๋ค.
โํ์ง๋ง, ์ค์ ํ๋ผ๋ฆฌ๊ฐ ์ด ์๋ฌธ์ ์ ์๋ฌธ ๋ฐ๋ก ์๋์ ๋ถ์ด ์์์ต๋๋ค.
"์ ๊ธ์ ๋, ์ ๋ฐ ๋
ธ์ ํ๋ผ๋ฆฌ๊ฐ ์ด ๊ฒ์ด ์๋๋ค. ๋์ฒ๋ผ ์ฐ๋ผ๋ ์ฃผ๋ฌธ์ ๋ฐ์ ๊ฐ๋ ฅํ ์ธ๊ณต์ง๋ฅ์ด ์ด ๊ฒ์ด๋ค."
์ฌ์ค, ํ๋ผ๋ฆฌ๋ย 'AI๊ฐ ๋์ ๊ธ์ฐ๊ธฐ๋ฅผ ๋์ฒดํ ์ ์์๊น'ย ๋ผ๋ ์ง๋ฌธ์ ๋ํ ๋ต์ ์ป๊ธฐ ์ํด ์คํ์ ํ๋ ํ์ต๋๋ค.ย <์ฌํผ์์ค> ์ถ๊ฐ 10์ฃผ๋
์ ๊ธฐ๋
ํ๋ ์๋ฌธ์ "ํ๋ผ๋ฆฌ ์คํ์ผ"๋ก ์จ ๋ฌ๋ผ'๊ณ ย GPT-3์๊ฒ ์ฃผ๋ฌธํ ๊ฒ์ด์ฃ . GPT-3๋ ํ๋ผ๋ฆฌ์ ์ฑ
๊ณผ ๋
ผ๋ฌธ, ์ธํฐ๋ทฐ ๋ฑ์ ๋์ด๋ชจ์ ์๋ฌธ์ ์์ฑํ๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ ๊ฝค๋ ๋๋ผ์ ์ต๋๋ค. ์ ์ฌ์ง์์ ๋ณด์
จ๋ค์ํผ, AI๊ฐ ์ผ๋ค๊ณ ์ง์ํ๊ธฐ ํ๋ค ๋งํผ ์์ฐ์ค๋ฌ์ด ๊ธ์ด ์์ฑ๋์๊ณ , ์ด๋ ํ ์์ ์์ด <์ฌํผ์์ค> 10์ฃผ๋
ํน๋ณํ์ ์๋ฌธ์ผ๋ก ์ถ๊ฐ๋์์ต๋๋ค.
ย
GPT-3๊ฐ ์ด๋ค ๋ชจ๋ธ์ธ์ง ๊ฐ์ด ์กฐ๊ธ ์ค์๋์?
๋ง์ต๋๋ค.ย GPT-3๋ย ํ
์คํธ ์์ฑ AI ๋ชจ๋ธ์
๋๋ค. โGenerative Pre-trained Transformer 3โ์ ์ฝ์๋ก, ์ฌ์ ํ์ต๋ Transformer๋ฅผ ์ด์ฉํ์ฌ ํ
์คํธ๋ฅผ ์์ฑํ๋ ๋ชจ๋ธ์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค.
์ง๋๋ฒ Generative AI์ ์ฒซ ๋ฒ์งธ ์ด์ผ๊ธฐ๋ก ๋ค๋ฃจ์๋ย GAN์ ๋น๋กฏํด GPT-3 ์ด์ ์ ๋ค๋ฅธ ์์ฑ ๋ชจ๋ธ๋ค๊ณผ ๋ค๋ฅธ ์ ์ย GPT-3๊ฐ ๐๐ปโโ๏ธ'์ด๊ฑฐ๋' ๋ชจ๋ธ์ด๋ผ๋ ์ ์
๋๋ค. 2020๋
OpenAI๊ฐ ๋ฐํํ ์ต์ด์ ์ด๊ฑฐ๋ AI ๋ชจ๋ธ GPT-3๋ฅผ ๊ธฐ์ ์ผ๋ก ์๋ง์ ๋๊ธฐ์
์์ ์๋คํฌ์ด ์ด๊ฑฐ๋ AI ๋ชจ๋ธ์ ๋ฐํํ๊ธฐ๋ ํ์์ฃ . ๋ํ์ ์ผ๋ก ๊ตฌ๊ธ์ Switch Transformers, ์นด์นด์ค์ KoGPT, ๋ค์ด๋ฒ์ HyperCLOVA๊ฐ ์์ต๋๋ค. ์ด ์ ๋๋ฉด GPT-3๊ฐ ์ด๊ฑฐ๋ AI ๋ชจ๋ธ ์์ฅ์ ๋ถ์ ์งํ ๋ํ์ ๊ณผ ๊ฐ์ ์ญํ ์ ํ๋ค๊ณ ๋ณผ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค.
์, ์ด์ ย GPT-3๊ฐ ๋๋์ฒด ๋ฌด์์ธ์ง, ๐๐ปโโ๏ธ'์ด๊ฑฐ๋ ๋ชจ๋ธ'์ย ํค์๋๋ก ์ผ์ ์์ธํ ๋ค์ฌ๋ค๋ด
์๋ค.
ย
ย
[ ๋ชฉ์ฐจ ]
INTRO1. ์ด๊ฑฐ๋ AI ๋ชจ๋ธ2. GPT-3์ ํ
์คํธ ์์ฑ ์๋ฆฌ3. GPT-3์ ๊ธฐ๋ฐ, Transformer ๊ตฌ์กฐ4. GPT-3๊ฐ ์ผ์ผํจ ๋ณํOUTRO์ฐธ๊ณ ๋ฌธํ ๋ฐ ์ถ์ฒ
ย
ย
1. ์ด๊ฑฐ๋ AI ๋ชจ๋ธ
'์ด๊ฑฐ๋' AI ๋ชจ๋ธ, ๋ฌด์์ด ๊ฑฐ๋ํ๋ค๋ ๊ฑธ๊น์?
๋ฐ๋ก, ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ 'ํ๋ผ๋ฏธํฐ ์'์
๋๋ค.
๐๐ปโโ๏ธ์ด๊ฑฐ๋ AI์ ์์์,ย '๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ต๋ํ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํ์ต์์ผ๋ณด์'๋ ์๋์์ ๋น๋กฏ๋์์ต๋๋ค. ๊ทธ๋์ย ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ฅผ ์
๋ ฅ์ผ๋ก ๋ฐ์ ์ค์ค๋ก ํ์ตํ ์ ์๋ ๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ฒ ๋ ๊ฒ์ด์ฃ .
์ค์ ๋กย GPT-3๋ ์ธํฐ๋ท์์ ์ป์ ์ ์๋ ๊ฑฐ์ ๋ชจ๋ ํ
์คํธ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ์ฌ์ ํ์ต๋์์ต๋๋ค. ์ปค๋จผ ํฌ๋กค๋ง(Common Crawling), ์ํคํผ๋์ ๋ฑ์ผ๋ก๋ถํฐ ์ป์ ํ
์คํธ๋ฅผ ํฌํจํด ํ์ต์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์
์ด ๋ฌด๋ ค 3,000์ต ๊ฐ๋ผ๊ณ ํฉ๋๋ค.
์ฌ๊ธฐ์, ๋ชจ๋ธ์ ์
๋ ฅ๋๋ย ๋ฐ์ดํฐ๊ฐ ๋์ด๋๋ฉด ๋น์ฐํ ๋ชจ๋ธ ๋ด์์ ์ผ์ด๋๋ย ์ฐ์ฐ์ ์๋ ๋ง์์ง๊ฒ ์ฃ ? ๐ํ๋ผ๋ฏธํฐ๊ฐ ๋ฐ๋ก ๊ทธ ์ฐ์ฐ์ ์ฐ์ด๋ ๋ชจ๋ธ ๋ด๋ถ์ ๋ณ์์
๋๋ค. ์๊ณ ๋ฆฌ์ฆ์ ํตํด ๊ฐย ํ๋ผ๋ฏธํฐ์ ๊ฐ์ ์ต์ ํํ๋ ๊ฒ์ด ๊ณง ์ฐ๋ฆฌ๊ฐ ํํย ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต์ํจ๋ค๊ณ ํ๋ ๊ฒ๊ณผ ๊ฐ์ ๋ง์ธ ์
์
๋๋ค.
์ด๊ฑฐ๋ AI๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ์๋ฅผย ์์ฒ์ต ๊ฐ์์ย ์์กฐ ๊ฐ๊น์ง ๋๋ฆฐ ๊ฒ์ ๋งํฉ๋๋ค. ์์ ์๋ฃ๋ฅผ ๋ณด๋ฉด, ์ฐ๋ฆฌ์ย GPT-3๋ 1,750์ต ๊ฐ, ๋ค์ด๋ฒ์ย Hyperclova๋ 2,040์ต ๊ฐ, ๊ตฌ๊ธ์ย LaMDA๋ 1์กฐ 6,000์ต ๊ฐ๋ ๋๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.
ย
๐๐ปโโ๏ธ์ด๊ฑฐ๋ AI์ ํ๋ผ๋ฏธํฐ๊ฐ ๋ค๋ฅธ AI ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํด ์ผ๋ง๋ ๋ง์ ๊ฒ์ธ์ง ์ ์๋ฟ์ง ์๋๋ค๊ณ ์?
์ ๊ทธ๋ฆผ์ ์ค๋ฅธ์ชฝ ์๋จ์ ํ๋ก ์๋ ๊ฒ์ด OpenAI์ GPT-3์
๋๋ค.
ย
๋ฐ๋ถ๋ถ์ ํ๋ํ๋ฉด ์ด๋ ์ต๋๋ค. GPT-3์ ์ ์ ์ธ GPT, GPT-2๋ ๋ณด์ด๊ณ , ๊ตฌ๊ธ์ BERT, Microsoft์ Turing-NLG๋ ์๋ค์. GPT-3๊ฐ ์ผ๋ง๋ ํ์ ์ ์ผ๋ก ํ๋ผ๋ฏธํฐ ์๋ฅผ ๋๋ ธ๋์ง ํ์ธํ ์ ์์ต๋๋ค.
์ด๋ ๊ฒ ํ๋ผ๋ฏธํฐ์ ์๋ฅผ ๋๋ฆฌ๋ ์ด์ ๋, ์ด๋ก ์ ํ๋ผ๋ฏธํฐ ์๊ฐ ๋ง์์๋ก AI์ ์ง๋ฅ์ด ๋์์ง๊ณ , ๋ ์ ๊ตํ ํ์ต์ ํ ์ ์๊ธฐ ๋๋ฌธ์
๋๋ค.
์ ๋ฆฌํ์๋ฉด,
'์ด๊ฑฐ๋' ๋ชจ๋ธ์ด๋, ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ย ํ๋ผ๋ฏธํฐ ์๊ฐย '์ด๊ฑฐ๋'ํ๋ค๋ ๊ฒ์ด๊ณ ,
๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ์๊ฐ ๋ง์์๋ก AI์ ์ฑ๋ฅ์ด ์ข์์ง๋ ๊ฒฝํฅ์ ๋ณด์ธ๋ค๊ณ ํ ์ ์๊ฒ ๋ค์.
ย
ย
2. GPT-3์ ํ ์คํธ ์์ฑ ์๋ฆฌ
๋๊ท๋ชจ ๋ฐ์ดํฐ์ 1,750์ต ๊ฐ๋ ๋๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง๊ณ GPT-3๋ ์ด๋ป๊ฒ ํ
์คํธ๋ฅผ ์์ฑํ ๊น์?
๊ธฐ๋ณธ์ ์ผ๋ก GPT-3๋ ์ธ์ด ๋ชจ๋ธ(Language Model)์
๋๋ค. ์ธ์ด ๋ชจ๋ธ์ด๋, ์ฝ๊ฒ ๋งํด ๊ธฐ๊ณ๊ฐ ์ธ๊ฐ์ ์ธ์ด๋ฅผ ์ดํดํ๊ณ ๊ตฌ์ฌํ ์ ์๋๋ก ํ๋ AI ๋ชจ๋ธ์
๋๋ค. ์ฐ๋ฆฌ๊ฐ ์ผ์์ํ์์ ๋ณผ ์ ์๋ ์๋ก, โ์๋ฆฌโ๋ โ๋น
์ค๋นโ์ ๊ฐ์ ์์ฑ ๋น์, ์ฑ๋ด ๋๋ ์๋ ๋ฒ์ญ ๋ฑ์ด AI ์ธ์ด ๋ชจ๋ธ๋ก ๋ง๋ค์ด์ง ๊ธฐ์ ์
๋๋ค.
์กฐ๊ธ ๋ ๊ตฌ์ฒด์ ์ผ๋ก ์ดํด๋ณด๋ฉด, AI ์ธ์ด ๋ชจ๋ธ์ด ํ๋ ์ผ์ ๋จ์ด๋ค๋ก ์ด๋ฃจ์ด์ง ํ
์คํธ(์ํ์ค)์ ํ๋ฅ ์ ํ ๋นํ๋ ์ผ์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค. ์ด๋ค ํ
์คํธ๊ฐ ์ฃผ์ด์ก์ ๋, ์ธ์ด ๋ชจ๋ธ์ด ๊ฐ ๋จ์ด์ ํ๋ฅ ์ ๋ถ์ฌํจ์ผ๋ก์จ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ ์ ์๋๋ก ํ๋ ๊ฒ์ด์ฃ . ์ด๋ ๊ฒ ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ํ๋์ฉ ์์ธกํ๋ ๊ณผ์ ์ ๋ฐ๋ณตํด ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด ๋จ์ด ์ํ์ค๋ฅผ ์ฐพ์๋ด๋ ์์
์ ์ธ์ด ๋ชจ๋ธ๋ง(Language Modeling)์ด๋ผ๊ณ ํฉ๋๋ค.
๋จ์ด ์ํ์ค์ ํ๋ฅ ์ ๋ถ์ฌํ๋ ์ผ์ด ์ ํ์ํ ๊น์? ์ด๋ค ํ
์คํธ๊ฐ ์ฃผ์ด์ก์ ๋, ์ฐ๋ฆฌ ์ธ๊ฐ์ ๊ทธ๊ฐ ์ด์์ค๋ฉด์ ์ถ์ ํด ์จ ๊ฒฝํ์ ๋ฐํ์ผ๋ก ํด๋น ํ
์คํธ์ ๋งฅ๋ฝ์ ์์ฐ์ค๋ฝ๊ฒ ํ์
ํ๋ ๋ฅ๋ ฅ์ ๊ธฐ๋ณธ์ ์ผ๋ก ๊ฐ์ถ๊ณ ์์ต๋๋ค. ๊ทธ๋์ ํน๋ณํ ๋
ธ๋ ฅ์ ๋ค์ด์ง ์์๋ ๋งฅ๋ฝ์ ํตํ ์ ์ถ๊ฐ ๊ฐ๋ฅํ์ฃ .
์๋ฅผ ๋ค์ด, โ๋ฅ๋ค์ด๋ธ๋ ํฅ๋ฏธ๋ก์ด ๋ฅ๋ฌ๋ ๋ ผ๋ฌธ๋ค์ ____.โ๋ผ๋ ๋ฌธ์ฅ์ด ์ฃผ์ด์ก์ ๋, ๋น์นธ์ ์ ์ ํ ๋ง์ ๋ฌด์์ผ๊น์? 1. ์๊ฐํ๋ค 2. ํ๊ดดํ๋ค 3. ๋จน๋๋ค 4. ์ข๋ค 5. ์๋๋ค
1๋ฒ โ์๊ฐํ๋คโ๊ฐ ๊ฐ์ฅ ์์ฐ์ค๋ฝ์ต๋๋ค. ๋๋ฌด ์ฝ์ฃ ?๐
์ด์ ์ปดํจํฐ์๊ฒ ๊ฐ์ ๋ฌธ์ ๋ฅผ ๋๋ค๊ณ ์๊ฐํด ๋ด
์๋ค. ์ปดํจํฐ์๊ฒ๋ ๋ชจ๋ ํ
์คํธ๊ฐ ๊ทธ์
0
๊ณผ 1
๋ก ์ด๋ฃจ์ด์ง ์ฝ๋์ ๋ถ๊ณผํ ๋ฟ์
๋๋ค. ์ซ์๋ก ํํ๋ ๋ช
ํํ ๊ธฐ์ค์ด ์์ด์ผ ์ ์ถ๊ฐ ๊ฐ๋ฅํ์ฃ . ๊ทธ๋์, ํ์ต์ ํตํด ๋จ์ด์ ํ๋ฅ ์ ๋ถ์ฌํ๋ ๊ฒ์
๋๋ค. ์ด ํ๋ฅ ์ด ์ปดํจํฐ๊ฐ โ์์ฐ์ค๋ฌ์โ์ ํ๋จํ ์ฒ๋๊ฐ ๋์ด์ฃผ๋ ๊ฒ์ด์ฃ . ๋ง์ผ ํ์ต์ด ๋ ์ธ์ด ๋ชจ๋ธ์๊ฒ ์ ๋ฌธ์ ๊ฐ ์ฃผ์ด์ง๋ค๋ฉด, ํด๋น ๋ชจ๋ธ์ ๋จผ์ ๋น์นธ์ ๋ค์ด๊ฐ ํ๋ณด ๋จ์ด๋ค์ด ๋น์นธ์ ์ฌ ํ๋ฅ ์ ๊ฐ๊ฐ ๋ถ์ฌํ ๊ฒ์
๋๋ค. 1๋ฒ โ์๊ฐํ๋คโ๋ 95%, 2๋ฒ โํ๊ดดํ๋คโ๋ 23%, โฆ ๋ฑ๋ฑ ๋ชจ๋ ํ๋ณด์ ๋ํด ํ๋ฅ ์ ๊ณ์ฐํ ๋ค ๊ฐ์ฅ ๋์ ํ๋ฅ ์ ๊ฐ์ง ํ๋ณด๋ฅผ ์ฑํํ ๊ฒ์
๋๋ค. ํ์ต์ด ์ ๋ ๋ชจ๋ธ์ด๋ผ๋ฉด ๋น์ฐํ 1๋ฒ โ์๊ฐํ๋คโ๋ฅผ ๊ฐ์ฅ ๋์ ํ๋ฅ ๋ก ์์ธกํ๊ฒ ์ฃ ?
์ ๋ฆฌํ์๋ฉด, ์ธ์ด ๋ชจ๋ธ GPT-3๊ฐ ํ
์คํธ๋ฅผ ์์ฑํ๋ ๋ฐฉ์์ ์ฃผ์ด์ง ์ํ์ค๋ฅผ ๋ฐํ์ผ๋ก, ํ๋ฅ ์ ๊ธฐ๋ฐํด, โ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ์์ธกโํ๋ ๊ฒ์
๋๋ค. N ๊ฐ์ ๋จ์ด๋ฅผ ๊ฐ์ง๊ณ N+1๋ฒ์งธ์ ์ฌ ๋จ์ด๋ฅผ ์์ธกํ๋ ๊ฒ์ด์ฃ . ์ดํด๋ฅผ ๋๊ธฐ ์ํด, GPT-3๊ฐ ํ๋ ์ผ์ ์์ดํฐ์ ์๋ ์์ฑ ๊ธฐ๋ฅ์ ๋น์ ํ ์ ์์ต๋๋ค. ํ๋ณด๊ฐ ๋๋ ๋จ์ด ์ค ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด(๋์ ํ๋ฅ ์ ๊ฐ์ง) ๋จ์ด๋ง์ ๊ณ์ ์ ํํด ๋๊ฐ๋ฉฐ ํ
์คํธ๋ฅผ ์์ฑํด ๋๊ฐ๋ ๊ฒ์
๋๋ค.
ย
ย
3. GPT-3์ ๊ธฐ๋ฐ, Transformer ๊ตฌ์กฐ
์์ GPT-3๋ฅผ ๋น๋กฏํ ์ธ์ด ๋ชจ๋ธ๋ค์ด ํ๋ฅ ์ ๊ธฐ๋ฐ์ผ๋ก ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ์์ธกํ๋ค๊ณ ๋ง์๋๋ ธ์ต๋๋ค. ๊ทธ๋ ๋ค๋ฉด, GPT-3๋ ์ด ํ๋ฅ ์ ์ด๋ป๊ฒ ๊ณ์ฐํ๋ ๊ฑธ๊น์? ๊ทธ ํต์ฌ์ GPT-3์ ๊ธฐ๋ฐ์ธ Transformer์ ์์ต๋๋ค. Transformer๋ 2017๋
๊ตฌ๊ธ์ด ๋ฐํํ ๋
ผ๋ฌธ โAttention Is All You Needโ์์ ์๊ฐ๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ก, ํ์ฌ ์์ฐ์ด ์ฒ๋ฆฌ ๋ถ์ผ์์ ๋งค์ฐ ์ค์ํ ์ญํ ์ ํ๊ณ ์๋ ๋ชจ๋ธ ์ค ํ๋์
๋๋ค.
โ๐ป๋จผ์ , Transformer๋ ํฌ๊ฒ ์ธ์ฝ๋(์ผ์ชฝ)์ ๋์ฝ๋(์ค๋ฅธ์ชฝ) ๋ ๋ถ๋ถ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ธ์ฝ๋์์๋ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ์ด๋ฅผ ๋ฒกํฐํ ์ํค๊ณ , ๋์ฝ๋์์๋ ๋ฒกํฐํ๋ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ๋ ๋ค๋ฅธ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์์ฑํด ์ถ๋ ฅํฉ๋๋ค. ์ฐ๋ฆฌ๊ฐ ์ดํด๋ณด๊ณ ์๋ GPT-3๋ ์ด ์ค์์๋ ๋์ฝ๋๋ง์ ์์ ์ฌ๋ฆฐ ๊ฒ์ธ๋ฐ์. ๋์ฝ๋๋ง์ ์ฌ์ฉํ๋ค๋ ๊ฒ์, ์ถฉ๋ถํ ์์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ ์ ํ์ต์ํจ ๋ค, ์๋ก์ด ์ํ์ด ๋ค์ด์์ ๋ ๋ฒกํฐํ๋ ๋ด์ฉ์ ๋ฐํ์ผ๋ก ๊ทธ์ ํด๋นํ๋ ํ ์คํธ๋ฅผ ์๋ก ์์ฑํด ๋ด๋ ๋ฐ์ ์ด์ ์ด ๋ง์ถฐ์ ธ ์๋ค๊ณ ํ ์ ์์ต๋๋ค. ์ฐธ๊ณ ๋ก ๋ฒกํฐํ(Vectorizing)๋, ์ฝ๊ฒ ๋งํด ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ธ๊ฐ์ด ์ดํดํ๊ธฐ ์ฌ์ด ํํ(ํ ์คํธ)์์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ์ดํดํ๊ธฐ ์ฌ์ด ํํ(๋ฒกํฐ)๋ก ๋ณํํ๋ ๊ณผ์ ์ ๋งํฉ๋๋ค.
โ๐ปTransformer์ ๋ ๋ค๋ฅธ ํน์ง์ผ๋ก Attention ๊ธฐ๋ฒ์ด ์์ต๋๋ค. Attention ์ด๋, โํด๋น ์ํ์ค์ ์ด๋ ๋ถ๋ถ์ ์ง์คํ ๊ฒ์ธ๊ฐโ์ ๊ด๋ จ์ด ์์ต๋๋ค. ์ฌ๋์ด ํ ์คํธ ๋ฒ์ญ์ ํ ๋์๋, ๋งค ์๊ฐ ๋ชจ๋ ๋จ์ด์ ์ง์คํ์ง ์์ฃ . ํ์ฌ ๋ฒ์ญํ๋ ค๋ ๋จ์ด์ ๊ด๋ จ ์๋ ๋จ์ด์ ๊ฐ์ฅ ์ง์คํ๋ฉด์ ๋ฒ์ญ์ ํ ๊ฒ์ ๋๋ค. ๋ฐ๋ก ์ด ์ ์ ์ด์ฉํ ๊ฒ์ด Attention ๊ธฐ๋ฒ์ ๋๋ค. GPT ๊ณ์ด ๋ชจ๋ธ์์ ์ฌ์ฉํ๋ Attention์ Self Attention์ ์ฌ๋ฌ ๋ฒ ์ํํ๋ ๊ฒ์ ์๋ฏธํ๋ Multi-Head Attention์ธ๋ฐ์. Self Attention์, ๊ฐ๋จํ ๋งํด ์ํ์ค ๋ด ๋จ์ด๋ค ๊ฐ์ ์ฐ๊ด์ฑ์ ํ์ ํด ์ ์๋ก ๋ํ๋ด๋ ์์ ์ ๋งํฉ๋๋ค. ์ด ์ ์(Attention Score)๋ฅผ ํตํด ํ์ฌ ์์ ์์ ์ด๋ค ๋จ์ด์ ์ง์คํด์ผ ํ ์ง ์ ์ ์๊ฒ ๋๋ ๊ฒ์ด์ฃ .
์ด์ ์ ๊ทธ๋ฆผ์ ์์ธํ ๋ณด๋ฉด, Transformer์ ๋์ฝ๋ ์์
Embedding
, Positional Encoding
, Multi-Head Attention
, Feed Forward
๋ฑ ์ฌ๋ฌ layer๊ฐ ์๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค. ์ด๋ค ํ
์คํธ๋ฅผ ์
๋ ฅํ๋ฉด, ์ด layer๋ค๋ก ๊ตฌ์ฑ๋ N ๊ฐ์ ๋์ฝ๋ ๋ธ๋ก๋ค์ ๊ฑฐ์ณ ์ต์ข
์ ์ผ๋ก ์์ธก๋ ํ๋ฅ , ์ฆ Output Probabilities
๊ฐ ๋์ด ๋์ค๋ ๊ฒ์
๋๋ค. ์ฐ๋ฆฌ์ ๋ชฉํ๋ GPT-3์ ๋ํ ์ ๋ฐ์ ์ธ ์ดํด์ด๋ฏ๋ก, Transformer์ ๋ํ ์ค๋ช
์ ์ฌ๊ธฐ์ ๋ง๋ฌด๋ฆฌํ๊ฒ ์ต๋๋ค๐์ค์ํ ๊ฒ์ Transformer์ ๋์ฝ๋๊ฐ ์ผ๋ จ์ layer๋ค์ ๊ฑฐ์ณ ์ต์ข
์ ์ผ๋ก ๋ค์ ์ฌ ๋จ์ด์ ๋ํ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํ๋ค๋ ๊ฒ์
๋๋ค!
ย
ย
4. GPT-3๊ฐ ์ผ์ผํจ ๋ณํ
GPT-3๋ ํน์ ํ ๋ชฉ์ ์ ๋ง์ถฐ ์ค๊ณ๋ AI๊ฐ ์๋๋ผ, ์ด๋ ํ ๋ชฉ์ ์ ์์
์๋ ์ค์ํ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ฒ์ฉ ์ธ๊ณต์ง๋ฅ(AGI, Artificial General Intelligence) ๋ชจ๋ธ์
๋๋ค. ์ด๋ ๋ฐ๋์ ๋๋ ์ผ์๋ง ํนํ๋ โ์ํ๊ณ โ์ ๋ฌ๋ฆฌ, ์ธ๊ฐ๊ณผ ๋น์ทํ ์ง๋ฅ์ผ๋ก ์ฌ๊ณ ํ๊ณ ํ๋จํ๋ฉฐ ํญ๋์ ์์
์ ์ํํ๋ AI๋ผ๋ ๋ป์
๋๋ค.
GPT-3 ์ด์ ์ ์ฌ์ ํ์ต ๋ชจ๋ธ๋ค์์๋, ์ํํ๊ณ ์ ํ๋ ์์
์ ๋ง๊ฒ ์ถ๊ฐ๋ก ํ์ต์ ์งํํ๋ Fine-Tuning(๋ฏธ์ธ ์กฐ์ ) ๊ณผ์ ์ด ํ์ํ๋๋ฐ์. ์ด๋ฅผ ์ํ ๋ฐ์ดํฐ ์
์ ๋ง๋๋ ๋ฐ์๋ ์๋นํ ์์๊ณผ ๋น์ฉ์ด ๋ค์ด๊ฐ๋ค๋ ๋ฌธ์ ์ ์ด ์์์ต๋๋ค.
๊ทธ๋ฌ๋ GPT-3๋ โ์ด๊ฑฐ๋โ ๋ชจ๋ธ์ด๋ผ๋ ๋ช
์์ ๋ง๊ฒ โ์ด๊ฑฐ๋โํ ๋ฐ์ดํฐ ์
์ ์ด์ฉํด ํ์ต๋์๊ธฐ ๋๋ฌธ์, Fine-Tuning์ ๊ฑฐ์น์ง ์๊ณ , ๋ช ๊ฐ์ง ์์๋ง ๋ฐ์ ๋ฐ๋ก ์์
์ ์ํํ๋ Few-Shot Learning ๋ฐฉ์์ผ๋ก๋ ์ฌ๋งํ ์ฑ๋ฅ์ ๋ธ๋ค๋ ์ด์ ์ ๊ฐ์ง๋๋ค. ์ด๋ฅผ ํตํด ์ํํ๊ณ ์ ํ๋ ํน์ ์์
, ์ฆ Downstream Task๋ฅผ ์ด๋ป๊ฒ ์ํํ ๊ฒ์ธ๊ฐ์ ์์ด, ๋ชจ๋ธ์๊ฒ ์ ์ ํ ์ง๋ฌธ์ ํจ์ผ๋ก์จ ๋ต์ ์ด๋์ด๋ด๋ ํ๋กฌํํธ ์์ง๋์ด๋ง(Prompt Engineering)์ ์ค์์ฑ ๋ํ ์๋กญ๊ฒ ๋๋๋์์ต๋๋ค.
โํ๋กฌํํธโ ํ๋ฉด ๋ ์ค๋ฅด๋, ์์ฆ ๊ฐ์ฅ ํ์ ๊ฐ ๋๊ณ ์๋ ๋ชจ๋ธ์ด ์์ต๋๋ค. 2022๋ 11์ ๊ณต๊ฐ๋์ด ํ์ฌ ๊ฐ์ฅ ๋ง์ ํ์ ์ ๋ ผ๋์ ๋ถ๋ฌ์ผ์ผํค๊ณ ์๋ ๋ํํ ์ธ๊ณต์ง๋ฅ ChatGPT์ธ๋ฐ์. ์ด ๋ํ ํ๋กฌํํธ์ ํ ์คํธ๋ฅผ ์ ๋ ฅํ๋ฉด, ๊ทธ์ ๋ํ ๋ต๋ณ์ด ์ถ๋ ฅ๋๋ ๋ฐฉ์์ด์ฃ . ChatGPT๋ GPT-3๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. ๋ฌผ๋ก , ์๋ฐํ ๋งํ๋ฉด GPT-3๋ฅผ ์๋น์ค ๊ฐ๋ฅํ ์ฑ๋ด์ผ๋ก ๋ง๋ค๊ธฐ ์ํด ์ค๋ฅ๋ฅผ ๊ต์ ํ๊ณ , ํธํฅ์ ์ํํด ์ ๊ทธ๋ ์ด๋ํ GPT-3.5๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก๋ค๊ณ ํ ์ ์์ฃ . ์ด์จ๋ , ๋ง์น ์ฌ๋์ด ์ด ๊ฒ ๊ฐ์ ๊ธ์ ๋ง๋ค์ด๋ด๋ฉฐ ์ฐ์ผ ์ธ์์ ๋๋ผ๊ฒ ํ๊ณ ์๋ ChatGPT์ ์ ๋ณ์๋ GPT-3๊ฐ ์์ต๋๋ค.
๋ฏธ๊ตญ์ ์ ๋์ฝ ๊ธฐ์ Jasper(์ฌ์คํผ)๋ GPT-3๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์นดํผ ๋ผ์ดํธ๋ฅผ ๋ง๋ค์ด์ฃผ๋ ์ฝํ ์ธ ์์ฑ ๋๊ตฌ Jasper.ai๋ฅผ 2021๋ ๊ฐ๋ฐํ์ต๋๋ค. ์ฌ์ฉ์๋ Jasper ์๋น์ค๋ฅผ ์ด์ฉํด ๋ธ๋ก๊ทธ ๊ธ, ์์ ๋ฏธ๋์ด ๊ฒ์๋ฌผ, ์ด๋ฉ์ผ ๋ฑ ๊ฐ์ธ ๋๋ ๊ธฐ์ ์ ๋์งํธ ์ฝํ ์ธ ์ ํฌํจ๋ ํ ์คํธ๋ฅผ ์์ฑํ ์ ์๋ค๊ณ ํ๋๋ฐ์. ๋ฏธ๊ตญ์ ๋น์ฆ๋์ค ์ ๋ฌธ ๋งค์ฒด ์ํฌ(Inc.)๋ 2022๋ 8์, Inc.5000์ ํตํด Jasper๋ฅผ โ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ์ฑ์ฅํ๋ ๋ฏธ๊ตญ์ ๋ฏผ๊ฐ ๊ธฐ์ ์ค ํ๋โ๋ก ์ ์ ํ๊ธฐ๋ ํ์ต๋๋ค. ์ด๋ GPT-3๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์๋น์ค๊ฐ ๋จ์ํ ์ฌ์ค์ ์ ๋ฌํ๋ ํ ์คํธ๋ฅผ ๋์ด, ์ฐฝ์์ฑ์ ์ํ๋ ๋ถ์ผ์์๋ ํจ์จ์ ์ผ๋ก ํ ์คํธ๋ฅผ ์์ฑํด ๋ผ ์ ์์์ ๋ปํฉ๋๋ค.
๊ตญ๋ด์์๋ GPT-3๋ฅผ ์ด์ฉํ ํ๊ตญ์ด ๋ชจ๋ธ ๊ฐ๋ฐ์ด ์ด๋ฃจ์ด์ก์ต๋๋ค. ๋ํ์ ์ผ๋ก ์นด์นด์ค๋ธ๋ ์ธ์ KoGPT์ SKํ ๋ ์ฝค์ ์์ด๋ท์ด ์์ต๋๋ค. KoGPT๋ ์นด์นด์ค์ ์ํ์ฌ์ธ ์นด์นด์ค๋ธ๋ ์ธ์์ 21๋ 11์ ๋ฐํ๋ ๋ชจ๋ธ์ด๊ณ , ์์ด๋ท์ SKํ ๋ ์ฝค์์ 22๋ 5์ ๋ฐํ๋ ๋ชจ๋ธ๋ก, ๋ ๋ชจ๋ธ ๋ชจ๋ GPT-3์ โํ๊ตญ์ด ํนํ ๋ฒ์ โ์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค. GPT-3๊ฐ ์์ด๋ก๋ง ์ฌ์ ํ์ต๋์๊ธฐ ๋๋ฌธ์, GPT-3๋ฅผ ์ด์ฉํ ํ๊ตญ์ด ์๋น์ค๋ฅผ ๋ง๋ค๊ธฐ ์ํด์๋ ์ด์ ๊ฐ์ ํ๊ตญ์ด ํนํ ๋ชจ๋ธ์ ํ์์ฑ์ด ํด ์๋ฐ์ ์์ต๋๋ค. ์ด ๋ชจ๋ธ๋ค์ ๊ธฐ์ ์ผ๋ก ๊ตญ๋ด์์๋ GPT-3๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ง์ ํ๊ตญ์ด ์๋น์ค๊ฐ ๊ฐ๋ฐ๋ ์ ์๊ธฐ ๋๋ฌธ์, ๊ทธ ์๋ฏธ๊ฐ ํฌ๋ค๊ณ ํ ์ ์์ต๋๋ค.
ย
ย
OUTRO
์ง๊ธ๊น์ง ์ด๊ฑฐ๋ ์ธ์ด ์์ฑ ๋ชจ๋ธ, GPT-3์ ๋ํด ์์๋ณด์์ต๋๋ค๐ GPT-3๋ ๋ชจ๋ธ์ ๊ท๋ชจ์ ๊ทธ ์ฑ๋ฅ์ผ๋ก ๋ง์ ๊ด์ฌ์ ๋ฐ์ผ๋ฉฐ, AI ์
๊ณ์ ์๋ก์ด ํ์ ์ ๋ถ๋ฌ์ผ์ผ์ผฐ์ฃ . GPT-3 ๊ธฐ๋ฐ ์๋น์ค๋ค์ ํ์ฝ์์ ๋ณด๋ฉฐ, ์์ผ๋ก ์ผ๋ง๋ ๋ โ์ธ๊ฐ๋ค์ดโ ํ
์คํธ๋ฅผ ์์ฑํ๋ ๋ชจ๋ธ๋ค์ด ๋์ฌ์ง ์ ๋ง ๊ธฐ๋๊ฐ ๋ฉ๋๋ค๐ค
ย
The GPT-3 hype is way too much. Itโs impressive (thanks for the nice compliments!) but it still has serious weaknesses and sometimes makes very silly mistakes. AI is going to change the world, but GPT-3 is just a very early glimpse. We have a lot still to figure out.
- OpenAI CEO Sam Altman
๋ง์ง๋ง์ผ๋ก GPT-3๋ฅผ ๊ฐ๋ฐํ OpenAI ์ฌ์ ๋ํ Sam Altman์ด ํธ์ํฐ์ ๋จ๊ธด ๋ง์ ์๊ฐํ๋ฉฐ ์ด๋ฒ ํฌ์คํ
์ ๋ง๋ฌด๋ฆฌํ๊ฒ ์ต๋๋ค. Sam Altman์ ๋ฐ๋ฅด๋ฉด, GPT-3๋ ์ฌ์ ํ ์ฝ์ ์ด ์๊ณ , ์ค์๋ฅผ ํ๊ธฐ๋ ํ๋ฉฐ, AI๊ฐ ์ธ์์ ๋ฐ๊พธ๋ ์ฌ์ ์ GPT-3๊ฐ ๊ทธ์ ์ฒซ ๋ฐ์ ๋ด๋ ๊ฒ๋ฟ์ด๋ผ๊ณ ํฉ๋๋ค. GPT-3๋ฅผ ๋น๋กฏํ AI ์์ฑ ๋ชจ๋ธ๋ค์ด ๋ง์น โ์์ ์งํก์ดโ ๊ฐ์ ๋ณด์ด๋ ์์ฆ์ด์ง๋ง, ์ฐ๋ฆฌ๋ ์์ง ๋์๊ฐ์ผ ํ ๊ธธ์ด ๋ง์ด ๋จ์ ์์ต๋๋ค. Generative AI์ ๋ฐ์ ์ ํ์ฌ์งํํ์
๋๋ค!๐ซก
ย
ย
์๋ํฐ

ย
ย
ย
์ฐธ๊ณ ๋ฌธํ ๋ฐ ์ถ์ฒ
[1] GPT-3 ๊ด๋ จ ๋
ผ๋ฌธ: [2005.14165] Language Models are Few-Shot Learners (arxiv.org)
[2] ์ธ์ด ๋ชจ๋ธ ๊ด๋ จ ์ํค๋
์ค: 03-01 ์ธ์ด ๋ชจ๋ธ(Language Model)์ด๋? - ๋ฅ ๋ฌ๋์ ์ด์ฉํ ์์ฐ์ด ์ฒ๋ฆฌ ์
๋ฌธ (wikidocs.net)
[3] ์ด๊ฑฐ๋ AI ๊ด๋ จ ๊ธฐ์ฌ: ๊ตฌ๊ธ, ๋ค์ด๋ฒ, LG ๋ฑ ๊ตญ๋ด์ ์ด๊ฑฐ๋ AI ๊ฐ๋ฐใ
ฃ๋ฅ๋ฌ๋ใ
ฃํ๋ผ๋ฏธํฐใ
ฃ๋๋คใ
ฃํ์ดํผํด๋ก๋ฐใ
ฃOpenAI - ํฌ์ด์ปจ์คํ
(2e.co.kr)
[4] GPT-3 ๊ด๋ จ ์ํฐํด: [ํ
ํฌ ์คํ ๋ฆฌ] ์์ด๋ท์ ์ ์ฉ๋ ๊ฑฐ๋์ธ์ด๋ชจ๋ธ GPT-3๊ฐ ๋ฌด์์ผ๊น? โ SKํ
๋ ์ฝค ๋ด์ค๋ฃธ (sktelecom.com)
ย
ย
๋ฌธ์์ฌํญ manager@deepdaiv.com
ย