INTRO
AI๊ฐ ์ธ๊ฐ์ ๋ฐ์ด๋์ ์ ์๋๋ ์๋๋๋ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์์ ์ฌ์ ํ ๋จ๊ฑฐ์ด ๊ฐ์๋ก ์๋ฆฌ์ก๊ณ ์์ต๋๋ค. ์ธ๊ฐ์ ๋
์ฐฝ์ฑ, ์ง๊ด ๋ฑ์ ์๋ ๊ทธ๋๋ก ๋ฐํํ ์ ์๋ ์์ ๋ถ์ผ์์๋ AI๋ ๋๋ฌด๋ ์ฐฝ์์ ์ธ ์ํ์ ๋ง๋ค์ด๋ด๊ธฐ ๋๋ฌธ์ ์ฐ๋ฆฌ์๊ฒ ๋๋ผ์๊ณผ ์ถฉ๊ฒฉ์ ๋์์ ์๊ฒจ์ฃผ๊ณ ์์ต๋๋ค.
ย
์ธ๊ณต์ง๋ฅ์ด ์ฐฝ์์ ์ฃผ์ฒด๊ฐ ๋ ์ ์์๊น์?
์ด๋ฌํ ์ง๋ฌธ์ ์ฌ์์ ํ๊ธฐ ์์, ์ฐ๋ฆฌ๊ฐ ๋จผ์ ์๊ฐํด์ผ ํ ์ ์ AI๋ ์ธ๊ฐ์ ํ๊ณ๋ฅผ ๋ณด์ํ ์ ์๋ ์กฐ๋ ฅ์๊ฐ ๋ ์ ์๋ค๋ ๊ฒ์
๋๋ค. AI๋ ์ฐ๋ฆฌ์๊ฒ ๋ง์ ํธ๋ฆฌํจ์ ๊ฐ์ ธ๋ค ์ฃผ์์ผ๋, ์์ง ์์ ๋ถ์ผ์์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ํจํด ์์
์ด๋ผ๋ ์ธ์์์ ๋ฒ์ด๋์ง ๋ชปํ๋ค๋ ํ๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ํ์
์ ํตํด ๊ฐ์ ๋ฑ์ ์ ์ฑ์ ์ธ ์์๋ฅผ AI์ ๋ถ์ฌํ๋ค๋ฉด ์์ ํ ์์ ์ํ์ผ๋ก์ ๊ฐ์น๋ฅผ ์ธ์ ๋ฐ์ ์ ์์ง ์์๊น์?๐
ย
๋ง์ ๊ธฐ์ ์ ๋ฐ์ ์ผ๋ก ๋ฌธํ, ์์ ๋ถ์ผ์ ํจ๋ฌ๋ค์์ด ๋ฐ๋๊ณ ์์ต๋๋ค. ๊ฐ์ธ์ โ๋์งํธ ๋ฌธํด๋ ฅโ ํฅ์์ด ์์์ ์์ ์ ๋ฌธ๊ฐ ์ง๋จ์๋ง ๊ตญํ๋๋ ๊ฒ์ด ์๋๊ฒ ๋๋ฉด์, ๋๊ตฌ๋ ์ฝ๊ฒ ์ฐฝ์์๊ฐ ๋ ์ ์๋ ์๋๊ฐ ๋์์ต๋๋ค. ๋ํ, SNS์ ๋ฐ๋ฌ๋ก ๋ฌธํ์ ํ์ฐ์ด ๊ฐ์ํ๋๋ ์ค์
๋๋ค.
๊ทธ ์ค ์์
์์ญ์ ์ธ๊ณต์ง๋ฅ์ด ๋์
๋๋ ์ฌ๋ก๊ฐ ์ฆ๊ฐํ๊ณ ์์ผ๋ฉฐ ์ด๋ฏธ์ง ์ธ์, ์์ฐ์ด ์ฒ๋ฆฌ, ์์ฑ ์ธ์ ๊ธฐ์ ์ ํ์ฉํ์ฌ ์๊ณก, ๋ฎค์ง ํ๋ก๋์ฑ, ํผํฌ๋จผ์ค ๋ฑ์ ์ ์ฉ๋๊ณ ์์ต๋๋ค. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ์ธ๊ณต์ง๋ฅ์ ์๋ฆฌ๋ฅผ ํ์ต์์ผ ์๊ณ ๋ฆฌ์ฆ์ ํ์ฑํ๊ณ , ๊ธฐ์กด์ ์ฐฝ์๋ ์ํ์ ๊ธฐ๋ฐ์ผ๋ก ์์
์ ์๋ ์์ฑํฉ๋๋ค. ํด๋น ์ํฐํด์ ํตํด ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ด ๋ง์ ์์ ๊ฐ๋ค์๊ฒ ์๊ฐ์ ์ ๊ณตํ๊ณ ์๋ค๋ ์ฌ์ค๊ณผ ๋๋ถ์ด ํฅํ ์์ ์ ๊ฐ์น๊ฐ ์๋ ์ตยท๋ณตํฉ ์ฝํ
์ธ ์ ์์ผ๋ก์จ ์ ๋ง๊ณผ ์ฐ๊ตฌ์ ํ์์ฑ์ ๋ํด ๋
ผํ๊ณ ์ ํฉ๋๋ค.
ย
ย
[ ๋ชฉ์ฐจ ]
INTRO1. ์์
๊ณ์์์ ๋ฅ๋ฌ๋, ํ ์งํ2. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ์๋ฆฌ2.1. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ MIDI ์๋ ์์ฑ ์๋ฆฌ2.2. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ DDSP์ ์๋ฆฌ3. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ์์
์ฝํ
์ธ ์ ์ ์ฌ๋ก3.1. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ AIVA๋ฅผ ํ์ฉํ Melody ์ ์3.2. Tone Transfer๋ฅผ ํ์ฉํ Sound Design๊ณผ ์์ ๋ฆฌ์์ค ์ ์3.3. Prosody๋ฅผ ํตํ AI ์์ฑ ํ์ฉ ๋ฐ ์์ ๋ฆฌ์์ค ์ ์4. ์ธ๊ณต์ง๋ฅ์ ํ์ฉํ ์ต๋ณตํฉ ์์ ์ฝํ
์ธ ์ ์์ ๋ฐฉํฅ์ฑOUTRO์ฐธ๊ณ ๋ฌธํ ๋ฐ ์ถ์ฒ
ย
ย
1. ์์ ๊ณ์์์ ๋ฅ๋ฌ๋, ํ ์งํ
๋ฅ๋ฌ๋ ๊ธฐ์ ์ ์ธ๊ฐ๊ณผ ์ ์ฌํ ๋ฐฉ์์ผ๋ก ์ฌ๊ณ ํ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ชจ๋ธ๋งํ์ฌ ๋ง์ ์์ฒด๋ฅ ๋ถ์ผ์ ์ํฅ์ ๋ฏธ์น๊ณ ์์ต๋๋ค. ์์
์์ญ์์ ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ์ธ๊ณต์ง๋ฅ์ด ๊ธฐ์กด์ ์ฐฝ์๋ ์์
์ํ์ ํ์ตํ์ฌ ์์ ๋ฐ๋๐ผ, ์๊ณก๊ฐ์ ์์
์ ์ฑํฅ๐ต, ์์
์ ํจํด๐ถ ๋ฑ์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ ์์ฑ์ด ๊ฐ๋ฅํ๋๋ก ๋ง๋ค์์ต๋๋ค. ๋ํ, DNN ๊ธฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก ๊ธฐ์กด์ ์ฐฝ์๋ ๋ค์ํ ์์
์ ์ฅ๋ฅด์ ๊ตฌ์กฐ, ํจํด ๋ฑ์ ๋ถ์ํ๊ณ , ์์ง๋ MIDI ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ์๊ณ ๋ฆฌ์ฆ์ ํตํด ์๋ก์ด ์์
์ ์ฐฝ์กฐํ ์ ์๋ ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ด ์ถ์๋์์ต๋๋ค.
๊ทธ๋ฌ๋ ์์ง๊น์ง ์ ์ฑ์ ์ธ ์์๊ฐ ๋ง์ ์์ ์ด๋ ๊ฐ์ ์ ์์ญ์ ์ํ์ ์ผ๋ก ๋ณํํ์ฌ ์ ๋์ ์ธ ์์๋ก ์ดํดํ๊ธฐ ์ด๋ ค์ด ๋ถ๋ถ์ด ๋ง์ต๋๋ค. ์ด๋ฌํ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ํ๊ณ์ ์ ๋ณด์ํ๊ณ ์ ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ํ์ฉํ๋ค๋ฉด ์ธ๊ฐ์ ์ง๊ด๋ ฅ, ์ฐฝ์์ฑ์ด ๋
น์๋ ์ฐฝ์ํ์ผ๋ก์ ํฅํ ์์ ์ ๊ฐ์น๊ฐ ๋์์ง ๊ฒ์
๋๋ค. ๋ํ, ์์
์ฝํ
์ธ ์ ์์ ๋ํ ์ ๊ทผ์ฑ์ ๋์ผ ์ ์๋๋ก ์ด๋ฒ ์ํฐํด์ด ์๊ฒ๋๋ง ๊ธฐ์ฌํ ์ ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
ย
ย
2. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ์๋ฆฌ
2.1. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ MIDI ์๋ ์์ฑ ์๋ฆฌ
MIDI๋?
Musicalย Instrumentย Digitalย Interface์ ์ฝ์๋ก ์ ์ ์
๊ธฐ๊ฐ ํ์ฐ์ด ๋๋ฉด์ ์๋ก ๋ค๋ฅธ ์ ์กฐ์ฌ๋ค์์ ๋ง๋ค์ด์ง ์ ์ ์
๊ธฐ๋ค๊ณผ ๊ธฐ๊ณ๋ค์ด ์๋ก ๊ฐ๋ฑ ์์ด ์ฐ๊ฒฐ/ํธํ์ด ๋๋๋ก ํต์ผ๋๊ฒ ์ ํด ๋์ ์ฝ์์
๋๋ค.
์ธ๊ณต์ง๋ฅ์ ๊ธฐ์กด์ ์ฐฝ์๋ ์์
์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ํ์ต์ ํตํด ์์
์ ์๋ ์์ฑํฉ๋๋ค. ์ฌ์ฉ์๊ฐ ์ฅ๋ฅด, ๊ฐ์ , ์ฝ๋, ํ
ํฌ, ์
๊ธฐ ํธ์ฑ ๋ฑ์ ์์ฑ(Parameter)์ ์ค์ ํ์ฌ ์ค์๊ฐ์ผ๋ก ์์
์ ์ถ์ถํ ์ ์์ต๋๋ค.
๋ํ, ์ธ๊ณต์ง๋ฅ์ ํ์ฑ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ฐ๋ผ ์ค์๊ฐ์ผ๋ก Input Data๋ฅผ ๋ฃ์์ ๋ ์ฐ์ฃผ์์ ํ์ฐ๋ ๊ฐ๋ฅํฉ๋๋ค. ์ฌ์ธต์ ๊ฒฝ๋ง์ ์ด์ฉํ์ฌ ์์
์ ํจํด์ ๋ถ์ํ๋ AIVA๋ ํ์กดํ๋ ์ฝ 33๋ง๊ฐ ์ด์์ MIDI ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ํ์ ์ธ ๊ท์น๋ค์ ์งํฉ์ ๊ตฌ์ฑํ์ฌ ์๊ณ ๋ฆฌ์ฆ์ ํ์ฑํฉ๋๋ค. ์ด๋ฌํ ์์คํ
์ ์ฌ์ฉ์๊ฐ ์์ ๋ง์ ๊ณ ์ ํ ๊ณก์ ์ฐฝ์ํ๋๋ฐ ํ์ฉํ ์ ์๋๋ก ๊ตฌํ๋ ๊ฒ์
๋๋ค.
ย
2.2. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ DDSP์ ์๋ฆฌ
DDSP: Differentiable Digital Signal Processing๋ ์
๊ธฐ ์์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ตํ์ฌ Input Audio์ ์๋ฆฌ ํฉ์ฑ(Sound Synthesis)์ ํตํด ์์์ ์ ํํฉ๋๋ค. ์
๊ธฐ ์๋ฆฌ๋ ๋จ์ ์จ(Monophony) ์ค๋์ค ๋ฐ์ดํฐ๋ฅผ ์
๋ ฅํ์ฌ ์๋ก์ด ์์์ ๊ตฌํํ ์ ์์ผ๋ฉฐ, ์ฌ์ฉ์๊ฐ ์ง์ Sound Design ์์
์ ํ์ฉํ ์๋ ์์ต๋๋ค.
ย
ย
3. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ์์ ์ฝํ ์ธ ์ ์ ์ฌ๋ก
ํ์ฌ ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ์ ์๋ ์ฌ์ ๊ธฐ๋ฅ์ ์์
์ ์ธ ํจํด์ ๋ฐ๋ณต์ํค๊ฑฐ๋ ๋จ์ํ ์ฝ๋ฌ์ค ๋ถ๋ถ์ ๋งก๊ธฐ ๋๋ฌธ์, ์ด๋ฌํ ํจํด ์์
์๋ ์์ง์ฑ์ด๋ ์๋ฏธ๋ฅผ ๋ถ์ฌํ๊ธฐ ์ด๋ ต์ต๋๋ค. ํ์ง๋ง ์ธ๊ฐ์ ๊ฐ์ ์ด๋ ์ง๊ด ๋ฑ์ AI ์์
์ ๋
น์ฌ๋ผ ์ ์๋ค๋ฉด ์์ ํ ์ฐฝ์ํ์ผ๋ก์ ํ์ฉ๋ ์ ์์ ๋ฟ๋ง ์๋๋ผ ์ธ๊ฐ์ ์ฐฝ์์ ์ธ ๋ฐ์๊ณผ ์๊ฐ์ ๊ธฐ๋ฐ์ด ๋ ์๋ ์์ต๋๋ค.
ํด๋น ์ํฐํด์ <A Study on Music Content Production Using Artificial Intelligence Composition Program> ๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ์์ฑ๋์์ต๋๋ค. ์ง๊ธ๋ถํฐ๋ ํ๊ตญ์ฝํ
์ธ ์งํฅ์์์ ์ฃผ๊ดํ <2020 Music meets AI>์ <2021 AI Song Contest ํ๋ก์ ํธ> ์ฌ๋ก๋ฅผ ์ค์ฌ์ผ๋ก ์ธ๊ณต์ง๋ฅ ์์
์ฝํ
์ธ ์ ์ ๊ณผ์ ์ ์ดํด๋ณด๋ ค๊ณ ํฉ๋๋ค. ์ธ๊ณต์ง๋ฅ๊ณผ ์ธ๊ฐ์ ํ์
์ ํตํ ์ฐฝ์ํ์ผ๋ก์จ ์์ ์ ๊ฐ์น์ ๋ํด์ ์๊ฐํด๋ด
์๋ค!๐
ย
3.1. ์ธ๊ณต์ง๋ฅ ์๊ณก ํ๋ก๊ทธ๋จ AIVA๋ฅผ ํ์ฉํ Melody ์ ์
AIVA๋ ์ฌ์ธต์ ๊ฒฝ๋ง์ ์ด์ฉํ์ฌ ๊ธฐ์กด์ ์ฐฝ์๋ ์์
์ํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ , ๋ฅ๋ฌ๋์ ํตํด ์๊ณ ๋ฆฌ์ฆ์ ํ์ฑํ์ฌ ์์
์ ์๋ ์์ฑํฉ๋๋ค. ๊ฐ์ ์ AI๊ฐ ์ค์ค๋ก ๋ด์ฌํํ๊ธฐ ์ด๋ ค์ด ์ถ์์ ์ธ ์์ญ์ด๊ธฐ ๋๋ฌธ์ ๋ค ๊ฐ์ง ๊ฐ์ (Sad - Angry - Happy - Tender) ์ค Sad์ Tender ํํธ ์ ์์ ๋ํ ๋ด์ฉ์ ์ดํด๋ณด๋ ค๊ณ ํฉ๋๋ค. ์๋๋ ๊ทธ ๊ณผ์ ์
๋๋ค.
Steven R. Livingstone์ Music-Emotion Rules ์ด๋ก ๊ธฐ๋ฐ์ ์ ๋ณด ์ถ์ถ
- Music-Emotion Rules๋ ๊ฐ์ ์ ์์ ์ ์์ฑ์ผ๋ก ๋ถ๋ฅํ ์ด๋ก ์ ๋๋ค.
ย
AIVA ์๊ณก ํ๋ก๊ทธ๋จ์์ ์ถ์ถํ Melody ๋ฐ์ดํฐ
- ์ถ์ถํ Melody๋ฅผ AIVA๊ฐ ํธ๊ณกํ ๊ฒ์ ๋๋ค.
ย
AIVA์์ ์ถ์ถํ Sad์ Tender์ Melody ์ ์
- ๊ฐ์ ๋ณ ์ ๊ธฐ ์ข ๋ฅ ๊ฒฐ์ ๋ฐ ์์ ๋๋ฎ์ด๋ฅผ ๋์์ ํํํ ๊ฒ์ ๋๋ค.
ย
Sad์ Tender ํํธ์ Visual art์ ์์ ๊ฒฐ๊ณผ๋ฌผ
- ์ธ๊ฐ์ด ๋๋ผ๋ ๋ณดํธ์ ์ธ ๊ฐ์ ์ ์์ ์ ์ธ ์์ฑ๊ณผ ์ฐ๊ด์์ผ ์ํ์ ์ ์ฉํ ๊ฒ์ ๋๋ค.
Sad ํํธ๋ ๋ธ๋ฃจ ๊ณ์ด๋ก ์์ ์ฐ์ถ์ ํ์ฌ ์์
๊ณผ์ ๋ถ์๊ธฐ๋ฅผ ๋ง์ถ๋ ค๊ณ ํ ๊ฒ์
๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ์ฒญ์ทจ์๋ค์ด ์ฌํ๋ฟ๋ง ์๋๋ผ ๋ฌด์์, ๋๋ ค์, ๊ทธ๋ฆฌ์, ์ํ ๋ฑ ๋ณต์กํ ๊ฐ์ ์ ๋๋ผ๊ธฐ๋ ํ๋ ๋ฑ ๋ค์ํ ๊ฐ์ ์ ํ์ถํ์ต๋๋ค. ์ด๋ ์ค์ ๋๋ผ๋ ๊ฐ์ ์ ๋์ฑ ์ธ๋ถํํ ์ ์์ผ๋ฉฐ, ์ธ๊ฐ์ ๊ฐ์ ์ ์ด๋ ํ ์์ฑ์ ๋ฐ๋ผ ๋ถ๋ฅํ์ฌ ๋ณดํธํํ๋ ๊ฒ์ด ์ด๋ ต๋ค๋ ์๋ฏธ์ด๊ธฐ๋ ํฉ๋๋ค.
ย
3.2. Tone Transfer๋ฅผ ํ์ฉํ Sound Design๊ณผ ์์ ๋ฆฌ์์ค ์ ์
๋จ์ํ ๋ฉ๋ก๋๋ ์ฝ๋ฌ์ค๋ฅผ ์๋์ ์ผ๋ก ์์ฑํ๋ ๊ฒ์ผ๋ก ๊ทธ์น๋ ๊ฒ์ด ์๋๋ผ ์ธ๊ณต์ง๋ฅ ์์
์ด ์์ ์ฑ์ ํ๋ณดํ๊ธฐ ์ํด์๋ ๋ค์ํ ์์
์ ์ฌ๋ฃ๋ฅผ ํ๋ณดํ๋ ค๋ ๋
ธ๋ ฅ์ด ํ์ํฉ๋๋ค.
ย
Sound Design
Sound Design์ ํตํด ์์
์ ์
์ฒด์ ์ธ ๋ถ์๊ธฐ๋ฅผ ์กฐ์ฑํ๊ณ ์ผ์, ์์ฐ์ ์๋ฆฌ๋ฅผ ์์งํ Sample Data๋ฅผ AI์ ํ์ต์์ผ ์๋ก์ด ์ฌ์ด๋๋ก ํ๋ฐ๊ฟ์ํฌ ์ ์์ต๋๋ค. ์ฑ์๋ณผ, ๋ฌผ๋ฐฉ์ธ, ์์๋ฆฌ, ๊ณค์ถฉ ์๋ฆฌ ๋ฑ Sample Data๋ฅผ ๊ตฌ์ถํ๋ ๊ณผ์ ์
๋๋ค.
ย
๋ฉ๋ก๋์ ์ฝ๋ฌ์ค์ ์ ์ฉํ ์ ์๋ ๊ตฌ๊ธ Magenta์ Tone Transfer๋ฅผ ์ ํ
๋ฅ๋ฌ๋ ๊ธฐ๋ฐ์ ๋ง์ถคํ Tone Transfer Model์
๋๋ค. Model ์์ฑ ์ดํ Input Audio๋ฅผ ์ ์ฉํ ๋ค Model์ DDSP์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ์
๋๋ค. ํ๋จ์ Tone Transfer ๋ชจ๋ธ์ ์ค์ ํ๊ณ ๋ชจ๋ธ์ DDSP ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๋ ์ด๋ฏธ์ง์
๋๋ค.
๊ทธ ์ธ์๋ ์ธ๊ณต์ง๋ฅ ์์ฑ์ ๋ณด์ปฌ์ ์ฝ๋ฌ์ค ๋ถ๋ถ์ ์ฌ์ฉํ๋ TTS(Text to Speech)๋ชจ๋ธ ๊ธฐ๋ฐ์ Prosody ํ์ฉํ๊ฑฐ๋ MIDI ๋ฐ์ดํฐ๋ฅผ ์๋ ์์ฑํ์ฌ ๋์ถํ ๋ค ๊ตฌ๊ธ Magenta์ Improve RNN(Recurrent Neural Network) ๋ชจ๋ธ์ ํ์ฉํ๋ ๋ฐฉ๋ฒ๋ ์์ต๋๋ค.
์ธ๊ณต์ง๋ฅ์ด ํ์ตํ Sample Data์ ์๊ณ ๊ฐ ๋ช
ํํ ์๋ก ์์ ๋ณํ์ ํจ๊ณผ์ ์
๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ง์ด ์ข์ ์ฌ์ด๋๋ฅผ ์ถ์ถํ๊ธฐ ์ํด์๋ Data Set์ ์์งํ๋ ์ด๊ธฐ ๊ณผ์ ์์ Sample Data์ ์์์ด๋ ์ก์์ ์ ๊ฑฐํ ์ ์๋ ์ ์ ๊ณผ์ ์ด ํ์ํฉ๋๋ค.
ย
3.3. Prosody๋ฅผ ํตํ AI ์์ฑ ํ์ฉ ๋ฐ ์์ ๋ฆฌ์์ค ์ ์
Prosody๋?
TTS(Text to Speech) ๋ฐฉ์์ ๋ฅ๋ฌ๋ ์์ฑ ํฉ์ฑ ๋ชจ๋ธ์
๋๋ค.
์ธ๊ณต์ง๋ฅ ์ฑ์ฐ๋ค์ ๋ชฉ์๋ฆฌ๋ฅผ ๋ค์ํ ๊ฐ์ ๊ณผ ํค์ผ๋ก ์กฐ์ ํ ์ ์์ ๋ฟ๋ง ์๋๋ผ ์ฑ๋ณ, ์ฐ๋ น ๋ฑ์ ๋ฐ๋ผ์๋ ์์ฑ ๋ณ์กฐ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ฉ์ธ ๋ณด์ปฌ์ ์ฝ๋ฌ์ค ๋ถ๋ถ์ ์ฝ์
ํ์ฌ ์์ฑ ์กฐ์ ๊ธฐ๋ฅ์ ์ด์ฉํฉ๋๋ค. ๋ฉ์ธ ๋ณด์ปฌ์ ๋ชฉ์๋ฆฌ์ ์์์ด ์ด์ธ๋ฆด ์ ์๋๋ก โํ
์คํธํโํ์ฌ ์ ์ํฉ๋๋ค. ๊ทธ ์ดํ ์ธ๊ณต์ง๋ฅ ์ฑ์ฐ์ ๋ชฉ์๋ฆฌ๋ฅผ ์์ ๋ก ๋ถํ ํ์ฌ ์์์ ๋๋ฎ์ด์ ๋ง๊ฒ ๋ณํํ๋ ๋ฐฉ์์ผ๋ก Prosody๋ฅผ ํ์ฉํ ์ ์์ต๋๋ค.
๋ง์ถคํ ๋ชจ๋ธ์ธ Tone Transfer์ ์ง์์ ์ธ ๋ณด์์ ํตํด ์
๋ฐ์ดํธ๋ฅผ ํ๊ณ ์ถ๊ฐ์ ์ผ๋ก ๋ ๋ง์ Sample Data๋ฅผ ํ๋ณดํ์ฌ ๋ค์ํ ๋ชจ๋ธ์ ๊ตฌ์ถํ๋ค๋ฉด ์๋ก์ด ์์์ ๊ตฌํํ ์ ์์ ๊ฒ์
๋๋ค.
ย
ย
4. ์ธ๊ณต์ง๋ฅ์ ํ์ฉํ ์ต๋ณตํฉ ์์ ์ฝํ ์ธ ์ ์์ ๋ฐฉํฅ์ฑ
์์
์์ญ์ ์ถ์ธ
AI๋ ํ์ฌ ์์ฒญ๋ ์๋๋ก ๋ค์์ ํ๊ณ ์์ต๋๋ค. ์ด์ฉ์๊ฐ ๋ฒํผ ๋ช ๊ฐ๋ง ๋๋ฅด๋ฉด 30์ด ์์ 3๋ถ์ง๋ฆฌ ๊ณก์ด ๋ง๋๋ ๊ฒ์ผ๋ก ๋ณด์ ์ด๋ก ์ ํ๋์ ๋จ๋ง์ด ํ๋ฃจ์ ์์ฒ ๊ณก์ ์์๋ผ ์ ์์ต๋๋ค. ์์
์ ๋ฌธ์ธํ์ด๋๋ผ๋ ๊ฐ๋ณ๊ฒ ๋๋ง์ ์์
์ ๋ง๋ค์ด ํ์ฉํ ์ ์๊ฒ ๋์์ต๋๋ค.
ํ์ง๋ง AI์ ๋๋ ์์ฐ ๋ฅ๋ ฅ์ด ๊ฐ๊ฒฉ ํ๊ดด๋ก ์ด์ด์ ธ ์ ๋ฌธ ์์
์ธ์ ์ค์๋ฆฌ๋ฅผ ์ํํ ์๋ ์์ต๋๋ค. ์ด์ธ ํค ์ ์ฐ์ ์์ค ใ๊ธฐ๊ณ ๊ณ ๋๋ ๋
ธ๋ํ๋คใ๋ AI ์๊ณก์ด ๋ณดํธํ๋ ์ธ๊ณ๋ฅผ ๋ฐฐ๊ฒฝ์ผ๋ก ์๊ณก๊ฐ๋ ์ฐ์ฃผ์๋ AI๋ฅผ ์ํ ๋๊ตฌ๋ก ์ ๋ฝํด๋ฒ๋ฆฐ ๋์คํ ํผ์์ ํ๊ฒฝ์ ๊ทธ๋ฆฌ๊ณ ์๊ธฐ๋ ํฉ๋๋ค.
ย
๊ธ์ฐ๊ธฐ ํ๋ซํผ์ ๋๊ตฌ๋ ๊ธ์ ๋ฐํํ ์ ์๋ฏ, ์ด๋ฏธ ์๊ณก๋ ๋๊ตฌ๋ ํ ์ ์๋ ์ผ์ด ๋์์ต๋๋ค. AI ์๊ณก์ AI ๋์ ์์
์ํ๊ณ ์๋น๊ฐ ํ์ฑํด์ก๊ธฐ ๋๋ฌธ์ ํผํ ์ ์๋ ๋ฐฉํฅ์ด์ง๋ง ์ด๋ฅผ ์ ๋ณํ๋ ๊ท๊ฐ ์๊ธธ ๊ฒ์ด๊ณ , ์ ์ฐ๋ ์ฌ๋์ ๋ํ ์กด๊ฒฝ์ฌ์ด ๋ ์ปค์ง ๊ฒ์
๋๋ค. ์ง์ง ์๊ณก๊ฐ๋ ์์
์ ์ธ๊ณ ์ ๋ฌด์์ ์ ๋ฅผ ์ฐฝ์กฐํ๋ ์ฌ๋์ด๊ธฐ์, AI๊ฐ ๋จ์ํ ๋ชจ๋ฐฉ์์ ๋ฒ์ด๋ ์๊ธฐ๋ง์ ์์ ์ ์คํ ๋ฆฌ๋ฅผ ์ฐฝ์กฐํ ์ ์๋๋๋ ์์ํ ์์ ๋ก ๋จ์ ๊ฒ ๊ฐ์ต๋๋ค.
ย
๋ฏธ์ ์์ญ์ ์ถ์ธ
์ฌ์ฉ์๋ค์ด ์ค์ผ์น๋ ๋์ํ ๊ทธ๋ฆผ์ ๋ณด์ํ๋ ๊ตฌ๊ธ Autodraw, ๊ฐ๋จํ ๋ฌธ์์ด์ ๋ฃ์ผ๋ฉด ์ด๋ฏธ์ง๋ฅผ ์์ฑํด์ฃผ๋ OpenAI์ Deep daze์ DALL-E, ํ
์คํธ๋ก ๋ ์ค๋ช
๋ฌธ์ ์
๋ ฅํ๋ฉด ์ฌ๋์ ์ค์ผ์น๋ ๋ถ์ง ํ ๋ฒ ์์ด ์ด๋ฏธ์ง๋ก ๋ณํ์์ผ์ฃผ๋ ๋ฏธ๋์ ๋(midjourney) ํ๋ก๊ทธ๋จ ๋ฑ์ด ์ถ์๋๋ ๊ฒฝ์ง์ ์ด๋ฅด๋ ์ต๋๋ค. ์ด์ฒ๋ผ ์์ ์ํ์ ๋ง๋๋ AI ๊ธฐ์ ์ ์๋กญ๋ค๊ณ ์ฌ๊ฒจ์ง์ง ์์ ๋งํผ ์ ์ฐจ ๋ฐ์ ํ๋ ์ถ์ธ์
๋๋ค. ๊ตญ๋ด์์๋ 1์ธ ์ฐฝ์์๋ฅผ ์ํ AI ๊ธฐ๋ฐ ๊ทธ๋ฆผ, ์น์์ค, ์นํฐ ์บ๋ฆญํฐ ์ฐฝ์ ํ๋ซํผ์ธ โ์ฝ๋ ๋ฆฌโ๊ฐ ์ถ์๋ ๋ฐ ์์ต๋๋ค.
๋ํ, ์์ ์ฐฝ์ํ๋ AI๋ ๊ฐ๋ฐ๋๊ณ ์๋ ์ค ์
๋๋ค. ๊ตฌ๊ธ์ AI ํ๊ฐ โ๋ฅ ๋๋ฆผ(Deep Dream)โ์ ์ง์์ ์ผ๋ก ์
๋ฐ์ดํธํ๊ณ ์์ต๋๋ค. ๊ตฌ๊ธ ๊ด๊ณ์์ ๋ฐ๋ฅด๋ฉด ์ด์ ๋ชจ๋ฐฉ์ ๋จ๊ณ๋ฅผ ๋์ด ์ธ๊ฐ์ ๊ณ ์ ์ฐฝ์ ์์ญ์๋ ๊ทผ์ ํ ์ ์๋์ง ์คํ ์ค์ด๋ผ๊ณ ๋ฐํ ๋ฐ ์์ต๋๋ค.
ย
ย
OUTRO
๋ํ์ ์ธ ์ฌ๋ก๋ค ์ด์ธ์๋ ์ด์ AI๋ ๋ง ์์ ์์ญ์ผ๋ก ์ธ์ ๋ฐ๋ ๊ฒ์ผ๋ก ๋ณด์
๋๋ค. ํ์ง๋ง ์ด๋ฐ ๋ถ์๊ธฐ๊ฐ ํ์ค๋ฅด๋ค๊ฐ ๊ธ๋ฐฉ ์ ๋ฒ๋ฆฌ๋ ํธ๋ ๋๋ก ๋๋์ง ์๊ธฐ ์ํด์๋ ๊ธฐ์ ์ ์ง๋ณด ์ธ์๋ AI ์ฐฝ์์ ์์ฉํ๋ ์ฌํ์ ๋ด๋ก ์ด ์ง์์ ์ผ๋ก ์ ๊ฐ๋์ด์ผ ํฉ๋๋ค. ์ด๋ฌํ ๋
ธ๋ ฅ์ด ์ง์๋๋ค๋ฉด 4์ฐจ ์ฐ์
์๋์ ๋ฌธํ ์์ ์ด ํ๋์ ์ฌ์กฐ๋ก ๊ธฐ๋ก๋๊ณ , ๊ณต์กดํ ์ ์๋ ๋ฐฉ๋ฒ์ด ๋ ์ ์์ ๊ฒ์
๋๋ค.
์ด์ฒ๋ผ ๋น
๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ ํจํด์ ์์ฉํ ์ ์๋ ์ธ๊ณต์ง๋ฅ์ ์ด์ ์์ ๊ฐ๋ค์ด ์๋ํ์ง ๋ชปํ๋ ํ๊ณ์ ์ ๋ฐ์ด๋๊ธฐ๋ ํฉ๋๋ค. ๋ค์ํ ์์ญ์ ๋ถ์ผ์ ์์ ์ ์ตํฉํ ์ ์๋ค๋ฉด, ๊ธฐ์กด์ ๋ณผ ์ ์์๋ ์๋ค๋ฅธ ์์ ์ฝํ
์ธ ๋ก ์ฌ์ฐฝ์กฐ๋ ์ ์์ ๊ฒ์
๋๋ค. ๋ํ, AI๋ ์ธ๊ฐ์ ๋์ฒดํ๊ธฐ ์ํ ์๋จ์ด ์๋, ์ธ๊ฐ๊ณผ์ ๊ณต์กด์ ํตํด ์์ ๋ถ์ผ์ ์๋ก์ด ํจ๋ฌ๋ค์์ ๋ถ์ด๋ฃ์ ์ ์๋ ์ถ๋ฐ์ ์ด ๋ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค.
ย
ย
ย
Digital Contents
๊น์๋น(deep-ing)
ย
ย
ย
์ฐธ๊ณ ๋ฌธํ ๋ฐ ์ถ์ฒ
[1] CAN: Creative Adversarial Networks Generating โArtโ by Learning About Syles and Deviating from Style Norms, 2017.
[2] ์ด๊ฒ์ ๋ฏธ์ ์ด ์๋๋ค, ๋ฉ๋ฆฌ ์ค ์คํ๋์ค์ ํ์คํค, ํ์ค๋ฌธํ
[3] Floridi, L.ย The Fourth Revolution: How the Infosphere is Reshaping Human Reality, Oxford: Oxford University Press, 2016.
[5] A Study on Music Content Production Using Artificial Intelligence Composition Program, 2022
ย
ย
๋ฌธ์์ฌํญ manager@deepdaiv.com
ย
DDSP๋?
๊ตฌ๊ธ Tone Transfer์ ํต์ฌ ๊ธฐ์ ์
๋๋ค.