์ํ์ค ๋ชจ๋ธ์ ์ฐธ์กฐ ์ถ๋ ฅ์ด๋ผ๋ ๊ธฐ๋ ์ถ๋ ฅ์ผ๋ก ํ๊ฐํฉ๋๋ค. ์ฌ๋ฌ ๋ชจ๋ธ ๋น๊ต ์์ ๋ชจ๋ธ์ ์ถ๋ ฅ์ด ์ผ๋ง๋ ์ฐธ์กฐ ์ถ๋ ฅ์ ๊ฐ๊น์ด์ง๋ฅผ ์ ์๋ก ๋งค๊ธฐ๊ฒ ๋ฉ๋๋ค. ๊ธฐ๊ณ ๋ฒ์ญ ์์
์ ์๋ก ๋ค์๋ฉด, ์์ ์ดํดํ ์ ์๋ ๋ฒ์ญ๋ฌธ์ ๋ง๋ค์ด๋ด๋ ๋ชจ๋ธ๋ณด๋ค๋ ํ ๋จ์ด๋ง ํ๋ฆฐ ๋ชจ๋ธ์ ์ ์๊ฐ ๋ ๋๊ฒ ๋งค๊ธธ ์ ์์ต๋๋ค. ๋ค์์ผ๋ก ์ํ์ค ์์ฑ ๋ชจ๋ธ์๋ ์ฌ๋ ํ๊ฐ์ ์๋ ํ๊ฐ ๋ ๊ฐ์ง๊ฐ ์์ต๋๋ค.
ย
์ฌ๋ ํ๊ฐ๋ ํ ๋ช
์ด์์ ์ฌ๋์ด ๋ชจ๋ธ ์ถ๋ ฅ์ ์ข๋ค ๋์๋ค ํ์ํ๊ฑฐ๋ ๋ฒ์ญ์ ๊ณ ์น๋ ๋ฐฉ๋ฒ์
๋๋ค. ์ฌ๋์ ํ๊ฐ ์๋๊ฐ ๋๋ฆฌ๊ณ ๋น์ฉ์ด ๋ง์ด ๋ค๋ฉฐ ๊ตฌํ๊ธฐ๋ ์ด๋ ค์ ์์ฃผ ์ฌ์ฉ๋์ง๋ ์์ต๋๋ค. ๋ํ ์ฃผ๊ด์ ์ธ ํ๊ฐ ์์๊ฐ ๋ค์ด๊ฐ ์ ๋ฐ์ ์์ด์ ์ฌ๋ ํ๊ฐ ์์๋ ๋ฐ๋์ ํ๊ฐ์ ๊ฐ์ ์ผ์น์จ์ด ์ฌ์ฉ๋ฉ๋๋ค. HTER(human-targeted translation error rate)์ ๋๋ฆฌ ์ฌ์ฉํ๋ ์ฌ๋ ํ๊ฐ ์งํ๋ก, ์ฌ๋์ด ๋ ์์ฐ์ค๋ฌ์ด ๋ฒ์ญ ๊ฒฐ๊ณผ๋ฅผ ์ํด ์๋ฏธ์ ๋ง๊ฒ ๊ฐ์ ํ๊ณ ์ ์ํํ ์ถ๊ฐ, ์ญ์ , ์ด๋ ํ์ ๋ฑ์ ํค์ด๋ ค ๊ณ์ฐํ ๊ฐ์ค์น๊ฐ ์ ์ฉ๋ ํธ์ง ๊ฑฐ๋ฆฌ์
๋๋ค.
ย
๋ฐ๋ฉด์ ์๋ ํ๊ฐ๋ ์ฝ๊ณ ๋น ๋ฆ
๋๋ค. ์์ฑ๋ ์ํ์ค๋ฅผ ์๋์ผ๋ก ํ๊ฐํ๋ ์งํ๋ n-๊ทธ๋จ ์ค๋ณต ๊ธฐ๋ฐ ์งํ(n-gram overlap-based metric)๊ณผ ํผ๋๋(perplexity)๊ฐ ์์ต๋๋ค. ๋จผ์ n-๊ทธ๋จ ์ค๋ณต ๊ธฐ๋ฐ ์งํ๋ ์ฐธ์กฐ์ ์ถ๋ ฅ์ด ์ผ๋ง๋ ๊ฐ๊น์ด์ง n-๊ทธ๋จ ์ค๋ณต ํต๊ณ๋ก ์ ์๋ฅผ ๊ณ์ฐํฉ๋๋ค. n-๊ทธ๋จ ์ค๋ณต ๊ธฐ๋ฐ ์งํ์๋ BLEU, ROUGE, METEOR๊ฐ ์์ต๋๋ค. ์ด ์ค BLEU(BiLingual Evaluation Understudy)๋ ๊ธฐ๊ณ ๋ฒ์ญ ๋
ผ๋ฌธ์์ ์ค๋ซ๋์ ์ธก์ ์งํ๋ก ์ฌ์ฉ๋์ด ์์ต๋๋ค. ์ฐธ์กฐ ๋ฐ์ดํฐ๊ฐ ์๋ค๋ฉด BLEU๋ฅผ ๋น ๋ฅด๊ณ ์ฝ๊ฒ ๊ณ์ฐํ ์ ์์ต๋๋ค.
ย
ํผ๋๋ ์ญ์ ์ ๋ณด ์ด๋ก ์ ๊ธฐ๋ฐํ ์๋ ํ๊ฐ ์งํ์
๋๋ค. ์ถ๋ ฅ ์ํ์ค์ ํ๋ฅ ์ ์ธก์ ํ ์ ์์ ๋ ์ ์ฉ์ด ๊ฐ๋ฅํฉ๋๋ค. ์ํ์ค ์ ํ๋ฅ ์ด ์ผ ๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
๋ฐ๋ก ๋ถ๋ฆฌํด ๋์ ๋ฐ์ดํฐ์
์์ ๋ชจ๋ธ์ ํผ๋๋๋ฅผ ์ธก์ ํด ์ฌ๋ฌ ์ํ์ค ์์ฑ ๋ชจ๋ธ์ ๋น๊ตํ ์ ์์ต๋๋ค. ํผ๋๋๋ ๊ณ์ฐํ๊ธฐ ์ฝ์ง๋ง ๋ชจ๋ธ ํ๊ฐ์ ์ฌ์ฉํ ๋ ๋ช ๊ฐ์ง ๋ฌธ์ ์ ์ด ์์ต๋๋ค. ์ฐ์ ํผ๋๋๋ ๊ณผ์ฅ๋ ์งํ์
๋๋ค. ์ ๊ณต์์ ๋ณด๋ฉด ํผ๋๋์๋ ์ง์ ํจ์๊ฐ ์กด์ฌํฉ๋๋ค. ๋๋ฌธ์ ์์ ์ฐจ์ด๊ฐ ํฐ ์ฐจ์ด๋ฅผ ๋ง๋ค๊ฒ ๋ฉ๋๋ค. ๋ค์์ผ๋ก, ๋ค๋ฅธ ์งํ์ ๋ฌ๋ฆฌ ํผ๋๋์ ๋ณํ๋ ๋ชจ๋ธ์ ์ค์ฐจ์จ์ ์ง์ ๋ฐ์๋์ง ์์ต๋๋ค. ๋ง์ง๋ง์ผ๋ก n-๊ทธ๋จ ๊ธฐ๋ฐ ์งํ์ฒ๋ผ ํผ๋๋๊ฐ ํฅ์๋๋๋ผ๋ ์ฌ๋์ด ํ๋จํ๊ธฐ์๋ ํฅ์๋์๋ค๊ณ ๋๋ผ์ง ๋ชปํ ์๋ ์์ต๋๋ค.
ย
์ด์ ๊ธ ์ฝ๊ธฐ