cleanUrl: "paper/YouTubeRecommendation3"
๋
ผ๋ฌธ : Recommending What Video to Watch Next: A Multitask Ranking System
์ ์ : Zhe Zhao, Lichan Hong, Li Wei, Jilin Chen, Aniruddh Nath, Shawn Andrews, Aditee Kumthekar, Maheswaran Sathiamoorthy, Xinyang Yi, Ed Chi
๋
ผ๋ฌธ ์ ์ ๊ณ๊ธฐIntroductionRelated Works1. Industrial Recommendation Systems2. Modeling Biases in Training DataModel Architecture1. Ranking Objectives2. Modeling and Removing Position and Selection BiasesResults1. YouTube live experiment results for MMoE2. Expert utilization for multiple tasks on YouTube๊ฒฐ๊ณผ ๋ฐ ์์์ด์ ๊ธ ์ฝ๊ธฐ
๋ ผ๋ฌธ ์ ์ ๊ณ๊ธฐ
2016๋
์ ํ๋ธ์์ ๋ฐํํ ๋
ผ๋ฌธ์ ์ฝ๊ณ ๋ ํ 2019๋
์๋ ์ด๋ป๊ฒ ๋ฐ์ ๋์๋์ง ์ด๋ ํ ๋ถ๋ถ์ด ๋ฌ๋ผ์ก๋์ง์ ๋ํด ๊ถ๊ธ์ฆ์ ์๊ฒจ ์ด ๋
ผ๋ฌธ์ ์ ์ ํ๊ฒ ๋์์ต๋๋ค. ๋ํ ํ์ฌ ์กด์ฌํ๋ ์ ํ๋ธ ๊ด๋ จ ๋
ผ๋ฌธ ์ค ๊ฐ์ฅ ์ต์ ์ด๊ณ ๋ฐ์ ๋ ๋ด์ฉ์ ๋ด๊ณ ์์ด ํจ๊ป ๊ณต์ ํ๋ฉด ์ข์ ๊ฒ ๊ฐ์ ๊ฐ์ ธ์ค๊ฒ ๋์์ต๋๋ค.
ย
Introduction
์ด์ 2016๋
๋
ผ๋ฌธ์์๋ ์ค๋ช
ํ๋ฏ์ด ์ ํ๋ธ์ ์ถ์ฒ์์คํ
์ candidate generation โ ranking 2๋จ๊ณ๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค. ๊ทธ ์ค 2019๋
๋
ผ๋ฌธ์ candidate generation์ ์ง์คํ๋ 2016๋
๋
ผ๋ฌธ๊ณผ ๋ฌ๋ฆฌ ranking ๋ชจ๋ธ์ ์ง์คํด ์ด๋ป๊ฒ ํ์ด๋๊ฐ๊ณ ์๋์ง ์ค๋ช
ํ๊ณ ์์ต๋๋ค. ๋จผ์ ์ด๋ค ๊ฒ์ ์ต์ ํ ํ ๊ฒ์ธ์ง์ ๋ํ ๋ฌธ์ ์ ๋์ ์์์ ์์ด ์์ฒญ์ ํ์ ๊ฐ๋ฅ์ฑ ๋ํ ๋ฐฐ์ ํ ์ ์๋ค๋ ๊ฒ์
๋๋ค.
์์์ ๋งํ 2๊ฐ์ง ๋ด์ฉ์ ์์ฝํ๋ฉด objective๋ฅผ ์ ์ค์ ํ๋ ๊ฒ ๊ทธ๋ฆฌ๊ณ ์ถ์ฒ์ bias๋ฅผ ์ ์ ๊ฑฐํ๋ ๊ฒ์ ๋งํฉ๋๋ค. ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ ํ๋ธ์์๋ multitask neural network ๋ฐฉ๋ฒ์ ๋์
ํ์ต๋๋ค.
์ด ๋ชจ๋ธ์ ๊ตฌ์กฐ๋ Multi-gate Mixture-of-Experts(MMoE)๋ฅผ ์ ์ฉํ ๊ฒ์ผ๋ก objective๋ฅผ ๋ถ๋ฆฌํ์ฌ multitask learning์ ๊ตฌํํฉ๋๋ค. ์์ ๋
ผ๋ฌธ์์ ๋งํ๋ฏ์ด ๋ค์์ ์์ฒญํ ์์๋ง์ objective๋ก ํ์ฌ ์์ธกํ๋ค๋ฉด ๊ด๊ณ ๋ ๋์์ฑ ์์์ ์ด๋๋ฆด ์ ์๋ ํ๋ฅ ์ด ๋์์ง๊ธฐ ๋๋ฌธ์ โ์ผ๋ง๋ ์์ฒญํ ์งโ, โ์ ํธํ๋์งโ ๋ฑ์ objective๋ฅผ ๋ถ๋ฆฌํ๋ฉด ์์ธก์ ์ฑ๋ฅ์ ๋์ผ ์ ์์ต๋๋ค. objective๋ ์ด 2๊ฐ์ ๊ทธ๋ฃน์ผ๋ก ์ ์ ์ ํด๋ฆญ, ์์์ ๋ํ engagement๋ฅผ ๊ฐ์ง๊ณ ์๋ โengagement objectiveโ์ ์ ์ ๊ฐ ์์์ ์ข์ํ๋์ง์ ๊ดํ โsatisfaction objectiveโ๋ก ๋๋์ด์ง๋๋ค.
ย
Related Works
1. Industrial Recommendation Systems
์ถ์ฒ์์คํ
์์ ์ค์ํ ์ ์ ๊ณ ๋ฅด๋ผ๊ณ ํ๋ฉด 3๊ฐ์ง๊ฐ ์์ ๊ฒ์
๋๋ค. ๊ทธ ์ค ๊ฐ์ฅ ์ค์ํ ๊ฒ์ ์ด์ ๋
ผ๋ฌธ์๋ ๋์๋ฏ์ด implicit ํผ๋๋ฐฑ์ ํ๋ ๊ฒ์
๋๋ค. explicit ํผ๋๋ฐฑ์ ํ์ค์ ์ผ๋ก ์ด๋ ต๊ณ ํฌ๊ฒ ์๋ฏธ๊ฐ ์๊ธฐ ๋๋ฌธ์
๋๋ค. ๋ค์์ผ๋ก ์ค์ํ ๊ฒ์ stage๋ฅผ ๋๋๋ ๊ฒ์
๋๋ค. candidate generation โ ranking 2๋จ๊ณ๋ก ์ด๋ฃจ์ด์ ธ ์๋ ๊ฒ์ ๋งํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก๋ scalability๋ก ๋ง์ ์์ ๋ฐ์ดํฐ๋ฅผ ์ค์๊ฐ์ผ๋ก ์
๋ฐ์ดํธํ๋ ๊ณผ์ ์ด ํ์ํฉ๋๋ค.
ย
2. Modeling Biases in Training Data
์ ํ๋ธ์์๋ ์ถ์ฒ์์คํ
์ด ์ถ์ฒํด์ค ์์์ ์ ์ ๊ฐ ํด๋ฆญํ๊ฒ ๋๋ฉด ์ด๋ฅผ ๋ ์ถ์ฒ์์คํ
์ด ํ์ตํ๊ฒ ๋๋ feedback loop๊ฐ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค. ์ด ๋๋ฌธ์ ์ ์ ์ ์ถ์ฒ์์คํ
์ฌ์ด์์๋ selection bias๊ฐ ํ์์ ์ผ๋ก ๋ฐ์ํฉ๋๋ค. ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋์ ์์์ ์์นํ ์์์ ๊ฒฝ์ฐ ํ์ต ์ ๊ฐ์ค์น๋ฅผ ์ผ๋ถ๋ฌ ๋ฎ์ถ๋ ๋ฐฉ๋ฒ์ ์ด์ฉํฉ๋๋ค.
ย
Model Architecture
1. Ranking Objectives
ranking ๋ชจ๋ธ์ MMoE๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฉฐ objective๋ฅผ 2๊ฐ์ง๋ก ๋ถ๋ฆฌํ์ต๋๋ค. ์ฒซ ๋ฒ์งธ๋ engagement์ ๊ดํ ๊ฒ์ผ๋ก ์ ์ ์ ํด๋ฆญ(binary classification task)๊ณผ ์์ฒญ ์๊ฐ(regression task)์ผ๋ก ๋๋์ด์ง๋๋ค. ๋ค์ ๋ ๋ฒ์งธ๋ satisfaction์ ๊ดํ ๊ฒ์ผ๋ก ์ข์์(binary classification task)์ rating(regression task)์ ๊ดํ ๊ฒ์
๋๋ค. ๊ทธ๋ฆฌ๊ณ multiple objectives๋ฅผ combined score๋ก ์ฌ์ฉํ๊ณ ์์ต๋๋ค.
ย
2. Modeling and Removing Position and Selection Biases
์ ๊ทธ๋ฆผ์ selection bias์ ๊ดํ ๊ฒ์ผ๋ก serving์์ missing value๋ก ํต๊ณผํด ๋์ ์์์ ํ๋ํฐ๋ฅผ ์ฃผ๋ ๋ฐฉ์์ ์ค๋ช
ํ๊ณ ์์ต๋๋ค. ์ถ์ฒ ๋ญํน ์์๋ฅผ feature๋ก ํ์ฉํ ๊ฒ๊ณผ ๋ค๋ฅธ feature ๊ฐ์ linear combinationํ์ฌ selection bias๋ก ๋ง๋ ๊ฒ์
๋๋ค.
ย
Results
๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ํด MMoE๋ฅผ ์ ์ฉ ํ ๊ฒ๊ณผ ์ํ ๊ฒ์ ์ฑ๋ฅ ๋์กฐ, Expert utilization์ ๋ํ ์๊ฐํ(Gating network distribution), wide feature(position bias)์ ๊ด๋ จ๋ CTR ๋์กฐ๋ฅผ ๋ํ๋ด์์ต๋๋ค.
ย
1. YouTube live experiment results for MMoE
์ ํ๋ฅผ ํตํด wide and deep ๊ธฐ๋ฐ์ shared bottom network๋ง์ ์ ์ฉํ ๊ฒ ๋ณด๋ค experts๋ฅผ ์ถ๊ฐํ MMoE๊ฐ ์ฑ๋ฅ์ด ๋ ์ข์ ๊ฒ์ ์ ์ ์์ต๋๋ค. ๋ํ experts๊ฐ ๋ง์์ง์๋ก ์ฑ๋ฅ์ด ์ข์์ง๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
ย
2. Expert utilization for multiple tasks on YouTube
์ ํ๋ Gating network์์ softmax layer์ probability๋ฅผ ๋ํ๋ธ ๊ฒ์
๋๋ค. ํน์ task๊ฐ ํน์ expert๋ฅผ ์ ํธํ๋ ๊ฒฝํฅ์ด ์๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
ย
๊ฒฐ๊ณผ ๋ฐ ์์
์ ํ๋ธ๋ ๊ฐ์ธํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋์
ํ๋ฉด์ ์ฌ๋ฌ ๋๊ด์ ๋ด์ฐฉ์ ํ๋๋ฐ ๊ทธ ์ค ์ด๋ฒ ๋
ผ๋ฌธ์์๋ engagement์ satisfaction, ๊ทธ๋ฆฌ๊ณ bias ๋ฌธ์ ๋ฅผ ์ด๋ป๊ฒ ๋ค๋ฃฐ ๊ฒ์ธ๊ฐ์ ๋ํด ๊น์ด ๋ค๋ฃจ๊ณ ์์ต๋๋ค. engagement์ ๊ฒฝ์ฐ ํด๋ฆญ๊ณผ ๋๋ถ์ด ์์ฒญ์๊ฐ์ ๋ฐ์ํด ํด๊ฒฐํ๊ณ ์ ํ์ผ๋ฉฐ satisfaction์ ๊ฒฝ์ฐ ์ข์์์ ๋ณ์ ์ฌ๋ถ๋ฅผ ํตํด ์ ์ ๊ฐ ์ง์ ์ ์ผ๋ก ์ฃผ๋ ํผ๋๋ฐฑ๋ง์ ์ฌ์ฉํด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ bias์ ๊ฒฝ์ฐ ์์ ๋ญํน๋ ์์์ ๊ฐ์ค์น๋ฅผ ๋ฎ๊ฒ ์ฃผ์ด ๊ณ์์ ์ผ๋ก ํ์ต๋๋ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ์ง ์๋๋ก ์ค๊ณํ์ต๋๋ค. ์ด๋ฅผ ํตํด ์ ํ๋ธ๋ ๋ ๋์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ง๋ค๊ธฐ ์ํด ๋
ธ๋ ฅํ๊ณ ์์ผ๋ก๋ ์ง๊ธ ์๋ ๋ฌธ์ ๋ฅผ ๊ฐ์ ์ํฌ ๋ ๋ค๋ฅธ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ด ๋ฑ์ฅํ์ง ์์๊น ์๊ฐ๋ฉ๋๋ค.
ย