์˜์•ฝํ’ˆ๊ณผ ์‹ํ’ˆ ๊ฐ„ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์•Œ๋ ค์ฃผ๋Š” DFinder
๐Ÿ’Š

์˜์•ฝํ’ˆ๊ณผ ์‹ํ’ˆ ๊ฐ„ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์•Œ๋ ค์ฃผ๋Š” DFinder

Created
Feb 20, 2023
Editor
๐Ÿ“Œ
๋…ผ๋ฌธ ์ œ๋ชฉ | DFinder : a novel end-to-end graph embedding-based method to identify drug-food interactions ์ €์ž | Tao Wang, Jinjin Yang, Yifu Xiao, Jingru Wang, Yuxian Wang, Xi Zeng, Yongtian Wang and Jiajie Peng ์ผ์‹œ | 2023.02.03.
ย 
Bioinformatics ๋ถ„์•ผ๋ฅผ ๋– ์˜ฌ๋ฆฌ๋ฉด ๋Œ€๋ถ€๋ถ„ ๋ฐฉ๋Œ€ํ•œ ์œ ์ „ ์ •๋ณด์ธ DNA๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํŠน์ • ํ˜•์งˆ์˜ ๋ฐœํ˜„ ์—ฌ๋ถ€๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค๋Š” ์ธ์‹์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ทธ ๋ฐ–์˜ Bioinformatics ์—ฐ๊ตฌ ๋ถ„์•ผ๋ฅผ ์†Œ๊ฐœํ•˜๋ฉด์„œ๋„ ์ƒ๋ช… ๋ถ„์•ผ ๋‚ด์—์„œ ๋˜ ๋‹ค๋ฅธ ์„ธ๋ถ€์ ์ธ ์˜์—ญ์ธ ์‹ํ’ˆ์˜ Computational Approach๊ฐ€ ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๊ณ  ์žˆ๋Š”์ง€ ์†Œ๊ฐœํ•˜๊ณ  ์‹ถ์–ด ํ•ด๋‹น DFinder ๋…ผ๋ฌธ์„ ์„ ์ •ํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
์‹œ๊ฐ„์ด ๋ถ€์กฑํ•˜๋‹ค๋ฉด ๐Ÿ‘‰ย ์ธ์Šคํƒ€ ๊ฒŒ์‹œ๊ธ€ ๋งํฌ
ย 
ย 

0. ์ฝ๊ธฐ ์ „ ์ฐธ๊ณ ํ•˜๋ฉด ์ข‹์€ ์‚ฌ์ „ ์ง€์‹


๐Ÿ’ก
DNN
DNN์— ๋Œ€ํ•ด ๋จผ์ € ์•Œ๊ธฐ ์ „ ์ธ๊ณต์ง€๋Šฅ, ๋จธ์‹ ๋Ÿฌ๋‹, ๋”ฅ๋Ÿฌ๋‹์— ๋Œ€ํ•ด ๋จผ์ € ์•Œ์•„๋ณผ ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ธ๊ณต์ง€๋Šฅ : ์ธ๊ฐ„์˜ ์ง€๋Šฅ์„ ๊ธฐ๊ณ„ ๋“ฑ์— ์ธ๊ณต์ ์œผ๋กœ ๊ตฌํ˜„ํ•œ ๊ฒƒ์„ ๋งํ•ฉ๋‹ˆ๋‹ค;
  • ๋จธ์‹ ๋Ÿฌ๋‹ : ์ปดํ“จํ„ฐ๊ฐ€ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๊ธฐ์ˆ ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๋ถ„์•ผ๋ฅผ ๋œปํ•ฉ๋‹ˆ๋‹ค.
  • ๋”ฅ๋Ÿฌ๋‹ : ์—ฌ๋Ÿฌ ๋น„์„ ํ˜• ๋ณ€ํ™˜๊ธฐ๋ฒ•์˜ ์กฐํ•ฉ์„ ํ†ตํ•ด ๋†’์€ ์ˆ˜์ค€์˜ ์ถ”์ƒํ™”(๋‹ค๋Ÿ‰์˜ ๋ณต์žกํ•œ ์ž๋ฃŒ๋“ค์—์„œ ํ•ต์‹ฌ์ ์ธ ๋‚ด์šฉ๋งŒ์„ ์ถ”๋ ค๋‚ด๋Š” ์ž‘์—…)์„ ์‹œ๋„ํ•˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ง‘ํ•ฉ์ž…๋‹ˆ๋‹ค.
ย 
๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•œ ๋ถ„์•ผ์ธ ๋”ฅ๋Ÿฌ๋‹์€ ์ธ๊ณต์‹ ๊ฒฝ๋ง(ANN, Artificial Neural Network)์„ ๊ธฐ์ดˆ๋กœ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ANN์„ ์ธ๊ณต ๋‰ด๋Ÿฐ์ธ Node์— ๋น„์œ ํ•œ๋‹ค๋ฉด ๋“ค์–ด์˜จ ์ž๊ทน์€ ANN์—์„œ Input Data์ด๋ฉฐ ์ตœ์†Œํ•œ์˜ ์‹ ํ˜ธ ์ „๋‹ฌ ์š”๊ฑด์ธ ์ž„๊ณ„๊ฐ’์€ ๊ฐ€์ค‘์น˜(Weight), ์ž๊ทน์— ์˜ํ•ด ํ–‰๋™์„ ํ•˜๋Š” ๊ฒƒ์€ Output Data์ž…๋‹ˆ๋‹ค.
์‹ ๊ฒฝ๋ง์€ ์ž…๋ ฅ์ธต, ์ถœ๋ ฅ์ธต๊ณผ ๊ทธ ์‚ฌ์ด์˜ ์€๋‹‰์ธต์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ์€๋‹‰์ธต์˜ ์ˆ˜์™€ ๋…ธ๋“œ์˜ ๊ฐœ์ˆ˜๋ฅผ ๊ตฌ์„ฑํ•˜๋Š” ๊ฒƒ์„ ๋ชจ๋ธ์„ ๊ตฌ์„ฑํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์„ ์ž˜ ๊ตฌ์„ฑํ•˜์—ฌ ์›ํ•˜๋Š” Output ๊ฐ’์„ ์ž˜ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์ด ์ตœ์ข… ๋ชฉํ‘œ์ด๊ณ  ์€๋‹‰์ธต์—์„œ๋Š” ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ตœ์ ์˜ ๊ฐ€์ค‘์น˜์™€ ํŽธ์ฐจ๋ฅผ ์ฐพ์•„๋‚ด๋Š”๋ฐ ์ตœ์ ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ฐพ๋Š” ๊ณผ์ •์ด ์–ด๋ ต๊ณ  ์€๋‹‰์ธต์˜ ๊ฐœ์ˆ˜๊ฐ€ ํ•™์Šต ์‹œ๊ฐ„์— ๋งŽ์€ ์˜ํ–ฅ์„ ๋ฏธ์นœ๋‹ค๋Š” ๋ฌธ์ œ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
์ด๋Ÿฌํ•œ ANN ๊ธฐ๋ฒ•์˜ ์—ฌ๋Ÿฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ  ์€๋‹‰์ธต์„ ๋Š˜๋ฆฌ๋ฉด์„œ๋„ ํ•™์Šต์˜ ๊ฒฐ๊ณผ๋ฅผ ํ–ฅ์ƒํ•œ ๋ฐฉ๋ฒ•์„ DNN(Deep Neural Network)์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. DNN์„ ์‘์šฉํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด CNN, RNN์ธ ๊ฒƒ์ด๊ณ  ์ด ์™ธ์—๋„ LSTM ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
ย 
๐Ÿ’ก
ReLu ํ•จ์ˆ˜
ReLu ํ•จ์ˆ˜๋Š” ์€๋‹‰์ธต์—์„œ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋Š” ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ReLu ํ•จ์ˆ˜๋Š” ๋”ฅ๋Ÿฌ๋‹ ์—ญ์‚ฌ์— ์žˆ์–ด ํ•œ ํš์„ ๊ทธ์€ ํ™œ์„ฑํ™” ํ•จ์ˆ˜์ธ๋ฐ, ReLu ํ•จ์ˆ˜๊ฐ€ ๋“ฑ์žฅํ•˜๊ธฐ ์ด์ „์—” ์ถœ๋ ฅ ๊ฐ’์˜ ๋ฒ”์œ„๊ฐ€ 0์—์„œ 1 ์‚ฌ์ด์ด๊ณ  ๋ ˆ์ด์–ด(Layer)๋ฅผ ๊ฑฐ์น˜๋ฉด ๊ฑฐ์น ์ˆ˜๋ก ๊ฐ’์ด ๋„ˆ๋ฌด ์ž‘์•„์ ธ์„œ Vanishing Gradient ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ํ˜„์ƒ์ด ๋ฐœ์ƒํ•˜๋Š” ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜๋ฅผ ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋กœ ์‚ฌ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค.
notion image
ReLu ํ•จ์ˆ˜๋Š” ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์–‘์ˆ˜๋Š” ๊ทธ๋Œ€๋กœ, ์Œ์ˆ˜๋Š” 0์œผ๋กœ ๋ฐ˜ํ™˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ถœ๋ ฅ๊ฐ’์˜ ๋ฒ”์œ„๊ฐ€ ๋„“๊ณ  ์–‘์ˆ˜์ผ ๋•Œ ์ž๊ธฐ ์ž์‹ ์„ ๊ทธ๋Œ€๋กœ ๋ฐ˜ํ™˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ธฐ์กด ํ™œ์„ฑํ™” ํ•จ์ˆ˜์— ๋น„ํ•ด ํŽธ๋ฏธ๋ถ„์œผ๋กœ ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ตฌํ•  ๋•Œ 1๋กœ ์ผ์ •ํ•˜๋ฏ€๋กœ ๊ฐ€์ค‘์น˜ ์—…๋ฐ์ดํŠธ ์†๋„๊ฐ€ ๋งค์šฐ ๋น ๋ฆ…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ž…๋ ฅ๊ฐ’์ด ์Œ์ˆ˜๋ฉด ๊ธฐ์šธ๊ธฐ๊ฐ€ 0์ด ๋˜์–ด ๊ฐ€์ค‘์น˜ ์—…๋ฐ์ดํŠธ๊ฐ€ ์•ˆ ๋˜๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์ค‘์น˜๊ฐ€ ์—…๋ฐ์ดํŠธ๋˜๋Š” ๊ณผ์ •์—์„œ ๊ฐ€์ค‘์น˜ ํ•ฉ์ด ์Œ์ˆ˜๊ฐ€ ๋˜๋Š” ์ˆœ๊ฐ„ ๋ ๋ฃจ๋Š” 0์„ ๋ฐ˜ํ™˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํ•ด๋‹น ๋‰ด๋Ÿฐ์€ ๊ทธ ์ดํ›„๋กœ 0๋งŒ ๋ฐ˜ํ™˜ํ•˜๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ย 
๐Ÿ’ก
DFIs
Drug-Food Interactions์˜ ์•ฝ์ž๋กœ "์„ญ์ทจํ•œ๋‹ค"๋Š” ๊ณตํ†ต์ ์ด ์žˆ๋Š” ์‹ํ’ˆ๊ณผ ์•ฝ์˜ ์ƒํ˜ธ์ž‘์šฉ์— ๋Œ€ํ•ด ์—ฐ๊ตฌํ•˜๋Š” ํ•™๋ฌธ์ž…๋‹ˆ๋‹ค. ์•ฝ๋ฌผ์„ ์Œ์‹, ์Œ๋ฃŒ, ๋ณด์ถฉ์ œ ํ˜น์€ ๋˜ ๋‹ค๋ฅธ ์•ฝ๋ฌผ๊ณผ ํ•จ๊ป˜ ๋จน์—ˆ์„ ๋•Œ ๋‚˜ํƒ€๋‚˜๋Š” ์•ฝ๋ฌผ์˜ ํšจ๋Šฅ์„ ๋งํ•ฉ๋‹ˆ๋‹ค.
ย 
ย 

1. Introduction


1.1. ์—ฐ๊ตฌ ๋™๊ธฐ ์†Œ๊ฐœ

Drug-Food Interactions (DFIs)๋ž€ ์Œ์‹์˜ ๊ตฌ์„ฑ์š”์†Œ๊ฐ€ ์–ด๋–ป๊ฒŒ ์•ฝ์˜ ํšจ๋Šฅ์— ์˜ํ–ฅ์„ ๋ฏธ์น ์ง€ ์•ฝ์—ญํ•™ ๋“ฑ ์ƒํ˜ธ ์ž‘์šฉ์„ ์—ฐ๊ตฌํ•˜๋Š” Bioinformatics ๋ถ„์•ผ ์ค‘ ํ•œ ์ฃผ์ œ์ž…๋‹ˆ๋‹ค.
ย 
DFIs๋Š” ์˜๋ฃŒ, ์ƒ๋ฌผ์˜ํ•™ ์„œ์ ์—์„œ ์‹œ์ž‘๋˜์—ˆ๋Š”๋ฐ ์ œํ•œ์ ์ธ ์•ฝ๊ณผ ์‹ํ’ˆ ์ข…๋ฅ˜๋งŒ ๋‹ค๋ฃจ๊ณ  ์žˆ๋‹ค๋Š” ์ , DFIs์˜ ๋Œ€๋ถ€๋ถ„์ด ์‹œ๊ฐ„๊ณผ ์—ฐ๊ตฌ๋น„๊ฐ€ ๋งŽ์ด ๋“œ๋Š” "์–ด๋–ป๊ฒŒ ์‹ํ’ˆ์ด ์•ฝ์˜ ํšจ๊ณผ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€"์— ๋Œ€ํ•œ ์ƒ๋ช…๊ณตํ•™์  ๊ฒฐ๊ณผ๋ฅผ ๋ฐํžˆ๋Š” ๊ฒƒ์—๋งŒ ์ง‘์ค‘ํ•˜๊ณ  ์žˆ๋‹ค๋Š” ์ ์—์„œ ํ•œ๊ณ„๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์–‘์งˆ์˜ DFI ๋ฐ์ดํ„ฐ์…‹์ด ๋ถ€์กฑํ•˜๊ณ  ์‹ํ’ˆ์€ ๋งŽ์€ ํ™”ํ•™๋ฌผ์งˆ๋กœ ๊ตฌ์„ฑ๋˜์–ด์žˆ๋Š” ๋ณตํ•ฉ์ฒด์ด๊ธฐ ๋•Œ๋ฌธ์— DFI๋ฅผ ์ž˜ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋Š”, ์ž˜ ๊ตฌ์ถ•๋œ ์ปดํ“จํ„ฐ์  ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋งŽ์ด ์—†๋‹ค๋Š” ๋ฌธ์ œ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์—ฐ๊ตฌ์ž๋“ค์€ ์‹ํ’ˆ์˜ ํŠน์ง•์„ โ€œ์ž˜โ€ ์ถ”์ถœํ•˜์—ฌ ํ•™์Šตํ•˜๊ณ  ์•ฝ๊ณผ ์‹ํ’ˆ ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ์„ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•ด ๋…ผ๋ฌธ์„ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค.
ย 

1.2. ์‹œ์‚ฌ์ 

๋…ผ๋ฌธ์—์„œ ์ œ์‹œํ•œ ๋ฐ์ดํ„ฐ ์…‹ ๊ตฌ์„ฑ ๋ฐฉ๋ฒ•๊ณผ ๋ชจ๋ธ์˜ ๊ฐ€์น˜๋ฅผ ๊ฐ„๋žตํ•˜๊ฒŒ ์š”์•ฝํ•˜์—ฌ ์„ค๋ช…ํ•˜๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.
DFI Data๋Š” DrugBank-DFI์™€ PubMed-DFI๋ผ๋Š” 2๊ฐœ์˜ ๋ฐ์ดํ„ฐ ์…‹์„ ๊ตฌ์ถ•ํ•˜์˜€์Šต๋‹ˆ๋‹ค. DFinder๋Š” End-to-end Embedding-based Method๋กœ ์•ฝ๊ณผ ์‹ํ’ˆ ์˜์–‘์†Œ ๊ฐ„ ํŠน์ง•์„ ํ•™์Šตํ•˜์—ฌ DFIs๋ฅผ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ๊ตฌ์„ฑ๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ํ•ด๋‹น ๋ชจ๋ธ์€ Deep Neural Network๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ธฐ์กด ๋…ธ๋“œ ํŠน์„ฑ์œผ๋กœ๋ถ€ํ„ฐ ํŠน์ง•์„ ์ถ”์ถœํ•˜๋Š” <Attribute Feature Extraction> ๋ถ€๋ถ„๊ณผ Graph Convolution Network-based Method ๊ธฐ๋ฐ˜์˜ <Structure Feature Extraction> ํŒŒํŠธ๋กœ ๋‚˜๋ˆ„์–ด์ ธ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ•ด๋‹น ๋…ผ๋ฌธ์˜ ์š”๊ฑด์€ ์•ฝ๊ณผ ์Œ์‹์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ํŒŒ์•…ํ•˜๋Š” DFIs ๋ถ„์•ผ์—์„œ DFinder ๋ชจ๋ธ์„ ์ด์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ ์…‹์„ ํ•™์Šตํ•˜๋ฉด ๋‹ค๋ฅธ ๊ธฐ์กด์˜ ๋ชจ๋ธ๋ณด๋‹ค ๋” ๋†’์€ ์„ฑ๋Šฅ์„ ๋Œ์–ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
ย 
ย 

2. Materials and Methods


2.1. Experimental Setup

DFI network๋ฅผ ํ†ตํ•ด์„œ DFinder ๋ชจ๋ธ๋กœ DFIs๋ฅผ ์‹๋ณ„ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ž…๋‹ˆ๋‹ค. ํ•ด๋‹น ๋…ผ๋ฌธ์€ DFI Network cConstruction๊ณผ Computational Framework for DFI Prediction์ด๋ผ๋Š” ์ด 2๊ฐœ์˜ ํŒŒํŠธ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๊ณ  ๊ฐ„๋žตํ•˜๊ฒŒ ์š”์•ฝ์„ ํ•˜๋ฉด ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.
  • DFI Network Construction
    • DFinder ๋ชจ๋ธ์„ ์ด์šฉํ•˜๊ธฐ ์ „ ์•ฝ ๊ด€๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ์–ด๋–ป๊ฒŒ ์ˆ˜์ง‘ํ–ˆ๋Š”๊ฐ€์— ๋Œ€ํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.
    • DrugBank Database์—์„œ DrugBank-DFI Dataset๋ฅผ ์ถ”์ถœํ•˜์˜€์Šต๋‹ˆ๋‹ค.
    • PubMed์—์„œ ํ…์ŠคํŠธ ๋งˆ์ด๋‹ ๊ธฐ๋ฒ•์„ ํ†ตํ•ด PubMed-DFI Dataset์„ ์ถ”์ถœํ•˜์˜€์Šต๋‹ˆ๋‹ค.
    • ์œ„ ๋‘ Dataset์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฐ๊ฐ์˜ DFI Network๋ฅผ ๊ตฌ์ถ•ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
  • Computational Framework for DFI Prediction
    • ๋ชจ๋ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.
    • Bayesian Personalized Ranking (BPR) Loss ๋ฐฉ์‹์œผ๋กœ ์ตœ์ ํ™”๋ฅผ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
๊ฐ ํ•ญ๋ชฉ์— ๋Œ€ํ•œ ์„ธ๋ถ€ ์„ค๋ช…์€ ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.
ย 

2.2. link prediction

DFIs๋Š” Drugs์™€ Food๊ฐ€ ์ด๋ถ„ ๊ทธ๋ž˜ํ”„์˜ ๋…ธ๋“œ์ด๊ณ  ์ด๋“ค ๊ฐ„ ๊ด€๊ณ„๊ฐ€ ์—ฃ์ง€์ธ ๋„คํŠธ์›Œํฌ๋กœ ํ‘œํ˜„๋  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ถ„ ๊ทธ๋ž˜ํ”„(๋„คํŠธ์›Œํฌ)๋Š” Biomedical Entities ๊ฐ„(์—ฌ๊ธฐ์„œ๋Š” ์•ฝ-์‹ํ’ˆ) ์ƒํ˜ธ์ž‘์šฉ์„ ์˜ˆ์ธกํ•˜๋Š”๋ฐ ์“ฐ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ Link Prediction ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๊ทธ๋ž˜ํ”„ ๋ถ„์„ ๋ฐฉ์‹์ด Embedding Method์ž…๋‹ˆ๋‹ค. DFinder ๋ชจ๋ธ์€ ์ด๋Ÿฌํ•œ ์ž„๋ฒ ๋”ฉ ๋ฐฉ์‹์„ ์ฐจ์šฉํ–ˆ์œผ๋ฉฐ ์ž…๋ ฅ ๋ฐ ์ถœ๋ ฅ์„ ์ง์ ‘ ๊ณ ๋ คํ•˜์—ฌ ๋„คํŠธ์›Œํฌ ๊ฐ€์ค‘์น˜๋ฅผ ์ตœ์ ํ™” ํ•˜๋Š” ํ•™์Šต์„ ์ข…๋‹จ ๊ฐ„ ํ•™์Šต(End-to-End Learning)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
ย 

2.3. Dataset ๋งˆ๋ จ ๋ฐฉ๋ฒ• ๋ฐ ๋ชจ๋ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋จผ์ € ์–ด๋–ป๊ฒŒ DFI ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ DFI Networks๋ฅผ ๊ตฌ์ถ•ํ•˜์˜€๋Š”์ง€์— ๋Œ€ํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.
ย 
<DFI Network Construction>
  • DFI Network Based on DrugBank
    • DrugBank : ์•ฝ๋ฌผ ์ƒํ˜ธ์ž‘์šฉ, ์•ฝ๋ฆฌํ•™, ํ™”ํ•™ ๊ตฌ์กฐ, ํƒ€๊ฒŸ, ๊ธฐ์ „ ๋“ฑ์˜ ํŠน์ • ์•ฝ์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๋‹ด๊ณ  ์žˆ๋Š” ์‚ฌ์ดํŠธ์ž…๋‹ˆ๋‹ค.
      • DrugBank ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ DFI์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๋‹ด๊ณ  ์žˆ๋Š” 3000๋ฌธ์žฅ์„ ํฌํ•จํ•˜๋Š” DFI ๋ฐ์ดํ„ฐ(XML ํ˜•ํƒœ)๋ฅผ ์ˆ˜์ง‘ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
      • ํ•˜์ง€๋งŒ "๊ณต๋ณต์— ๋“œ์„ธ์š”.", "์‹์ „ ์ ์–ด๋„ 1์‹œ๊ฐ„ ์ „์— ๋“œ์„ธ์š”."์™€ ๊ฐ™์ด ์•ฝ ๋ณต์šฉ ์‹œ ์‹œ๊ฐ„์„ ๋‚˜ํƒ€๋‚ด๋Š” ํ‘œํ˜„๊ณผ "์ด ์•ฝ์€ ์Œ์‹๊ณผ ํ•จ๊ป˜ ๋“œ์„ธ์š”"์ฒ˜๋Ÿผ ํŠน์ • ์Œ์‹์„ ์ง€์นญํ•˜์ง€ ์•Š์•„ ์•ฝ๊ณผ ๋ช…ํ™•ํ•œ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๋ณด์—ฌ์ฃผ์ง€ ์•Š๋Š” ๋ฌธ์žฅ์€ ์‚ญ์ œํ•˜์˜€์Šต๋‹ˆ๋‹ค.
      • ์Œ์‹ ๊ตฌ์„ฑ ์š”์†Œ์™€ ์•ฝDrug ๊ฐ„ ๋ถˆ๋ช…ํ™•ํ•œ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋ฌธ์žฅ์„ ์ œ๊ฑฐํ•˜์˜€์Šต๋‹ˆ๋‹ค.
    • FOODB : ์‹ํ’ˆ ๋‚ด ์˜์–‘์†Œ ์ •๋ณด์˜ ์ด ์ง‘ํ•ฉ์ž…๋‹ˆ๋‹ค.
      • DFIs์— ํฌํ•จ๋œ ์Œ์‹ ์ •๋ณด๋Š” ์•„๋ณด์นด๋„, ์น˜์ฆˆ์™€ ๊ฐ™์€ ์Œ์‹ ํ˜•ํƒœ์™€ ๋น„ํƒ€๋ฏผC, ์•„์—ฐ๊ณผ ๊ฐ™์€ ์˜์–‘์†Œ ํ˜•ํƒœ๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ํ’ˆ์„ ์Œ์‹ ๋‚ด ์กด์žฌํ•˜๋Š” ์ƒ์œ„ 20๊ฐœ์˜ ์˜์–‘์†Œ๋กœ ๋Œ€์ฒดํ•˜์—ฌ ์‹ค์งˆ์ ์œผ๋กœ ์•ฝ๊ณผ ์˜์–‘์†Œ ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ์„ ํŒŒ์•…ํ•˜๋ ค๊ณ  ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
notion image
ย 
  • DFI Network Based on PubMed
    • Co-Occurrence-Based Text Mining Method
      • ๋™์‹œ์„ฑ์„ ์ด์šฉํ•˜์—ฌ ๊ฐ™์€ ๋ฌธ์„œ ๋‚ด ์–ธ๊ธ‰๋˜๋Š” ๋‘ ๋…๋ฆฝ์ฒด(๊ฐ๊ฐ ์‹ํ’ˆ๊ณผ ์•ฝ)๋Š” ์—ฐ๊ด€ ๊ด€๊ณ„๊ฐ€ ๋†’๋‹ค๋Š” ๊ฐ€์ •์„ ํ†ตํ•ด ์‹ํ’ˆ-์•ฝ ์Œ(Pair)์„ ๋งŒ๋“œ๋Š” ํ…์ŠคํŠธ ๋งˆ์ด๋‹ ๊ณผ์ •์„ ๊ฑฐ์ณค์Šต๋‹ˆ๋‹ค.
      • ๊ด€๋ จ 3๊ฐ€์ง€ ๊ทœ์น™
        • 1) 20๋ฒˆ ์ด์ƒ์˜ ์•ฝ-์Œ์‹ ๊ตฌ์„ฑ ์š”์†Œ ์Œ์˜ ๋™์‹œ์„ฑ์ด ํ™•์ธ๋˜์—ˆ์„ ๋•Œ๋งŒ DFIs ์—ฐ๊ตฌ๋กœ์จ ์‹ํ’ˆ๊ณผ ์•ฝ์˜ ์ƒํ˜ธ ์—ฐ๊ด€์„ฑ์ด ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์ธ์ •ํ•ฉ๋‹ˆ๋‹ค.
        • 2) ์˜ˆ๋ฅผ ๋“ค์–ด ๋น„ํƒ€๋ฏผC(์˜์–‘์†Œ, FooDB)๊ฐ€ ์•ฝDrug ๊ทธ ์ž์ฒด์ผ ๋•Œ ์ค‘๋ณต๋˜์—ˆ์œผ๋ฏ€๋กœ ์ œ๊ฑฐํ•ฉ๋‹ˆ๋‹ค.
        • 3) ๊ฐ™์€ ๋…ผ๋ฌธ์— ์‹ค๋ ค ์žˆ๋Š” ์‹ํ’ˆ-์•ฝ Pair๋Š” ์ฃผ์ œ๊ฐ€ ๊ฐ™๊ธฐ ๋•Œ๋ฌธ์— ๋ถˆ๊ฐ€ํ”ผํ•˜๊ฒŒ ์–ธ๊ธ‰์ด ๋งŽ์ด ๋œ ๊ฒƒ์ผ ์ˆ˜๋„ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ๋ณด์ •ํ•˜์—ฌ ์œ ์‚ฌ์„ฑ์„ ๊ณ ๋ คํ•ฉ๋‹ˆ๋‹ค.
ย 
๊ทธ ๋‹ค์Œ์œผ๋กœ๋Š” ๋ชจ๋ธ์˜ ์ž‘๋™ ์›๋ฆฌ์— ๋Œ€ํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.
ย 
<Computational Framework for DFI Prediction>
  • Attribute Feature Extraction (Feature Space)
    • Original Node Attribute Information์˜ ์ฐจ์›์„ ์ถ•์†Œํ•˜๊ธฐ ์œ„ํ•ด DNN์„ ์‚ฌ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค.
    • ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋Š” ReLu ์ž…๋‹ˆ๋‹ค.
    • ์œ„์ƒํ•™์  ํŠน์„ฑ๊ณผ ๋…ธ๋“œ ํŠน์ง•์„ ํ•ฉํ•ด์„œ ์ตœ์ข… ์ž„๋ฒ ๋”ฉ์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค.
    • ๋…ผ๋ฌธ์—์„œ๋Š” DNN์„ 4๊ฐœ์˜ ์ธต์œผ๋กœ ๊ตฌ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค.
    • ์˜ˆ์ธก ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด SSP๋ฅผ ํŠน์ง• ๋ฒกํ„ฐ๋กœ ์„ ํƒํ•˜์˜€์Šต๋‹ˆ๋‹ค.
  • Structure Feature Extraction
Graph data๋ฅผ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ์„ ํƒ๋œ ์‹ ๊ฒฝ๋ง ๊ตฌ์กฐ๋Š” GCN(Graph Convolutional Networks)์ž…๋‹ˆ๋‹ค. GCN์€ ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ์— ๋Œ€ํ•ด Convolution ์—ฐ์‚ฐ์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
์ผ๋ฐ˜์ ์ธ CNN(Convolutional Neural Networks)์€ ํ•œ ์นธ์”ฉ ์˜ฎ๊ฒจ๊ฐ€๋ฉฐ ํ•ด๋‹น ์นธ์˜ ํŠน์ง•๋“ค์„ Aggregationํ•จ์œผ๋กœ์จ Local feature๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  CNN์€ ๊ฐ ํŠน์ง•๋งˆ๋‹ค ๋‹ค๋ฅธ ์‹ ๊ฒฝ๋ง์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹Œ, ๊ฐ€์ค‘์น˜๋ฅผ ๊ณต์œ ํ•˜๋Š” ์‹ ๊ฒฝ๋ง์„ ์‚ฌ์šฉํ•จ์œผ๋กœ์จ ํšจ์œจ์ ์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
ํ•˜์ง€๋งŒ ์ด๋Ÿฐ CNN ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ž˜ํ”„ ๋ฐ์ดํ„ฐ์— ์‚ฌ์šฉํ•˜๊ธฐ์—” ์–ด๋ ต๋‹ค๋Š” ๋ฌธ์ œ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜ํ”„ ๋ฐ์ดํ„ฐ๋Š” ์ด์›ƒํ•˜๋Š” ๋…ธ๋“œ์˜ ๊ฐœ์ˆ˜๊ฐ€ ์ผ์ •ํ•˜์ง€ ์•Š๊ณ , ๊ทธ๋ž˜ํ”„์˜ ๋…ธ๋“œ๋“ค์˜ ์ˆœ์„œ๊ฐ€ ๋ฐ”๋€Œ์—ˆ์„ ๋•Œ๋„ Output์ด ์œ ์ง€๋˜๋Š” Permutation invariance๊ฐ€ ์œ ์ง€๋˜์–ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ๊ทธ๋ž˜ํ”„ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด CNN๊ณผ ๋น„์Šทํ•œ ํŠน์„ฑ์„ ๊ณต์œ ํ•˜๋Š” Neural Network์ธ GCN์ด ๊ณ ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
ย 
GCN์˜ Propagation rule์€ ์•„๋ž˜ ์ˆ˜์‹๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.
Z^((l+1))=ฯƒ(D หœ^(-1/2) A หœD หœ^(-1/2) Z^((l)) W^l )
  • A^์€ A+In๋กœ ํ•ญ๋“ฑ ํ–‰๋ ฌ์ด ์ถ”๊ฐ€๋œ ์ธ์ ‘ ํ–‰๋ ฌ์ž…๋‹ˆ๋‹ค.
  • D๋Š” ์ฐจ์ˆ˜ ํ–‰๋ ฌ๋กœ, ์ธ์ ‘ํ–‰๋ ฌ A์—์„œ ๊ฐ ๋…ธ๋“œ์˜ ์ฐจ์ˆ˜ ์ •๋ณด๋ฅผ ํ•ฉํ•œ ํ–‰๋ ฌ์ž…๋‹ˆ๋‹ค.
  • W^l๋Š” Layer l์— ๋”ฐ๋ผ ๋‹ค๋ฅธ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ์ž…๋‹ˆ๋‹ค.
  • ฯƒ ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋กœ ์œ„ ์‹์—์„œ๋Š” ๋น„์„ ํ˜• ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
ย 
ํ•˜์ง€๋งŒ ์—ฐ๊ตฌ์ž๋“ค์€ ์ผ๋ฐ˜์ ์ธ GCN์„ ๊ทธ๋ž˜ํ”„์˜ ํŠน์ง•์„ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค โ€œ์—ฐ๊ฒฐ ์—ฌ๋ถ€โ€๋ฅผ ๋” ์ง‘์ค‘์ ์œผ๋กœ ํŒŒ์•…ํ•˜์—ฌ ํšจ์œจ์ ์œผ๋กœ ํ›ˆ๋ จํ•  ์ˆ˜ ์žˆ๋Š” LightGCN์„ ์„ ํƒํ•˜์˜€์Šต๋‹ˆ๋‹ค. LightGCN์˜ Propagation Rule์€ ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.
T_D^((l+1)) =โˆ‘_(FโˆˆN_D )โ€Š1/(โˆš(|N_D | ) โˆš(|N_F | )) T_F^((l))
T_F^((l+1))=โˆ‘_(DโˆˆN_F )โ€Š1/(โˆš(|N_F | ) โˆš(|N_D | )) T_D^((l))
  • ์ฒซ ๋ฒˆ์งธ์™€ ๋‘ ๋ฒˆ์งธ๋Š” ๊ฐ๊ฐ ์•ฝDrug๊ณผ ์‹ํ’ˆFood constituent ๋…ธ๋“œ ๊ฐ„ ์—ฐ๊ฒฐ ๋„คํŠธ์›Œํฌ๋ฅผ ํŒŒ์•…ํ•˜๋Š” ์ˆ˜์‹์ž…๋‹ˆ๋‹ค.
  • ๋‘ ์‹ ๋ชจ๋‘ ๊ทธ๋ž˜ํ”„ Convolution ์—ฐ์‚ฐ ์‹œ ์Šค์ผ€์ผ์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ปค์ง€๋Š” ๊ฒƒ์„ ๋ง‰๊ธฐ ์œ„ํ•ด ์ •๊ทœํ™”๋ฅผ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
ย 
์ตœ์ข…์ ์œผ๋กœ ๊ทธ๋ž˜ํ”„์˜ ์œ„์ƒํ•™์  ํŠน์ง•์„ ์ถ”์ถœํ•˜๋Š” ์‹์€ ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.
T_D=1/(K+1) โˆ‘_(k=0)^Kโ–’ T_D^((k))
T_F=1/(K+1) โˆ‘_(k=0)^Kโ–’ T_F^((k))
  • LightGCN์˜ Layer์—์„œ ์–ป์€ ์ž„๋ฒ ๋”ฉ์„ ๊ฒฐํ•ฉํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
ย 
ย 
์œ„ ๋‚ด์šฉ์˜ ์ „์ฒด์ ์ธ ํ๋ฆ„์„ ์‚ดํŽด๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.
  • The Framwork of DFinder
    • notion image
A ๋ถ€๋ถ„์€ Attribute Feature Extraction ๊ณผ์ •์œผ๋กœ ์ฃผ์–ด์ง„ ์•ฝ๋ฌผ ๋˜๋Š” ์‹ํ’ˆ ๊ตฌ์„ฑ ์š”์†Œ์˜ ๊ณ ์œ ํ•œ ํŠน์ง•์„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋Š” SSP๋ฅผ ํŠน์ง• ๋ฒกํ„ฐ๋กœ ์ƒ์„ฑํ•˜์—ฌ DNN์— Inputํ•จ์œผ๋กœ์จ Attribute Feature๋ฅผ ํ•™์Šตํ•œ ๋’ค Output์œผ๋กœ ์ €์ฐจ์› ์ž„๋ฒ ๋”ฉ์„ ์–ป์—ˆ์Šต๋‹ˆ๋‹ค.
B ๋‹จ๊ณ„๋Š” Structure Feature Extraction ๊ณผ์ •์ž…๋‹ˆ๋‹ค. ์ด๋ถ„ ๊ทธ๋ž˜ํ”„์—์„œ Drug Node์™€ Food Constituent Node ๊ฐ„ ์—ฐ๊ฒฐ์„ ์˜ˆ์ธกํ•˜๋Š” Link Prediction ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋˜๋Š” LightGCN์„ ์ด์šฉํ•˜์—ฌ Topological Structure๋ฅผ ํŒŒ์•…ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
์œ„ ๋‘ ๊ณผ์ •์„ ํ†ตํ•ด์„œ ์–ป์€ ์ž„๋ฒ ๋”ฉ์„ ์—ฐ์ ‘ํ•œ ๋’ค C ํŒŒํŠธ์—์„œ Drug์™€ Food Constituent์˜ ํŠน์ง• ์ถ”์ถœ ์ตœ์ข… ๊ฒฐ๊ณผ๋ฅผ ๋‚ด์  ํ•˜์—ฌ DFIs๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ์ดํ›„ ๊ด€์ฐฐ๋œ DFIs์™€ ๊ด€์ฐฐ๋˜์ง€ ์•Š๋Š” DFIs๋ฅผ ์ด์šฉํ•ด BPR Loss๋กœ ๋ชจ๋ธ์„ ์ตœ์ ํ™”ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
ย 
ย 

3. ๊ฒฐ๊ณผ


3.1. ์„ฑ๋Šฅ ํ‰๊ฐ€ ์ ˆ์ฐจ

<Experimental Settings>
notion image
DFinder ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด โ€œDrugBank-DFI์™€ PubMed-DFI์„ ๊ฐ๊ฐ ํ…Œ์ŠคํŠธํ•˜์˜€์Šต๋‹ˆ๋‹ค.โ€
ย 
์œ„์˜ ๋‘ ๋ฐ์ดํ„ฐ ์…‹์€ Positive Samples์ž…๋‹ˆ๋‹ค. ๋žœ๋ค์œผ๋กœ ์„ ํƒํ•˜์—ฌ Training Set 80%, Testing Set 20%๋กœ ๋‚˜๋ˆ„์—ˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜์˜ ๋‘ ๋ฐ์ดํ„ฐ ์…‹์€ Negative samples์ž…๋‹ˆ๋‹ค. Train Set๊ณผ Test Set ๋ชจ๋‘ Positive samples์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ 8:2๋กœ ๋‚˜๋ˆ„์—ˆ์Šต๋‹ˆ๋‹ค.
ย 
DFIs๋Š” ์‹ํ’ˆ๊ณผ ์•ฝ Drug ๋…ธ๋“œ ๊ฐ„ ์—ฐ๊ฒฐ ๋„คํŠธ์›Œํฌ๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋งํฌ ์˜ˆ์ธก์€ ๋„คํŠธ์›Œํฌ์—์„œ ๋‘ entity ๊ฐ„์˜ ๋งํฌ ์กด์žฌ๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— AUROC์™€ AUPR๋กœ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
์„ฑ๋Šฅ ํ‰๊ฐ€์—์„œ DFinder ๋ชจ๋ธ์„ ๋‹ค๋ฅธ 12๊ฐœ์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋น„๊ตํ•˜์˜€๊ณ  ์ •ํ™•ํ•œ ์˜ˆ์ธก์„ ์œ„ํ•ด์„œ ๋žœ๋ค์œผ๋กœ ๋ฐ์ดํ„ฐ ์…‹์„ 5๋ฒˆ ๋‚˜๋ˆ„์—ˆ์Šต๋‹ˆ๋‹ค.
ย 

3.2. Performance Evaluation on DrugBank-DFI

DFinder ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์„ ํƒํ•œ ์ฒซ ๋ฒˆ์งธ ๋ฐ์ดํ„ฐ์…‹์ด๊ณ  ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค์— ๋น„ํ•ด ์••๋„์ ์œผ๋กœ ์„ฑ๋Šฅ ์ง€ํ‘œ ์ˆ˜์น˜๊ฐ€ ๋†’๊ฒŒ ๋‚˜์™”์Šต๋‹ˆ๋‹ค.
notion image
ย 

3.3. Performance Evaluation on PubMed-DFI

๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ์ตœ๊ณ ์˜ ์„ฑ๋Šฅ์„ ์ž๋ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค.
notion image
ย 
ย 
โ€œDFinder has significantly improved the performance of DFI identification.โ€
ย 
ย 

4. ๋…ผ๋ฌธ์˜ ํ™œ์šฉ ๊ฐ€์น˜


DFI Data๊ฐ€ ๋ถ€์กฑํ•˜์ง€๋งŒ ๋‹ค๋ฅธ ์‚ฌ์ดํŠธ๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ์…‹์„ ๊ตฌ์ถ•ํ•˜์—ฌ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•จ์œผ๋กœ์จ ์•ž์œผ๋กœ ์ด ๋ถ„์•ผ์—์„œ Computational Approach์˜ ๋ฐœ์ „์„ ๊ธฐ๋Œ€ํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, DFinder ๋ชจ๋ธ์˜ ๊ธฐ์—ฌ๋กœ ์•ฝ๋ฌผ๊ณผ ์‹ํ’ˆ ๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์•ฝ์€ ์˜์–‘์†Œ์˜ ํก์ˆ˜, ๋Œ€์‚ฌ, ๋ฐฐ์„ค์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ณ  ์ฒด๋‚ด ์˜์–‘ ์ƒํƒœ์— ๋ณ€ํ™”๋ฅผ ์ค„ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์•ฝ๋ฌผ์น˜๋ฃŒ๋ฅผ ๋ฐ›๋Š” ๊ฐœ๊ฐœ์ธ์—๊ฒŒ ์ข‹์€ ์˜์–‘ ์ƒํƒœ๋ฅผ ์œ ์ง€ํ•˜๊ธฐ ์œ„ํ•œ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•ด ์ค„ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋” ๋‚˜์•„๊ฐ€์„œ ์งˆ๋ณ‘๊ณผ ๊ด€๋ จ์ด ์žˆ๋Š” ์‹๋‹จ ๋ณ€ํ™”์˜ ์ค‘์š”์„ฑ์„ ๊ณ ๋ คํ•œ๋‹ค๋ฉด ์˜์–‘๊ฐ€ ๋†’๊ณ  ๊ท ํ˜• ์žกํžŒ ์‹์‚ฌ๊ฐ€ ๊ฐœ์ธ์˜ ๊ฑด๊ฐ•์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉํ–ฅ์œผ๋กœ DFinder ๋ชจ๋ธ์ด ์ด๋ฐ”์ง€ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์˜์–‘ ๋ถˆ๋Ÿ‰์ด๋‚˜ ์•ฝ๋ฆฌ ์ž‘์šฉ ๋ณ€ํ™”๋กœ ์ธํ•œ ์œ„ํ—˜์„ ์ค„์ด๋Š” ๋ฐ ๊ธ์ •์ ์ธ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.
ย 
ย 
ย 
notion image
23w Digital Contents
ย 
ย 
ย 
๐Ÿ“จ
๋ฌธ์˜์‚ฌํ•ญ manager@deepdaiv.com
ย