μ†Œμ…œ λ„€νŠΈμ›Œν¬μ™€ 데이터 λ§ˆμ΄λ‹ 기법을 ν™œμš©ν•œ ν•™λ¬Έ λΆ„μ•Ό 쀑심 및 μœ΅ν•© ν‚€μ›Œλ“œ μΆ”μ²œ μ„œλΉ„μŠ€
πŸ“‘

μ†Œμ…œ λ„€νŠΈμ›Œν¬μ™€ 데이터 λ§ˆμ΄λ‹ 기법을 ν™œμš©ν•œ ν•™λ¬Έ λΆ„μ•Ό 쀑심 및 μœ΅ν•© ν‚€μ›Œλ“œ μΆ”μ²œ μ„œλΉ„μŠ€

Created
Aug 11, 2022
Editor
Tags
Data Mining
Recommendation System
cleanUrl: 'paper/academiaKey'

이 논문을 μ„ μ •ν•˜κ²Œ 된 λ°°κ²½

μ €λŠ” μ›λž˜ μΆ”μ²œμ‹œμŠ€ν…œ 말고도 데이터 λ§ˆμ΄λ‹μ— 관심이 λ§Žμ•˜μŠ΅λ‹ˆλ‹€. κΈ€μžλ“€λ‘œλΆ€ν„° μœ μ˜λ―Έν•œ 데이터λ₯Ό 뽑아내고 κ°€κ³΅ν•΄μ„œ λΉ„μ§€λ‹ˆμŠ€μ  μΈμ‚¬μ΄νŠΈλ₯Ό λ„μΆœν•˜λŠ” κ±°μ£ . κ·Έλž˜μ„œ λ‹¨μ–΄λ“€μ˜ κ΅°μ§‘ν™”, μ—°κ΄€μ„± 뢄석에도 관심이 λ§Žμ•˜λŠ”λ° 이 논문은 데이터 λ§ˆμ΄λ‹κΈ°λ²•μ„ ν™œμš©ν•˜μ—¬ μΆ”μ²œμ„œλΉ„μŠ€λ₯Ό κ΅¬ν˜„ν•˜μ˜€κΈ°μ— μ‹ μ„ ν•˜λ‹€κ³  λŠκΌˆμŠ΅λ‹ˆλ‹€.

Introduction

μš°λ¦¬λŠ” λ„ˆλ¬΄λ‚˜ 정보가 λ§Žμ€ μ •λ³΄μ˜ ν™μˆ˜μ†μ—μ„œ μ‚΄κ³  μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μƒν™©μ—μ„œ ν•„μš”ν•œ 정보λ₯Ό μ°ΎκΈ°λž€ λ„ˆλ¬΄ μ–΄λ €μš΄ 일이죠. νŠΉνžˆλ‚˜ 논문검색과 같이 μƒμ†Œν•œ λΆ„μ•ΌμΌμˆ˜λ‘ λ”λ”μš± κ·Έλ ‡μŠ΅λ‹ˆλ‹€. κ·Έλž˜μ„œ 이 논문은 데이터 λ§ˆμ΄λ‹ 기법을 μ΄μš©ν•˜μ—¬ ν‚€μ›Œλ“€μ„ μ†Œμ…œλ„€νŠΈμ›Œν¬μ™€ 같은 ν˜•νƒœλ‘œ μ œμ‹œν•˜κ³  μ‚¬μš©μžλ“€μ—κ²Œ μ μ ˆν•œ ν‚€μ›Œλ“œλ₯Ό μΆ”μ²œν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.
Β 

Model/Architecture

주된 κ°œλ…
ν‚€μ›Œλ“œλ“€μ„ κΈ°μ€€μœΌλ‘œ μ—°κ΄€ 관계 뢄석을 ν•˜μ—¬ 자주 λ³΄μ΄λŠ” ν‚€μ›Œλ“œ 쌍으둜 λ„μΆœν•˜κ³  이λ₯Ό λ„€νŠΈμ›Œν¬ ν˜•νƒœλ‘œ λ„μ‹ν™”ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.
Β 
  1. 논문별 ν‚€μ›Œλ“œ μΆ”μΆœ
전체 DBμ—μ„œ 논문별 ν‚€μ›Œλ“œλ₯Ό μΆ”μΆœν•˜μ—¬ λͺ©λ‘μœΌλ‘œ λ§Œλ“­λ‹ˆλ‹€.
  1. ν‚€μ›Œλ“œ ν‘œμ€€ν™”
ν‘œμ€€μš©μ–΄μ‚¬μ „μ„ μ΄μš©ν•˜μ—¬ ν‚€μ›Œλ“œλ“€μ„ ν‘œμ€€ν™” ν•©λ‹ˆλ‹€. ν‘œμ€€ μš©μ–΄μ‚¬μ „μ€ κ°„λ‹¨ν•œ λ™μ˜μ–΄ 사전을 ν™œμš©ν•˜μ—¬ κ΅¬μΆ•ν•©λ‹ˆλ‹€.
  1. 빈발 μΆœν˜„ ν‚€μ›Œλ“œ μŒμΆ”μΆœ
지지도와 신뒰도λ₯Ό κΈ°μ€€μœΌλ‘œ λ™μ‹œμΆœν˜„ λΉˆλ„κ°€ 높은 ν‚€μ›Œλ“œ μŒμ„ μΆ”μΆœν•©λ‹ˆλ‹€.
  1. 전체 ν‚€μ›Œλ“œ κ°„ μ†Œμ…œ λ„€νŠΈμ›Œν¬ ꡬ좕
ν•΄λ‹Ή μ—°κ΄€κ·œμΉ™μ˜ 신뒰도가 μž„κ³„κ°’ 이상인 두 λ…Έλ“œλ₯Ό κ°„μ„ μœΌλ‘œ μ΄μ–΄μ„œ ν‘œν˜„ν•©λ‹ˆλ‹€.
  1. μ΄μš©μžλŠ” 검색어λ₯Ό μž…λ ₯ν•˜μ—¬ μ„œλΉ„μŠ€λ₯Ό 제곡 λ°›μŠ΅λ‹ˆλ‹€.
<제곡 κ³Όμ •>
  • 검색어 μž…λ ₯
  • ν‘œμ€€ μš©μ–΄ 사전을 톡해 ν‘œμ€€ κ²€μƒ‰μ–΄λ‘œ λ³€ν™˜
  • λ„€νŠΈμ›Œν¬μ—μ„œ 검색어와 μΈμ ‘ν•œ ν‚€μ›Œλ“œλ₯Ό 보여주고 인접도λ₯Ό ν•¨κ»˜ μ œμ‹œ.
Β 

λΉˆλ°œμΆœν˜„ ν‚€μ›Œλ“œμŒ μΆ”μΆœλ²•

  • 신뒰도: Xκ°€ λ°œμƒν–ˆμ„λ•Œ Yκ°€ λ°œμƒν™œ ν™•λ₯ 
Confidence =
  • 지지도: X,Yκ°€ λ™μ‹œμ— λ°œμƒν•  ν™•λ₯ 
Support =
Β 
notion image
Β 
Β 
μœ„μ˜ 예제λ₯Ό 톡해 지지도, 신뒰도 κ³„μ‚°ν•˜κΈ°
Β 
데이터 λ§ˆμ΄λ‹μ΄λΌλŠ” 단어와 μΆ”μ²œ μ‹œμŠ€ν…œμ΄ λ™μ‹œμ— λ‚˜μ˜¬ν™•λ₯ μ€
10κ°€μ§€ κ²½μš°μ€‘ 3가지이기 λ•Œλ¬Έμ— μ§€μ§€λ„λŠ” 30%μž…λ‹ˆλ‹€.
Β 
Β 
데이터 λ§ˆμ΄λ‹μ΄λΌλŠ” 단어가 λ‚˜μ™”μ„λ•Œ μΆ”μ²œ μ‹œμŠ€ν…œμ΄ λ‚˜μ˜¬ ν™•λ₯ μ€
5κ°€μ§€ κ²½μš°μ€‘ 3가지이기 λ•Œλ¬Έμ— μ‹ λ’°λ„λŠ” 60%μž…λ‹ˆλ‹€.

  1. SAS E-minerλ₯Ό 톡해 지지도, 신뒰도, ν–₯상도λ₯Ό κ³„μ‚°ν•©λ‹ˆλ‹€.
notion image
Β 
  1. 지지도가 2%이상인 연관관계λ₯Ό ν‘œν˜„ν•©λ‹ˆλ‹€.
notion image
μœ„μ˜ 그림은 지지도가 2%이상인 연관관계λ₯Ό ν‘œν˜„ν•œ 것이고 색상은 지지도, λͺ¨μ–‘은 신뒰도, ν¬κΈ°λŠ” ν–₯상도λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.
Β 
  1. μž„κ³„κ°’μ„ μ΄μš©ν•΄ νŒ¨ν„΄μ„ μΆ”μΆœν•©λ‹ˆλ‹€.
notion image
지지도 1%이상, 신뒰도 5%이상 ν–₯상도1%μ΄μƒμ΄λΌλŠ” μž„κ³„κ°’μ„ 톡해 284κ°€μ§€μ˜ νŒ¨ν„΄μ΄ λ°œκ²¬λ˜μ—ˆκ³  이λ₯Ό λ…Έλ“œκ°„μ˜ 연결정도에 λ”°λ₯Έ λΆ„ν¬λ‘œ λ‚˜νƒ€λƒ…λ‹ˆλ‹€.
Β 
  1. 발견된 νŒ¨ν„΄λ“€μ„ λ…Έλ“œλ₯Ό μ΄μš©ν•΄μ„œ λ„€νŠΈμ›Œν¬λ‘œ ν‘œν•©λ‹ˆλ‹€.
notion image
Β 
발견된 νŒ¨ν„΄λ“€μ„ λ…Έλ“œκ°„μ˜ 연결정도에 따라 뢄포λ₯Ό 그리면 μœ„μ™€ 같은 그림이 λ‚˜μ˜΅λ‹ˆλ‹€. 뢄석결과 μ€‘μ‹¬ν‚€μ›Œλ“œλŠ” μ˜¨ν†¨λ‘œμ§€, 상황인식, μ†Œμ…œλ„€νŠΈμ›Œν¬, κ΅°μ§‘ν™”κ°€ λ°œκ²¬λ˜μ—ˆμŠ΅λ‹ˆλ‹€.