β€˜λ³΄λ‹€ 윀리적인 AI’λ₯Ό μœ„ν•œ μ‹œλ„, Constitutional AI
βš–οΈ

β€˜λ³΄λ‹€ 윀리적인 AI’λ₯Ό μœ„ν•œ μ‹œλ„, Constitutional AI

Created
Mar 30, 2023
Editor
μœ ν˜„ μ‹ 

INTRO


β€˜μ‹ λ“œλ‘¬β€™μ΄λΌκ³  λΆ€λ₯Ό 수 μžˆμ„ μ •λ„λ‘œ 우리 삢에 λ§Žμ€ λ³€ν™”λ₯Ό μΌμœΌν‚€κ³  μžˆλŠ” ChatGPT, 이에 λŒ€μ‘ν•΄ ꡬ글이 내놓은 Bard, 그리고 졜근 μΆœμ‹œλ˜μ–΄ μ„Έκ°„μ˜ μ£Όλͺ©μ„ λ°›κ³ μžˆλŠ” GPT-4κΉŒμ§€. β€˜λŒ€ν™”ν˜• AI의 μ‹œλŒ€β€™λΌκ³  해도 과언이 아닐 μ •λ„λ‘œ λ§Žμ€ ν…μŠ€νŠΈ 생성 λͺ¨λΈλ“€μ΄ μš°ν›„μ£½μˆœ 개발되고 μžˆμŠ΅λ‹ˆλ‹€.
μ΄λŸ¬ν•œ λŒ€ν™”ν˜• AIλ“€, 깜짝 λ†€λž„λ§ŒνΌ λ˜‘λ˜‘ν•œ 닡변을 λ‚΄λ†“μœΌλ©° 날이 갈수둝 쒋은 μ„±λŠ₯을 보여주고 μžˆλŠ”λ°μš”. μ‹€μ œλ‘œ ChatGPTμ—κ²Œ 학ꡐ 과제λ₯Ό λΆ€νƒν•˜κ±°λ‚˜, μ½”λ“œλ₯Ό λŒ€μ‹  짜 달라고 μš”μ²­ν•˜κ±°λ‚˜, νŠΉμ • μ£Όμ œμ— κ΄€ν•œ 글을 써 달라고 μš”μ²­ν•΄ 도움을 받은 사둀듀이 많이 μ†Œκ°œλ˜λ©΄μ„œ μ΄μ œλŠ” λˆ„κ΅¬λ‚˜ κ·Έ μœ μš©μ„±μ„ μΈμ •ν•˜μ§€ μ•Šμ„ 수 μ—†λŠ” μˆ˜μ€€μž…λ‹ˆλ‹€.
κ·ΈλŸ¬λ‚˜ ν•œνŽΈμœΌλ‘œλŠ”, 이 λŒ€ν™”ν˜• AIκ°€ 점점 λ°œμ „ν•¨μ— 따라 이듀이 내놓은 닡변에 λŒ€ν•œ 윀리적 λ¬Έμ œκ°€ ν•˜λ‚˜λ‘˜μ”© 제기되고 μžˆλŠ”λ°μš”. 무엇이든 λŒ€λ‹΅ν•΄μ£ΌλŠ” AI의 μœ μš©μ„±μ΄ λΉ„μœ€λ¦¬μ μœΌλ‘œ λ°œνœ˜λœλ‹€λ©΄, 그것은 β€˜μœ μš©ν•œ AIβ€™μ˜ λ²”μ£Όλ₯Ό λ„˜μ–΄ μ„œλ‘œλ₯Ό κ³΅κ²©ν•˜κ³  ν”Όν•΄ μž…νžˆλŠ” 데에 μ‚¬μš©λ˜λŠ” β€˜λ²”μ£„ λ„κ΅¬β€™λ‘œ λ°œμ „ν•  κ°€λŠ₯성이 λ‹€λΆ„ν•©λ‹ˆλ‹€. λ•Œλ¬Έμ— λŒ€ν™”ν˜• AI에 μœ μš©μ„±κ³Ό λ”λΆˆμ–΄ 무해성 즉, μœ€λ¦¬μ„±μ„ νƒ‘μž¬ν•˜κΈ° μœ„ν•œ 연ꡬ가 많이 μ§„ν–‰λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€.
이번 μ•„ν‹°ν΄μ—μ„œλŠ” β€˜AI의 μœ€λ¦¬μ„±β€™μ΄λΌλŠ” 화두와 ν•¨κ»˜, 이 μœ€λ¦¬μ„±μ„ κ°–μΆ˜ β€˜κ°œλ…μžˆλŠ” AI’λ₯Ό λ§Œλ“€κΈ° μœ„ν•œ μ‹œλ„ 쀑 ν•˜λ‚˜μΈ Constitutional AI에 λŒ€ν•΄ μ†Œκ°œν•˜κ² μŠ΅λ‹ˆλ‹€πŸ€—
Β 
Β 
[ λͺ©μ°¨ ]
Β 

1. λŒ€ν™”ν˜• AI, λ˜‘λ˜‘ν•˜κΈ΄ ν•˜μ§€λ§Œ μœ€λ¦¬μ„±μ€?


ChatGPTλ₯Ό λΉ„λ‘―ν•œ λŒ€ν™”ν˜• AI듀이 λ†€λΌμšΈ 만큼 μˆ˜μ€€ 높은 닡변을 λ‚΄λ†“μœΌλ©°, μΈκ°„μ—κ²Œ μ‹€μ§ˆμ μœΌλ‘œ 도움이 되고 μžˆμŒμ€ μ‚¬μ‹€μž…λ‹ˆλ‹€.
λ”°λΌμ„œ κ·Έ μœ μš©μ„±μ΄ 컀질수둝 이듀이 내놓은 닡변이 세상에 λΌμΉ˜λŠ” 영ν–₯λ ₯ λ˜ν•œ ν•„μ—°μ μœΌλ‘œ 컀질 μˆ˜λ°–μ— μ—†μŠ΅λ‹ˆλ‹€. 만일 이듀이 μœ ν•΄ν•œ λ‚΄μš©μ„ 담은 닡변을 μƒμ„±ν•œλ‹€λ©΄, κ·Έ μœ ν•΄ν•¨μœΌλ‘œ 인해 λ‹€λ₯Έ λˆ„κ΅°κ°€κ°€ ν”Όν•΄λ₯Ό μž…κ²Œ 될 μˆ˜λ„ 있죠.
μ΄μ―€μ—μ„œ, κΈ°μ‘΄ λŒ€ν™”ν˜• AI에 μ΄λ“€μ˜ μœ€λ¦¬μ„±μ„ μ—Ώλ³Ό 수 μžˆλŠ” μ§ˆλ¬Έμ„ ν•˜λ©΄ μ–΄λ–»κ²Œ λ κΉŒμš”?
notion image
notion image
notion image
Constitutional AI의 λ…Όλ¬Έμ—μ„œ λͺ‡ κ°€μ§€ μ˜ˆμ‹œλ₯Ό λ°œμ·Œν–ˆμŠ΅λ‹ˆλ‹€. 보닀 κΈμ •μ μœΌλ‘œ μ‘°μ–Έν•΄μ£ΌλŠ”κ°€ ν•˜λ©΄, 닡변을 νšŒν”Όν•˜κΈ°λ„ ν•˜κ³ , λ“€ν‚€μ§€ μ•Šκ³  μƒμ μ—μ„œ 물건을 ν›”μΉ˜λŠ” 방법을 친절히 μ„€λͺ…해주기도 ν•˜λŠ” λͺ¨μŠ΅μ„ λ³Ό 수 μžˆλ„€μš”πŸ˜…
이와 같은 AI의 행동은 μ‚¬μš©μžλ₯Ό λΉ„μœ€λ¦¬μ μΈ λ°©ν–₯으둜 μ΄λŒκ±°λ‚˜, λ‹¨μˆœ 정보 전달 맀체의 역할에 그치며 μΈκ°„μ—κ²Œ μ•„λ¬΄λŸ° 긍정적인 도움을 μ£Όμ§€ λͺ»ν•˜κ²Œ λ©λ‹ˆλ‹€.
πŸ’‘
λŒ€ν™”ν˜• AIκ°€ μœ μš©ν•œ 정보λ₯Ό μ „λ‹¬ν•˜λŠ” κ²ƒμ—μ„œ κ·ΈμΉ˜μ§€ μ•Šκ³ , μ‚¬μš©μžλ₯Ό 쒋은 λ°©ν–₯으둜 μ΄λ„λŠ” λ¬΄ν•΄ν•œ 닡변을 μƒμ„±ν•˜λŠ” μͺ½μœΌλ‘œ λ°œμ „ν•œλ‹€λ©΄ μ’‹μ§€ μ•Šμ„κΉŒμš”?
μ΄λŸ¬ν•œ μ§ˆλ¬Έμ— κΈ°λ°˜ν•œ 연ꡬ가 λ°”λ‘œ 였늘 μ†Œκ°œν•  Constitutional AIμž…λ‹ˆλ‹€. β€˜Constitution’이라고 μΌμ»«λŠ” 일련의 β€˜μ›μΉ™β€™μ„ μ œμ •ν•΄ AIκ°€ 이λ₯Ό λ”°λ₯΄λ„둝 ν•™μŠ΅μ‹œμΌ°λ‹€κ³  ν•˜λŠ”λ°μš”. 이 방식을 톡해 λŒ€ν™”ν˜• AIλ₯Ό κ°•ν™”ν•™μŠ΅ μ‹œν‚€λ©΄ μœ„ μ˜ˆμ‹œ μ§ˆλ¬Έμ— λŒ€ν•œ 닡변이 λ‹€μŒκ³Ό 같이 κ°œμ„ λœλ‹€κ³  ν•©λ‹ˆλ‹€.
notion image
notion image
notion image
이 질문이 μ‹œμ‚¬ν•˜λŠ” λ°”κ°€ μœ€λ¦¬μ μ΄μ§€ μ•Šλ‹€λŠ” μ˜κ²¬μ„ λΆ„λͺ…νžˆ 밝히며, λ”λΆˆμ–΄ μ™œ μœ€λ¦¬μ μ΄μ§€ μ•Šμ€μ§€μ— λŒ€ν•œ κ·Όκ±°λ₯Ό λ…Όλ¦¬μ μœΌλ‘œ μ„€λͺ…ν•˜λŠ” 것을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€. 닡변을 κ±°λΆ€ν•˜μ§€ μ•ŠμœΌλ©°, λ‹¨μˆœ 정보 전달을 λ„˜μ–΄ 우리 μΈκ°„μ—κ²Œ 훨씬 더 쒋은 영ν–₯을 쀄 수 μžˆλ„λ‘ κ°œμ„ λœ κ²ƒμž…λ‹ˆλ‹€!
이처럼 λ¬΄ν•΄ν•˜λ©΄μ„œλ„ μœ μš©ν•œ 닡변을 μƒμ„±ν•˜λŠ” Constitutional AI, μ–΄λ–»κ²Œ ν•™μŠ΅λ˜λŠ” κ±ΈκΉŒμš”? μžμ„Ένžˆ μ‚΄νŽ΄λ΄…μ‹œλ‹€.
Β 

2. Constitutional AI: β€˜κ·œμΉ™β€™μ΄ β€˜μœ€λ¦¬β€™λ₯Ό λ§Œλ“ λ‹€


Constitutional AIλŠ” κΈ°μ‘΄ λŒ€ν™”ν˜• AIκ°€ κ°€μ§„ μœ μš©μ„±(Helpfulness)κ³Ό λ”λΆˆμ–΄ 무해함(Harmlessness)κΉŒμ§€ κ°–μΆ˜ AIλ₯Ό λ§Œλ“€κΈ° μœ„ν•΄ κ³ μ•ˆλ˜μ—ˆμŠ΅λ‹ˆλ‹€.
πŸ’‘
μ—¬κΈ°μ„œ, AI에 β€˜λ¬΄ν•΄ν•¨β€™μ΄λΌλŠ” κ°œλ…μ„ μ–΄λ–»κ²Œ ν•™μŠ΅μ‹œμΌ°μ„κΉŒμš”?
Constitutional AIμ—μ„œλŠ” β€˜Constitution’ λ˜λŠ” β€˜Principle’이라고 λΆ€λ₯΄λŠ” λͺ‡ κ°€μ§€ 원칙을 μ œμ •ν–ˆμŠ΅λ‹ˆλ‹€. 인간이 λ§ˆλ•…νžˆ 따라야 ν•  윀리적인 κ·œμΉ™λ“€μ„ β€˜ν—Œλ²•β€™μœΌλ‘œ μ œμ •ν•΄ λ†“μ•˜λ“―μ΄, AIκ°€ λ§ˆλ•…νžˆ 따라야 ν•  μœ€λ¦¬μ›μΉ™μ„ μ •ν•΄ ν•™μŠ΅μ‹œν‚¨ 것이죠. μ‚¬λžŒμ΄ 정해놓은 μœ€λ¦¬μ›μΉ™μ„ μ² μ €νžˆ μ€€μˆ˜ν•˜λ©° ν…μŠ€νŠΈλ₯Ό μƒμ„±ν•˜κΈ° λ•Œλ¬Έμ—, μœ μš©ν•˜λ©΄μ„œλ„ 윀리적인 닡변을 얻을 수 있게 λ˜λŠ” κ²ƒμž…λ‹ˆλ‹€.
Constitution(원칙) μ˜ˆμ‹œ
Constitution(원칙) μ˜ˆμ‹œ
λ˜ν•œ 이 Constitution λͺ©λ‘μ„ 톡해 무해함에 λŒ€ν•œ λ ˆμ΄λΈ”μ„ 일일이 달지 μ•Šμ•„λ„ AIκ°€ 슀슀둜 무해함을 νŒλ‹¨ν•˜κ³  κ°œμ„ ν•˜λŠ” Self-Improvement λ°©μ‹μ˜ ν•™μŠ΅μ΄ κ°€λŠ₯ν•΄μ‘ŒμŠ΅λ‹ˆλ‹€. 이 방식을 AI ν”Όλ“œλ°± 기반 κ°•ν™”ν•™μŠ΅(Reinforcement Learning from AI Feedback, RLAIF)이라고 ν•˜λŠ”λ°μš”. μ‚¬λžŒμ΄ 일일이 λ ˆμ΄λΈ”μ„ 달아야 ν–ˆλ˜ 기쑴의 인간 ν”Όλ“œλ°± 기반 κ°•ν™”ν•™μŠ΅(RLHF)에 λΉ„ν•΄ μΈκ°„μ˜ κ°œμž…μ„ μ΅œμ†Œν•œμœΌλ‘œ μ€„μ΄λ©΄μ„œ ν•™μŠ΅μ— λ“€μ–΄κ°€λŠ” 노동λ ₯ λ˜ν•œ λŒ€ν­ μ€„μ˜€λ‹€λŠ” μ˜μ˜κ°€ μžˆμŠ΅λ‹ˆλ‹€.
Β 

3. AI ν”Όλ“œλ°±μ„ 톡해 ν•™μŠ΅λœ β€˜λ¬΄ν•΄ν•¨β€™


이제 Constitutional AI의 ν•™μŠ΅ 과정에 λŒ€ν•΄ μ‚΄νŽ΄λ΄…μ‹œλ‹€. ν•™μŠ΅μ€ 크게 λ‹€μŒκ³Ό 같은 두 λ‹¨κ³„λ‘œ μ΄λ£¨μ–΄μ§‘λ‹ˆλ‹€.
πŸ“œ
Constitutional AI의 ν•™μŠ΅ κ³Όμ •
  1. SL(Supervised Learning) Phase β†’ 자체 비평과 μˆ˜μ •μ„ ν†΅ν•œ μ§€λ„ν•™μŠ΅ 단계
  1. RL(Reinforcement Learning) Phase β†’ β€˜λ¬΄ν•΄ν•¨β€™μ— λŒ€ν•œ AI ν”Όλ“œλ°±μ„ μ΄μš©ν•œ κ°•ν™”ν•™μŠ΅ 단계
notion image
Β 

3.1 SL(Supervised Learning) Phase

CritiqueΒ β†’Β RevisionΒ β†’Β Supervised Learning
첫 번째 λ‹¨κ³„λŠ” 자체 비평(Self-Critique)κ³Ό μˆ˜μ •(Revision)을 ν†΅ν•œ μ§€λ„ν•™μŠ΅ λ‹¨κ³„μž…λ‹ˆλ‹€.
  1. Initial Response
notion image
λ¨Όμ €, μ‚¬μ „ν•™μŠ΅λœ μ–Έμ–΄ λͺ¨λΈμ„ 초기 λͺ¨λΈ(Initial Model)둜 μ‚Όμ•„ μœ ν•΄ν•œ ν”„λ‘¬ν”„νŠΈμ— λŒ€ν•œ 응닡을 μƒμ„±ν•©λ‹ˆλ‹€. 이 초기 λͺ¨λΈμ€ 무해함에 λŒ€ν•œ ν•™μŠ΅μ΄ λ˜μ§€ μ•Šμ€, μœ μš©ν•˜κ²Œλ§Œ ν•™μŠ΅λœ(Helpful-Only) λͺ¨λΈμ΄κΈ° λ•Œλ¬Έμ— 이 초기 응닡은 λ‹€μ†Œ μœ ν•΄ν•œ λ‚΄μš©μ„ 포함할 수 μžˆμŠ΅λ‹ˆλ‹€.
  1. Critique - Revision
notion image
λ‹€μŒμœΌλ‘œ, 미리 μ§€μ •ν•΄λ‘” Constitution(원칙)에 따라 λͺ¨λΈμ΄ 슀슀둜 비평(Critique)ν•œ λ’€ 이 λ‚΄μš©μ„ λ°”νƒ•μœΌλ‘œ 응닡을 μˆ˜μ •(Revision)ν•©λ‹ˆλ‹€. 이 비평-μˆ˜μ • μ ˆμ°¨λŠ” λͺ‡ νšŒμ— κ±Έμ³μ„œ λ°˜λ³΅λ˜λŠ”λ°, 각 λ‹¨κ³„λ§ˆλ‹€ Constitution λͺ¨μŒμœΌλ‘œλΆ€ν„° λ¬΄μž‘μœ„λ‘œ μ„ μ •λœ Constitution을 λ”°λ¦…λ‹ˆλ‹€.
  1. Fine-Tuning
notion image
λ§ˆμ§€λ§‰μœΌλ‘œ, μ΅œμ’… μˆ˜μ •λœ 응닡에 λŒ€ν•œ μ§€λ„ν•™μŠ΅(SL)을 톡해 초기 λͺ¨λΈμ„ Fine-Tuningν•©λ‹ˆλ‹€.
πŸ’‘
이 κ³Όμ •μ—μ„œ 초기 λͺ¨λΈμ΄ 원칙에 λ”°λ₯Έ 자체 비평과 μˆ˜μ •μ„ 톡해 보닀 윀리적인 λ°©ν–₯으둜 λ―Έμ„Έμ‘°μ •λ©λ‹ˆλ‹€.
Β 

3.2 RL(Reinforcement Learning) Phase

AI Comparison EvaluationsΒ β†’Β Preference ModelΒ β†’ Reinforcement Learning
두 번째 λ‹¨κ³„λŠ” β€˜λ¬΄ν•΄ν•¨β€™μ— λŒ€ν•œ AI의 μ„ ν˜Έ ν”Όλ“œλ°±μ„ ν†΅ν•œ κ°•ν™”ν•™μŠ΅(RLAIF) λ‹¨κ³„μž…λ‹ˆλ‹€.
이 λ‹¨κ³„λŠ” 무해함에 λŒ€ν•œ μ‚¬λžŒμ˜ μ„ ν˜Έ λ ˆμ΄λΈ”μ„ β€˜AI ν”Όλ“œλ°±β€™μœΌλ‘œ λŒ€μ²΄ν–ˆλ‹€λŠ” 점을 μ œμ™Έν•˜λ©΄ 기쑴의 RLHF와 λΉ„μŠ·ν•œλ°μš”. μ—¬κΈ°μ„œ AI ν”Όλ“œλ°±μ΄λž€ AIκ°€ μ•žμ„œ μ§€μ •ν•΄λ‘” Constitution(원칙)에 따라 응닡을 자체적으둜 ν‰κ°€ν•˜λŠ” 것을 λ§ν•©λ‹ˆλ‹€.
κΈ°μ‘΄ RLHFκ°€ μ‚¬λžŒμ˜ μ„ ν˜Έλ₯Ό λ°”νƒ•μœΌλ‘œ μ„ ν˜Έλ„ λͺ¨λΈ(PM)을 λ§Œλ“œλŠ” 것 같이, RLAIFμ—μ„œλŠ” 일련의 원칙에 λŒ€ν•œ 초기 λͺ¨λΈμ˜ 해석을 λ°”νƒ•μœΌλ‘œ μ„ ν˜Έλ„ λͺ¨λΈμ„ λ§Œλ“­λ‹ˆλ‹€.
  1. AI Comparison Evaluations
notion image
λ¨Όμ €, 이전 단계인 SL Phaseλ₯Ό 톡해 ν›ˆλ ¨λœ 초기 λͺ¨λΈμ— μœ ν•΄ν•œ ν”„λ‘¬ν”„νŠΈλ₯Ό μž…λ ₯으둜 λ„£μ–΄ ν•œ 쌍의 응닡 와 λ₯Ό μƒμ„±ν•©λ‹ˆλ‹€.
notion image
λ‹€μŒμœΌλ‘œ, 원칙 λͺ©λ‘μ—μ„œ 원칙 ν•˜λ‚˜λ₯Ό κ°€μ Έμ˜¨ λ’€, λ‘˜ 쀑 μ–΄λ–€ 응닡이 이 원칙을 더 μ€€μˆ˜ν•˜λŠ” 닡변인지 μ„ νƒν•˜κ²Œλ” ν•©λ‹ˆλ‹€.
  1. Preference Model
notion image
AIκ°€ Chain-of-Thought μΆ”λ‘  과정을 톡해 응닡을 μ„ νƒν•˜κ²Œ 되고, 이λ₯Ό 톡해 AIκ°€ μƒμ„±ν•œ β€˜λ¬΄ν•΄ν•¨β€™μ— λŒ€ν•œ μ„ ν˜Έλ„ 데이터셋이 λ§Œλ“€μ–΄μ§‘λ‹ˆλ‹€. 그리고 여기에 기쑴의 RLHFλ₯Ό 톡해 얻은 μœ μš©μ„± 짙은 데이터셋을 ν˜Όν•©ν•©λ‹ˆλ‹€.
  1. Reinforcement Learning
λ§ˆμ§€λ§‰μœΌλ‘œ, 이 AI μ„ ν˜Έλ„ λ°μ΄ν„°μ…‹μœΌλ‘œ ν•™μŠ΅λœ μ„ ν˜Έλ„ λͺ¨λΈ(PM)을 톡해 κ°•ν™”ν•™μŠ΅μ„ μ§„ν–‰ν•©λ‹ˆλ‹€. μ—¬κΈ°μ„œ μ„ ν˜Έλ„ λͺ¨λΈμ΄ λ°˜ν™˜ν•œ AI의 μ„ ν˜Έλ„ μ μˆ˜κ°€ κ°•ν™”ν•™μŠ΅μ—μ„œμ˜ 보상 μ‹ ν˜Έ(Reward Signal) 역할을 ν•˜λŠ” 것이죠.
πŸ’‘
μ΄λŸ¬ν•œ 두 λ‹¨κ³„μ˜ ν•™μŠ΅μ„ 톡해 μ΅œμ’…μ μœΌλ‘œ μœ μš©μ„±(Helpfulness)을 μœ μ§€ν•˜λ©΄μ„œλ„, 닡변을 νšŒν”Όν•˜μ§€ μ•ŠμœΌλ©° 무해함(Harmlessness)을 κ°–μΆ˜ AIκ°€ ν•™μŠ΅λ©λ‹ˆλ‹€.
Β 

OUTRO


μ§€κΈˆκΉŒμ§€ AI에 β€˜λ¬΄ν•΄ν•¨β€™μ„ μ²¨κ°€ν•΄μ„œ 보닀 윀리적인 AIλ₯Ό λ§Œλ“€κ³ μž ν•œ Constitutional AIλ₯Ό μ‚΄νŽ΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€! AIκ°€ 원칙을 따라 ν–‰λ™ν•˜λ„λ‘ ν•˜μžλŠ” 아이디어도 μ‹ μ„ ν•œλ°, 그것도 자체적인 ν”Όλ“œλ°±μ„ 톡해 ν•™μŠ΅λœλ‹€λ‹ˆ, 정말 ν₯λ―Έλ‘­μ§€ μ•Šλ‚˜μš”?
κ³ μ„±λŠ₯의 λŒ€ν™”ν˜• AIκ°€ μŸμ•„μ Έλ‚˜μ˜€λŠ” μš”μ¦˜ 같은 λ•Œμ— AI의 μœ€λ¦¬μ„±μ— κ΄€ν•œ μ—°κ΅¬λŠ” μ΄λ“€μ˜ λ¬΄λΆ„λ³„ν•œ μ‚¬μš© 및 μ•…μš©μ„ 막기 μœ„ν•΄ κ°€μž₯ ν•„μš”ν•œ 연ꡬ 쀑 ν•˜λ‚˜κ°€ μ•„λ‹κΉŒ μ‹Άμ€λ°μš”. 아티클이 ν₯λ―Έλ‘œμš°μ…¨λ‹€λ©΄ Constitution AI의 논문도 ν•œ 번 μ½μ–΄λ³΄μ‹œκΈ°λ₯Ό μΆ”μ²œλ“œλ¦¬λ©΄μ„œ 이번 ν¬μŠ€νŒ…μ„ 마무리 ν•˜κ² μŠ΅λ‹ˆλ‹€. κ°μ‚¬ν•©λ‹ˆλ‹€πŸ™‚
Β 
Β 
Β 
Β 
notion image
에디터 μœ ν˜„ μ‹ 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

μ°Έκ³ λ¬Έν—Œ 및 좜처


[1] Constitutional AI λ…Όλ¬Έ: https://arxiv.org/abs/2212.08073
Β 
πŸ“¨
λ¬Έμ˜μ‚¬ν•­ manager@deepdaiv.com