μ΄μ©λ€ κ°ννμ΅
μ΄μ©λ€λ³΄λ κ°ννμ΅ κ³΅λΆλ₯Ό μμνκ² λ μΈ λͺ
μ μν€νΌλμ
μμ±μ
κ³ μν¬(κΌ¬μ)
μ΄νμ¬μλνκ΅ ν΅κ³ν λνμ
μμ§μΉ(μ§μΉ)
μμ£Όλνκ΅ μ°μ
곡νκ³Ό
νμ§μ°(루)
μ΄νμ¬μλνκ΅ μ»΄ν¨ν°κ³΅νμ 곡
Β
κ°μ μκ°
CS234: Reinforcement Learning
The Stanford Artificial Intelligence Laboratoryμ κ°ννμ΅ κ°μ
Β