Oh no! It looks like JavaScript is not enabled in your browser.
Reload
LearnFit
YouTube, Machine learning 1 - 22. 강화학습
-3
+3
🤩
🧐
🤔
😵💫
🤯
00:00
-3
+3
🤩
🧐
🤔
😵💫
🤯
00:00
yun
님의 학습노트
도움돼요
4
강화학습이란?
#생활코딩
#opentutorials.org
#코딩
#coding
#프로그래밍
#programming
#자바
#java
00:07
강화학습(reinforcement learning) 설명 시작!
00:24
강화학습의 포인트 : 경험
00:30
경험(행동)의 결과가 유리했다면 상을, 불리했다면 벌을 받습니다. 이 과정을 반복해 상을 계속 받는 행동을 학습하는 것이 강화학습의 핵심입니다.
00:54
게임의 실력을 키워가는 것에 빗대어 강화학습을 설명합니다.
02:38
게임 플레이에서 용어만 바꾸어 강화학습을 설명합니다.
02:40
게임 == 환경(environment)
02:43
게이머 == 에이전트(agent)
02:48
상태 ==state, 상벌 == 보상(reward)
02:56
판단 == 정책(policy)
03:02
행동 == action
03:09
강화학습은 '상태'에 따라서 더 많은 '보상'을 받을 수 있는 '행동'을 '에이전트'가 할 수 있도록 하는 '정책'을 만드는 것이 목적입니다.
03:26
강화학습으로 할 수 있는 일들.
https://bit.ly/ml1-reinforcement-list
링크에 접속하면 강화학습 예시 url, 설명, 데이터를 만드는 방법(에이전트/환경/행동/보상/상태)이 설명되어 있습니다!
03:37
앞에서 간단하게 강화학습의 개념에 대해 살펴보았습니다. 여기부터는 기계학습의 전체적인 분류 flow에 대해서 정리하고 영상을 마무리합니다.
✔ 학습 완료
댓글
0
취소
작성하기
이 학습노트
가 포함된 러닝패스예요.
무료
yun
의 러닝패스
[EdTech 입문] 2. 인공지능이 뭔가요?!?
yun
님의 다른 노트는 어때요?
yun
의 학습노트
[EdTech 입문] DKT란?_Deep Knowledge Tracing
Video
⏱ 핵심 스탬프
14
개
00:23
목차 1. DKT Model 2. DKT Model Input&Output 3. DKT 특성 및 한계
00:38
DKT 모델을 알아보자. DKT는 Knowledge Tracing에 DL을 적용시킨 모델로 학생들의 반응을 예측하는 문제에 RNN과 LSTM모델을 적용시킨 방법
👍
1
yun
의 학습노트
선행학습_Markov in EdTech
Video
⏱ 핵심 스탬프
10
개
00:20
목차
00:22
Markov 모델 전에 알아야 할 Markov Property에 대해 알아봅니다.
다시 보지않기
👋 다양한
인사이트
를 읽어보고 계신가요?
나만의 학습 기록을 남기고, 관리하고 싶다면!
다양한 전문가의 멤버십 전용 콘텐츠를 보고 싶다면!
나의 학습 내용을 공유하고, 수익을 올리고 싶다면!
3초 회원가입/로그인으로, 런핏의 커뮤니티에 여러분도 함께하세요.
3초 만에 가입하기