뒤로 가기
홈으로 이동
LearnFit
공유하기
YouTube, Machine learning 1 - 22. 강화학습
yun님의 학습노트

강화학습이란?

#생활코딩
#opentutorials.org
#코딩
#coding
#프로그래밍
#programming
#자바
#java
00:07강화학습(reinforcement learning) 설명 시작!
00:24강화학습의 포인트 : 경험
00:30경험(행동)의 결과가 유리했다면 상을, 불리했다면 벌을 받습니다. 이 과정을 반복해 상을 계속 받는 행동을 학습하는 것이 강화학습의 핵심입니다.
00:54게임의 실력을 키워가는 것에 빗대어 강화학습을 설명합니다.
02:38게임 플레이에서 용어만 바꾸어 강화학습을 설명합니다.
02:40게임 == 환경(environment)
02:43게이머 == 에이전트(agent)
02:48상태 ==state, 상벌 == 보상(reward)
02:56판단 == 정책(policy)
03:02행동 == action
03:09강화학습은 '상태'에 따라서 더 많은 '보상'을 받을 수 있는 '행동'을 '에이전트'가 할 수 있도록 하는 '정책'을 만드는 것이 목적입니다.
03:26강화학습으로 할 수 있는 일들. https://bit.ly/ml1-reinforcement-list 링크에 접속하면 강화학습 예시 url, 설명, 데이터를 만드는 방법(에이전트/환경/행동/보상/상태)이 설명되어 있습니다!
03:37앞에서 간단하게 강화학습의 개념에 대해 살펴보았습니다. 여기부터는 기계학습의 전체적인 분류 flow에 대해서 정리하고 영상을 마무리합니다.
✔ 학습 완료

이 학습노트가 포함된 러닝패스예요.

yun님의 다른 노트는 어때요?

yun의 프로필 이미지
yun
의 학습노트

[EdTech 입문] DKT란?_Deep Knowledge Tracing

영상 재생 모양 아이콘
Video
⏱ 핵심 스탬프
14
00:23
목차 1. DKT Model 2. DKT Model Input&Output 3. DKT 특성 및 한계
00:38
DKT 모델을 알아보자. DKT는 Knowledge Tracing에 DL을 적용시킨 모델로 학생들의 반응을 예측하는 문제에 RNN과 LSTM모델을 적용시킨 방법
👍
1
스크랩
yun의 프로필 이미지
yun
의 학습노트

CS224W: Machine Learning with Graphs | Lecture 3.1 - Node Embeddings

영상 재생 모양 아이콘
Video
⏱ 핵심 스탬프
32
00:00
강의노트(1p~18p) : http://snap.stanford.edu/class/cs224w-2020/slides/03-nodeemb.pdf
00:13
Traditional ML for Graph 요약
👍
1
스크랩
👋 다양한 인사이트를 읽어보고 계신가요?
나만의 학습 기록을 남기고, 관리하고 싶다면!
다양한 전문가의 멤버십 전용 콘텐츠를 보고 싶다면!
나의 학습 내용을 공유하고, 수익을 올리고 싶다면!
3초 회원가입/로그인으로, 런핏의 커뮤니티에 여러분도 함께하세요.
3초 만에 가입하기