뒤로 가기
홈으로 이동
LearnFit
공유하기
YouTube, [빅데이터분석] 07 머신러닝모델평가
SAMA님의 학습노트

[빅데이터분석] 07 머신러닝모델평가

#전체
00:48분류모델의 성능 평가를 통해 모델의 정확도 확인 및 이후 모델 개선 등 반영
03:01테스트 데이터셋에 대한 예측값과 실제값의 일치도를 비교하여 일치도가 높을 수록 모델 성능이 높다고 판단
04:22일치도를 정량화하는 많은 평가 지표가 존재 (완벽한 지표는 없음)
05:57예측결과에 대한 시각화 방법 3가지 - 1.레이블리스트 2.분할표 3.오차행렬
15:21혼동행렬(confusion matrix) : 이진분류 모델에 대해 측정하기 위한 표 (TP, FP, FN ,TN 로 구성)
18:52정확도 = 맞은예측 / 전체예측, 가장 일반적이나 불균형 데이터에 대해 작동하지 않음
23:05Positive 관점에서의 평가지표 : 정밀도 = 예측한 것중 실제 정답인 비율, 재현율 = 실제 정답인 것중 정답으로 예측한 비율
28:11Negative 관점에서의 평가지표 : 오검출율 = 오답을 정답이라고 예측한 비율
30:13정밀도, 재현율, 오검출율은 특정 모델에 유리한 치우친 지표로 보수적/민감성 모델을 평가하기에는 부적합함
34:34Positive 관점에서 균형적 지표 : F1, Jaccard 지표가 있음
38:42Positive와 Nagative가 고려된 균형적 지표 : 매튜상관계수
55:58 일반적 목적의 평가에서는 F1, Jaccrad, Accuracy, MCC 지표 사용
✔ 학습 완료

이 학습노트가 포함된 러닝패스예요.

SAMA님의 다른 노트는 어때요?

SAMA
의 학습노트

[머신러닝] 다중 분류 모델 성능 측정 (accuracy, f1 score, precision, recall on multiclass classification)

영상 재생 모양 아이콘
Video
⏱ 핵심 스탬프
8
00:39
Confusion Matrix에 대한 간략설명
02:11
TP에 대한 설명, 정답 예측했고 실제 정답인 경우
👍
1
스크랩
SAMA
의 학습노트

KC릴레이션 추천을 위한 분석

영상 재생 모양 아이콘
Video
⏱ 핵심 스탬프
12
00:30
지식그래프는 노드와 릴레이션으로 구성됨
00:40
현재 USM은 level ,KC, Concept, Problem 등의 노드로 구성 KC는 PREREQUSITEOF 라는 선후 관계 릴레이션, Level 과 KC는 CONTAINS 라는 방향성을 가진 릴레이션으로 관계가 정의되어 있음
👍
1
스크랩
👋 다양한 인사이트를 읽어보고 계신가요?
나만의 학습 기록을 남기고, 관리하고 싶다면!
다양한 전문가의 멤버십 전용 콘텐츠를 보고 싶다면!
나의 학습 내용을 공유하고, 수익을 올리고 싶다면!
3초 회원가입/로그인으로, 런핏의 커뮤니티에 여러분도 함께하세요.
3초 만에 가입하기