03:08연관관계 분석은 사후KC에서 정답이 사전KC에서의 정답을 의미하고, 사전KC에서의 오답으로 부터 사후KC에서의 오답을 유추할 수 있게 한다면 두 KC는 관련이 있다라고 가정하고, 스피드수학의 레벨 테스트 로그 데이터를 가지고 Association Rule Mining 을 이용하여 Confidence, Support 데이터를 얻음
03:47Random Forest 분석을 통해 KC간의 relation과 relation weight(importance)를 얻음
04:32random forest와 association에 의하여 relation list를 만들고, 이에 대한 방향을 결정함
05:09KC가 두개 있다고 할 때 선후관계가 존재한다고 하면, 선 KC에서 얻은 정확도 점수를 가지고, 평균점수 보다 낮은 그룹과 높은 그룹 두 그룹으로 나누고 그 그룹들의 후 KC에서의 정확도를 확인, 각 그룹들의 후KC에서의 평균값이 반대의 경우보다 높은 경우 정방향의 관계가 있다고 판단하고 KC의 방향 결정
06:04연관성이 있는 개념의 경우, 난이도가 쉬운 것을 선후관계에서 먼저 배운다는 가정, 문제풀이 결과를 분석해서 난이도를 구함
06:21선후 평균과 난이도, 두 분석을 통하여 얻은 선후관계를 병합. 그룹간 평균차 통계를 가지고 방향을 추정 그룹간 평균차가 한개의 값으로 나오는 경우 신뢰도를 알 수가 없기에 이를 100번 반복을 해서 샘플링, 그중 50번 이상 정방향으로 나오면 정방향으로 판정 정방향에서 그룹간 평균차가 역방향 그룹간 평균차 보다 큰가. 이걸 100번. 50% 이상 정방향이 큰걸로 나타난다면 1점 그렇지 않다면 -1점 난이도 기준해서 KC번호가 작은것이 난이도가 낮다면 1, 100번, 이런 경우가 50번 넘게 나타나면 1
07:132020년 1월~12월의 써밋 스피드 수학의 11레벨 레벨테스트 결과 활용하여 진행
08:36스피드 수학에 존재하는 58개의 KC중, 총 36개의 KC에 대한 관계 및 방향성 추출되었으며, 결과의 45%가 정방향 관계로 확인
09:56최종 분석 결과에 대한 설명 (데이터 입수 후 결과 추출까지는 2~3일 소요 예상)