디지털 방식으로 학습관리 시스템(LMS)을 운영하는 학교가 늘고 있다. 특히 대학에서는 학생들이 어떤 도움이 필요한지 예측하기 위해 빅데이터 LMS로 학생 데이터를 분석하고 있다. 덩말 데이터로 학습이 힘든 학생을 구분하거나 학급의 성과를 측정할 수 있을까?
브라운대학 아넨버그연구소에서 펴내는 학술지 에드워킹페이퍼(EdWorkingPapers) 9월호에 실린 버지니아대학 연구진의 논문 내용이다. 연구진은 교육업계에서 학생들이 특정 과목을 낙제하거나 학교를 중퇴하는 위험을 예측하는 데 데이터 과학을 적용할 수 있다고 밝혔다.
연구진은 2000년부터 버지니아주에 위치한 지역 대학들의 데이터에 초점을 맞췄다. 학생들의이 강의를 마지막까지 수강할 것인지 추측하는 두 가지 예측 시스템을 설정했다. 그 중 하나는 대학에서 보관하는 행정 데이터로 고등학교 GPA와 대학 성적 증명서가 포함된다. 또 다른 하나는 학생들이 LMS에서 강의를 들으면서 경험한 클릭스트림(clickstream) 데이터를 근거로 한다. 클릭스트림이란 인터넷 사용자가 방문한 웹사이트 기록을 말한다.
연구진은 대학 신입생의 경우 LMS 데이터가 학생의 성공을 예측하는 데 도움이 되며 행정 데이터만 사용한 것보다 상당히 예측력이 높다는 것을 확인했다. 그러나 재학생의 경우 LMS 데이터 기반 예측은 행정 데이터와 별 차이를 보이지 않았다.
이번 연구의 주요 저자이자 버지니아대학 교육학과 켈리 버드 조교수는 “학생의 성적을 예측할 때 가장 중요하게 여겨야 할 것은 대학의 첫 학기를 어떻게 보내느냐다”라고 말했다. 연구진은 입학 자료만으로는 학생들의 학업성취도와 실력 등 많은 점을 알 수 없기 때문일 수 있다고 지적했다.
LMS 데이터 수집 및 작업은 상당한 시간과 노력이 필요하다. 버드 조교수는 “시스템이 수많은 데이터를 생성하기 때문에 UVa 프로젝트의 숙련된 프로그래머들이 이번 작업에 수백 시간을 소요했다”고 말했다. “학생들이 학습 플랫폼에 로그인할 때마다 데이터 포인트가 생긴다. LMS의 미가공 데이터는 매우 방대해서 저장하기 어렵고 계산 집약식이어서 LMS 데이터가 예측에 적용될 때 얼마나 많은 이점이 발생하는지 알고 싶었다”라고 설명했다.
그는 “대학에서 LMS 데이터로 작업하는 시스템을 설정하면, 향후에는 데이터 분석 시간이 줄어들 것”이라고 말했다. “데이터를 통해 성적을 예측할 수 있지만, 시험결과를 개선하는 방향으로 이어지려면 할 일이 많다”고 한계를 설명했다. 현재 그는 UVa 실험실 소속 연구 디렉터로서 학생 데이터를 분석해 성공을 예측하는 연구를 진행하고 있다.
현재 LMS 데이터로 분석한 뒤 대학에서는 학습이 어려울 것으로 예측된 학생들에게 문자메세지나 이메일을 전송해 더 열심히 공부하도록 제안한다. 일각에서는 이러한 노력에 의문을 제기한다. 문자 한 통 보내는 것으로 오히려 학생들의 의욕을 꺾어 자퇴나 휴학을 결심할 수 있다는 것이다. 또는 대학에서 환영받지 못한다고 느낄 수 있다.
버드 조교수는 대학 상담가 또는 교수들에게 예측 시스템의 결과를 제공해 개입 여부와 개입 방법을 결정할 수 있도록 여러 접근법을 연구하고 있다. 개인 교습을 받거나 다른 학습 보조 자원을 이용하는 학생들에게 금전적인 인센티브를 제공하면 학업을 완료할 가능성을 높이는 데 도움이 되는지도 연구 중이다.
센트럴플로리다대학 디지털 학습 영향 평가 디렉터 팻시 모스칼은 “온라인 강의 또는 온오프라인 혼합강의가 100% 오프라인 강의보다 LMS를 많이 사용한다”며 “다만 과제가 거의 없는 강의는 예측의 근거로 사용할 데이터가 거의 남지 않기 때문에 학업이 어려운 학생을 예측하거나 조기개입하기 어렵다”고 말했다.
연구진은 ‘아직 상당한 연구가 필요한 분야’라는 한계를 인지하면서 “양질의 강의 설계 및 학생 지도에 도움이 되기를 바란다”고 밝혔다.