I. 서 론
수업 후 실시하는 평가는 학생들의 수업 목표 도달 정도를 확인하는 목적으로 사용하지만 이외에도 평가는 다양한 목적으로 활용된다. 특히 주기적으로 실시하는 평가에서는 학생들의 학업성취 변화 추이를 파악할 수 있는데, 이러한 평가를 통해 학생들은 수학 학습에 대한 자신의 성장을 확인할 수 있고, 교사나 학교, 교육청, 국가 등에서는 학생들에게 제공한 수학교육의 효과를 확인할 수 있다. 특히 국가수준에서는 자국 학생들의 학업성취 변화 추이를 파악하여 수학과 교육과정이나 수학교육 정책의 실효성 등을 확인할 수 있다. 예를 들어, 우리나라에서는 매년 국가수준 학업성취도 평가를 실시하여 중학교 3학년과 고등학교 2학년 학생들의 수학과 학업성취 변화 추이를 파악한다. 또 3년 또는 4년을 주기로 실시하는 국제학업성취도 평가에서는 참여국 학생들의 학업성취 변화 추이뿐만 아니라 이에 영향을 미치는 배경 변인들을 조사하고 있다.
TIMSS는 4년 주기로 참여국 학생들을 대상으로 수학 및 과학 학업성취도 평가를 실시하고, 수학 및 과학 학습에 영향을 미치는 배경 변인을 조사하여 변화 추이를 분석하는 국제학업성취도 평가이다. 1990년대부터 IEA 회원국들에 의해 진행되고 있으며, 우리나라 중학교 2학년은 1990년대부터 참여하여 1995년에 1차 시행을 거쳐 1999년에 반복 시행에 참여하였다(박정 외, 2004a, p.2). 현재와 같은 평가 체제를 갖추고 학업성취 변화 추이를 파악하기 위한 평가를 실시한 것은 TIMSS 2003부터이다. 우리나라 중학교 2학년은 TIMSS에서 주기별로 차이는 있으나 지속적으로 높은 학업성취를 보이고 있다.
TIMSS 수학 평가와 관련된 연구들을 보면, TIMSS 수학 평가 매주기 시행 보고 연구, TIMSS 수학 평가 매주기 결과 보고 연구, TIMSS 수학 평가에 대한 심층 연구 등으로 구분할 수 있다. TIMSS 수학 평가 매주기 시행 보고 연구(예를 들어, 김경희 외, 2007a; 김수진 외, 2015; 박상욱 외, 2019)는 매주기 TIMSS 수학 평가의 평가틀은 안내하고, 평가를 실시한 절차와 방법을 소개하는 데, 우리나라 TIMSS 주관 기관인 한국교육과정평가원의 보고서 형태이다. TIMSS 수학 평가 매주기 결과 보고 연구는 매주기 TIMSS 수학 평가 결과를 비교하는 데, 예를 들어 상경아 외(2020)은 최근에 실시한 TIMSS 2019 수학 평가 결과에 대해 전체, 성별, 내용 영역별, 인지 영역별로 보고하고 있다. 이때 우리나라 학생들의 평가 결과를 선정된 연구 대상 국가나 국제 평균과 비교하는 형태를 취하고 있다. 마지막으로 TIMSS 수학 평가에 대한 심층 연구는 TIMSS 수학 평가 결과와 관련해서 다양한 주제로 심도 깊은 연구를 수행하는 데, 한국교육과정평가원에서 실시한 연구와 개별 연구자들이 실시한 연구로 구분할 수 있다. 한국교육과정평가원에서 실시한 연구들은 한 주기 TIMSS 수학 평가에 대한 결과 보고를 한 후 다음 주기 평가 결과를 보고할 때까지 해당 주기 평가 결과를 토대로 다양한 연구를 수행한다. 서민희 외(2021)에서는 심층 연구로 선정된 연구 대상 국가의 평가 결과와 해당 국가의 수학과 교육과정을 분석하고, 우리나라 학생들의 수학 평가 결과에 영향을 미친 교육 맥락 변인을 분석하였다. 한편 개별 연구자들의 연구는 TIMSS 2019 수학 평가틀에 기반한 우리나라 수학과 교육과정 내용 비교 분석(최인선, 2020), 싱가포르의 높은 양성평등수준과 TIMSS 2011에 나타난 여학생의 높은 수학성취도 분석(유양석, 2017), TIMSS 2011 결과에 나타난 초등학교 4학년 학생들의 수학에 대한 정의적 태도와 교사 변인과의 관계 분석(김성희 외, 2015)와 같이 TIMSS 수학 평가 결과를 특정 주기 또는 특정 주제에 한정하여 심층 분석을 실시하였다.
이상으로 볼 때 TIMSS 수학 평가 결과와 관련된 연구들은 주로 특정 주기 우리나라 학생들의 학업성취도를 다른 참여국과 비교하거나 특정 주제에 한정하여 심층 분석 연구를 수행하는 반면에 장기간에 걸쳐 TIMSS 수학 평가 결과를 학업성취 변화 추이 관점에서 심층적으로 분석하는 연구는 부족해 보인다. 이런 측면을 감안하여 본 연구는 최근 5주기 TIMSS에서 우리나라 중학교 2학년 수학 학업성취 변화 추이를 분석함으로써 최근 20년 간 우리나라 중학교 2학년 수학 학업성취 변화를 조망하는데 목적이 있다. 이를 위해 먼저 주요 8개국의 최근 5주기 TIMSS에서 학업성취 변화 추이 분석을 통해 국제 비교 관점에서 우리나라 중학교 2학년 학생들의 수학 학업성취를 조망하고, 전체, 성별, 지역규모, 평가틀인 내용 영역, 인지 영역 측면에서 최근 5주기 TIMSS에서 우리나라 중학교 2학년 수학 학업성취 변화 추이를 심층 분석하였다.
II. 최근 5주기 TIMSS 수학 평가와 우리나라 수학교육 정책 동향
TIMSS는 4년마다 시행되지만 매주기 평가틀과 평가 요소가 조정되기 때문에 최근 5주기(TIMSS 2003, 2007, 2011, 2015, 2019) 학생들의 학업성취 변화 추이를 분석하기에 앞서 먼저 최근 5주기 TIMSS의 수학 평가틀에 어떤 변화가 있었는지를 살펴보았다. 아울러 최근 5주기 TIMSS와 연계해서 학생들의 학업성취에 영향을 미친 국내 수학교육 정책 동향도 살펴보았다.
최근 5주기 TIMSS 수학 평가 동향을 평가틀인 내용 영역과 인지 영역, 문항 수 및 검사 구성을 중심으로 살펴보았다.
내용 영역은 TIMSS 수학 평가에서 평가하는 수학 내용을 몇 개의 범주로 구분한 것이다. <표 1>은 평가 주기별 TIMSS 수학 평가의 내용 영역을 제시한 것이다. TIMSS 2007에서는 이전 주기의 5개 영역을 4개 영역으로 조정하였는데, ‘측정’과 ‘기하’를 ‘기하’로 통합하였다(김경희 외, 2007a, p.13). ‘자료의 표현 및 해석, 확률’은 ‘자료와 가능성’으로 조정하여 통계뿐만 아니라 확률과 관련된 내용도 포함하여 TIMSS 2011, 2015까지 유지되다 TIMSS 2019에서 ‘자료와 확률’로 조정하였는데(박상욱 외, 2019), 이는 대부분의 국가 수학과 교육과정에서 중학교 2학년에서는 확률의 비형식적 주제인 ‘가능성’보다는 실제 ‘확률’을 지도하고 있다는 점을 반영한 것으로 보인다(권점례 외, 2018, p.470).
출처: 박정 외(2004b, p.9), 김경희 외(2007a, pp.16-19), 조지민 외(2011, pp.18-21), 김수진 외(2015, p.17), 박상욱 외(2019, p.16)을 참조하여 표로 작성한 것을 서민희 외(2022, p.50)에서 발췌
<표 2>는 가장 최근에 실시된 TIMSS 2019 중학교 2학년의 내용 영역별 평가 주제를 나타낸 것이다. <표 2>를 보면, 내용 영역별 평가 주제가 우리나라 수학과 교육과정의 초등학교 5-6학년군과 중학교 1-3학년군에서 지도되는 내용 요소로, 초등학교 5-6학년군에서 지도되는 내용 요소는 우리나라 중학교 2학년이 쉽게 답할 수 있었을 것이다. ‘수’ 영역의 ‘분수와 소수’, ‘비, 비율, 백분율’, ‘기하’ 영역 ‘기하 도형과 측정’의 일부 평가 주제 등이 그 예이다. 한편 대수 영역의 ‘수, 말, 대수식을 사용해서 수열에서 패턴 관계 만들기’에서는 수열이라는 용어를 사용하고 있지만 수나 그림의 규칙이나 패턴 등에 대한 것으로, 우리나라 초등학교 5-6학년군 또는 중학교 1-3학년군에서 지도하는 내용 요소이다. 한편 표에서 내용 영역과 하위 주제 영역에 제시된 비율은 TIMSS 2019 수학 평가에서 목표로 하는 내용 영역별 또는 주제 영역별 비중으로, 영역별 평가 시간과도 밀접하게 연계된다(Mullis, & Martin, 2017, p.18).
출처: Mullis, & Martin, 2017, pp.19-21, 서민희 외(2022, pp.52-56)에서 재인용
인지 영역은 학생들이 수학 학습을 통해 나타내기를 기대하는 행동으로, TIMSS 수학 평가에서 인지 영역은 평가 문항을 해결하는 데 요구되는 학생들의 사고 과정을 나타낸다. 내용 영역과는 달리 인지 영역은 교과(수학, 과학)나 학년(초등학교 4학년, 중학교 2학년)에 따라 동일하게 구성된다. <표 3>은 TIMSS 평가 인지 영역의 변화를 나타낸 것이다.
출처: 김경희 외(2007a, p.20), 김경희 외(2007b, pp.13-16), 조지민 외(2011, p.22), 김수진 외(2015, p.18), 박상욱 외(2019, p.17)를 참조하여 표로 작성한 것을 서민희 외(2022, p.65)에서 발췌
TIMSS 2003에서는 이전 주기 ‘행동 영역’이라는 명칭을 ‘인지 영역’으로 변경하고, 하위 주제 영역을 ‘사실과 절차 지식’, ‘개념 활용’, ‘정형적인 문제해결’, ‘추론’의 4개로 조정하였고, ‘의사소통’은 모든 내용 영역과 인지 영역에 공통으로 작용하므로 제외하였다(박정 외, 2004a, pp.9-10). TIMSS 2007에서는 ‘알기’, ‘적용하기’, ‘추론하기’로 인지 영역을 조정하였는데, 이를 TIMSS 2011, 2015, 2019까지 사용하고 있다. ‘알기’는 학생들이 알아야 하는 사실, 절차, 개념을 포함하고, ‘적용하기’는 학생들이 문제를 풀거나 질문에 대답하기 위해 지식과 개념 이해를 적용하는 능력을 의미하며, ‘추론하기’는 정형적인 문제의 해결을 넘어서서 낯선 상황, 복잡한 맥락, 다단계 문제해결을 포괄하는 행동을 말한다(김경희 외, 2007a, p.20).
TIMSS의 특징 중 하나는 인지 영역에서도 평가 주제를 제시하고 있다는 점이다. 인지 영역의 평가 주제도 평가 주기에 따라 일부 조정이 되는데, <표 4>는 TIMSS 2019 수학 평가의 인지 영역 평가 주제이다. 인지 영역의 평가 주제는 초등학교 4학년과 중학교 2학년이 동일하게 구성되는 데, 평가 문항 구성 시 내용 영역과 인지 영역의 평가 주제를 통합한다. 한편 표에서 제시된 비율은 초등학교 4학년과 중학교 2학년의 인지 영역별 평가 문항의 목표 비율을 나타내는데, 학교급이 올라갈수록 ‘알기’ 비율이 줄어들고, ‘추론하기’ 비율이 늘어나는 것을 볼 수 있다.
출처: Mullis, & Martin, 2017, pp.22-24, 서민희 외(2022, p.66)에서 재인용
TIMSS 수학 평가에서는 문항 수, 검사 유형, 문항 유형 등에도 변화가 있었다. <표 5>는 TIMSS 수학 평가 중학교 2학년의 평가틀에 따른 문항 수, 검사 유형, 문항 유형의 변화를 요약하여 제시한 것이다. TIMSS 2003의 경우 전체 문항 수는 194문항이고, 검사 유형이 12종, TIMSS 2007, 2011, 2015의 경우 전체 문항 수는 210-220문항이고, 검사 유형은 14종이다. 매주기 전체 문항 수는 200문항 이상으로 한 학생이 모든 문항에 답하기 어렵기 때문에 이를 몇 개의 검사 유형(Booklet)으로 나누고, 한 학생이 1종의 검사 유형에 참여하도록 한다. TIMSS 2019에서는 문제해결과 탐구 능력을 알아보는 새로운 문항군(PSIs)이 추가되면서 전체 문항 수가 236문항으로 증가하고, 검사 유형도 16종으로 증가하였다. 한편 TIMSS 수학 평가의 문항 유형은 선다형과 구성형으로, 평가 주기에 따라 선다형 문항 수는 점차 줄어들고, 구성형 문항 수는 점차 늘어나고 있다.
출처: 박정 외(2004b, pp.8-10), 김경희 외(2007a, pp.43-44), 김경희 외(2007b, pp.10-12), 조지민 외(2011, pp.39-42), 김수진 외(2015, pp.19-21), 박상욱 외(2019, pp.17-21)를 참조하여 표로 작성한 것을 서민희 외(2022, p.68)에서 발췌
다음에서는 최근 5주기 TIMSS 평가 결과와 연관된 국내 수학과 교육과정 동향을 살펴보았다. <표 6>은 TIMSS 수학 평가 시행 시기와 중학교 2학년에 적용된 수학과 교육과정, 수학교육 관련 정책 등을 제시한 것이다. TIMSS 중학교 2학년 본검사 시행 시기를 보면, TIMSS 2003, 2007에서는 제7차 수학과 교육과정, TIMSS 2011, 2015는 2007 개정 수학과 교육과정, TIMSS 2019에서는 2009 개정 수학과 교육과정이 적용된 것을 알 수 있다. 아울러 수학과 교육과정이 적용되는 과도기에는 본검사 시행 전후 학년에서 다른 수학과 교육과정이 적용될 수 있다.
구분\주기 | TIMSS 2003 | TIMSS 2007 | TIMSS 2011 | TIMSS 2015 | TIMSS 2019 |
---|---|---|---|---|---|
본검사 시행 시기3) | 2002년 | 2006년 | 2010년 | 2014년 | 2018년 |
수학과 교육과정 | 제7차 | 제7차 | 2007 개정 | 2009 개정 | 2009 개정 |
수학교육 종합계획 | - | - | - | 수학교육 선진화 방안 | 제2차 수학교육 종합계획 |
기타 | - | - | - | - | 과학·수학·정보 교육진흥법 (시행 2018.4.25.) |
이외에도 국가 수준 수학교육 정책인 수학교육 종합계획은 2012년부터 5년 주기로 발표되고 있다. 이것으로 볼 때 TIMSS 2015이 실시되었던 2014년에는 수학교육 선진화 방안(2012-2014년), TIMSS 2019이 시행되었던 2018년에는 제2차 수학교육 종합계획(2015-2019년)이 적용되고 있었다. 이외에 「과학·수학·정보교육 진흥법(시행 2018.4.25.)」2018년에 고시되었는데, 이는 TIMSS 2019 본검사가 시행되었던 시기이기는 하지만 학교에서의 수학교육에 구체적인 영향을 미친 것으로 보이지는 않는다. 한편 「기초학력 보장법(시행 2022.3.25.)」은 2022년에 시행되어 최근 5주기 TIMSS와 시기적으로 겹치지는 않으나 해당 법이 제정되어 시행되기 이전에도 교육부나 시도교육청(교육지원청 포함)의 정책 등을 통해 학교에서의 수학교육에 상당한 영향을 미친 것으로 보인다.
III. 연구 방법 및 절차
본 연구에서는 최근 5주기 TIMSS 결과에서 나타난 우리나라 중학교 2학년 학생들의 수학 학업성취 변화 추이를 알아보기 위해 우리나라 학생들의 수학 학업성취 변화 추이를 심층적으로 분석함과 동시에 주요 8개국과의 비교를 실시하였다. 앞서 살펴본 바와 같이 매주기 TIMSS 수학 평가는 평가틀인 내용 영역과 인지 영역의 평가 주제, 검사 문항 수, 검사 유형, 문항 유형 등에서 변화가 있기 때문에 학생들의 학업성취 변화 추이가 TIMSS 수학 평가의 변화로 인한 것인지, 우리나라 학생들의 고유한 변화인지를 확인하기 어렵다. 그래서 본 연구에서는 우리나라를 포함해서 주요 8개국을 선정하고, 이들 국가와 우리나라 학생들의 수학 학업성취 변화 추이를 비교하였다. 선정한 주요 8개국 중에는 우리나라를 포함해서 싱가포르, 대만, 일본을 포함하는 TIMSS 수학 평가 상위권 4개국과 러시아 연방, 미국, 영국, 호주를 포함하는 TIMSS 수학 평가 중하위권이지만 우리나라 수학교육에 영향을 미치는 4개국이다.
선정된 연구 대상 국가에서 최근 5주기 TIMSS 수학 평가에 참여한 학생 수는 <표 7>과 같다. 국가에 따라 참여하는 학생 수가 차이는 있으나 최근 5주기 동안 참여 학생 수가 거의 유사하고, 남학생과 여학생의 비율도 일정한 것을 볼 수 있다. 우리나라의 경우 최근 5주기 동안 매주기 중학교 2학년 3800~5300명의 학생이 참여하였다.
출처: 서민희 외, 2022, p.458
본 연구에서는 최근 5주기 TIMSS에서 나타난 우리나라 중학생 2학년 학생들의 수학 학업성취 변화 추이를 분석하였는 데, 주요 8개국의 비교·분석과 우리나라 심층 분석으로 구분할 수 있다. 주요 8개국의 비교·분석에서는 전체 및 성별 학업성취도 평균과 성취수준별 비율의 변화 추이를 분석하였고, 우리나라 심층 분석에서는 학업성취도 평균과 성취수준별 비율의 변화 추이에 대한 분석과 더불어 평가틀인 내용 영역과 인지 영역에 대한 분석을 실시하였다(<표 8> 참조).
한편 TIMSS에서는 교과별로 개별 학생의 학업성취도 점수를 5개의 유의측정값(plausible values; 이하 PV)으로 제공하고 있으며, 5개 PV 중 하나를 선택적으로 활용하거나 이 값들을 평균한 측정치로 활용하는 것을 권장하지 않아서 서민희 외(2022)에서는 IEA에서 개발한 IDB Analyzer를 활용하여 5개의 PV를 모두 반영한 분석을 실시하였고, 본 연구는 그 연구의 일부를 발췌한 것이다. 한편 내용 영역에 따른 성취수준별 학업성취도 점수 분석에서는 IDB Analyzer를 활용하더라도 5개의 PV를 반영하는 것이 불가능하여 SPSS 21.0에서 제공하는 다중대체(multiple imputation)4) 방법을 활용하였다(서민희 외, 2022, p.116).
IV. 결과 분석
최근 5주기 TIMSS 수학 평가에서 우리나라 중학교 2학년의 학업성취 변화 추이는 먼저 우리나라를 포함한 주요 8개국의 학업성취 변화 추이를 비교·분석하였고, 다음으로 우리나라 학생들의 학업성취 변화 추이를 심층 분석하였다.
우리나라 학생들의 학업성취 변화 추이를 분석하기에 앞서 주요 8개국의 학업성취 변화 추이를 비교함으로써 우리나라 학생들의 학업성취 변화 추이가 다른 국가들에 비해 어떠한지, 그리고 이러한 변화가 TIMSS 수학 평가 자체의 변화로 인한 것인지, 우리나라 학생 고유의 변화인지를 확인하고자 하였다.
먼저 [그림 1]은 주요 8개국 중학교 2학년의 학업성취도 평균 변화 추이를 나타낸 것이다. TIMSS 수학 평가의 학업성취도 결과는 매주기 평균 500, 표준편차 100으로 표준화하여 제공하고 있다(서민희 외, 2022, p.118). 주요 8개국의 학업성취도 평균은 주기별로 차이는 있으나 대체로 상승하는 것을 볼 수 있다. 학업성취도 평균은 우리나라, 싱가포르, 대만, 일본의 경우 약 600, 러시아 연방, 미국, 영국, 호주의 경우 약 500으로 나타났고, 싱가포르는 8개국 중 학업성취도 평균이 가장 높게 나타났다. 또 대만, 일본, 러시아 연방, 호주의 경우 다른 주기에 비해 TIMSS 2019가 높게 나타난 반면에, 싱가포르, 미국, 영국의 경우 TIMSS 2019가 이전 주기보다 낮게 나타났고, 우리나라는 TIMSS 2011이 가장 높게 나타났다.
[그림 2]는 주요 8개국 중학교 2학년 남학생과 여학생의 학업성취도 평균 변화 추이를 나타낸 것이다. 남학생과 여학생의 학업성취도 평균 변화 추이는 국가별로 차이를 보이고 있다. 우리나라와 호주의 경우 남학생의 학업성취도 평균이 높게 나타났는데, 우리나라는 남학생과 여학생의 격차가 크지 않는 반면에, 호주는 남학생과 여학생의 격차가 크게 나타나다가 점차 줄어드는 것을 볼 수 있다. 싱가포르와 대만의 경우 여학생의 학업성취도 평균이 높게 나타났는데, 싱가포르는 여학생과 남학생의 격차가 크게 나타나다가 TIMSS 2019에 급격하게 줄어든 반면에, 대만은 여학생과 남학생의 격차가 크지 않은 것을 볼 수 있다. 이외에 일본, 러시아 연방, 미국, 영국의 경우 평가 주기에 따라 남학생의 학업성취도 평균이 높게 나타나기도 하고, 여학생의 학업성취도 평균이 높게 나타나기도 하였다.
[그림 3]은 주요 8개국 중학교 2학년 성취수준별 비율 변화 추이를 나타낸 것이다. TIMSS 평가에서는 학생들의 학업성취도를 수월수준, 우수수준, 보통수준, 기초수준, 기초수준 미달의 5개 성취수준으로 구분하는데, 기초수준과 기초수준 미달은 그 비율이 매우 작기 때문에 서민희 외(2022)에서는 이를 통합하여 수월수준, 우수수준, 보통수준, 기초수준 이하의 4개 수준으로 구분하여 성취수준별 비율 변화 추이를 살펴보았다.
위의 [그림 3]을 보면, 상위권인 우리나라, 싱가포르, 대만, 일본이 유사한 경향을 보이고, 중하위권인 러시아 연방, 미국, 영국, 호주가 유사한 경향을 보였다. 특히 우리나라, 싱가포르, 대만의 경우 수월수준의 비율이 가장 높고, 다음으로 우수수준, 보통수준, 기초수준 이하의 순으로 나타났고, 특히 싱가포르의 경우 우리나라나 대만에 비해 수월수준의 비율이 높고 기초수준 이하의 비율이 낮은 것을 볼 수 있다. 일본의 경우 대략적인 경향은 우리나라, 싱가포르, 대만과 유사하지만 다른 국가에 비해 수월수준의 비율이 낮고, 보통수준과 기초수준 이하의 비율이 높은 것을 볼 수 있다. 러시아 연방, 미국, 영국, 호주의 경우 앞서 언급한 4개국과 비교해서 보통수준과 기초수준 이하의 비율이 높고, 수월수준과 우수수준의 비율이 낮은 것을 볼 수 있다. 특히 미국, 영국, 호주는 보통수준과 기초수준 이하의 비율이 전체의 약 70%를 차지하고 있다. 또 주기별로 큰 차이는 아니지만 이들 국가에서도 수월수준의 비율이 대체적으로 증가하는 것을 볼 수 있다. 러시아 연방의 경우 미국, 영국, 호주와 달리 우수수준과 보통수준의 비율이 전체의 약 60%를 차지하고, 기초수준 이하의 비율이 낮으며, 평가 주기에 따라 지속적으로 기초수준 이하의 비율이 감소하는 것을 볼 수 있다.
[그림 4]는 주요 8개국 중학교 2학년 남학생과 여학생의 성취수준별 비율 변화 추이를 나타낸 것이다. 앞서 제시한 [그림 3]과 유사하게 주요 8개국이 두 유형으로 구분되는 데, 우리나라, 싱가포르, 대만, 일본이 유사한 경향을 보였고, 러시아 연방, 미국, 영국, 호주가 유사한 경향을 보였다. 한편 성취수준별로 보면, 비록 그 차이가 크지는 않지만 우리나라, 싱가포르, 대만, 일본도 차이가 있었다. 우리나라의 경우 대체로 수월수준과 기초수준 이하에서는 남학생의 비율이 높게 나타난 반면에, 우수수준과 보통수준에서는 여학생의 비율이 높게 나타났다. 반면에 싱가포르는 대체로 수월수준과 우수수준에서는 여학생의 비율이 높게 나타난 반면에, 보통수준과 기초수준 이하에서는 남학생의 비율이 높게 나타났다. 대만의 경우 수월수준에서는 남학생의 비율이 높게 나타났고, 우수수준에서는 여학생의 비율이 높게 나타났으며 나머지 수준에서는 큰 차이가 나타나지 않았다. 일본은 성별에 따른 차이가 대체로 크지 않았는데, 수월수준은 남학생의 비율이 높게 나타났고, 기초수준 이하에서는 TIMSS 2003에서 남학생의 비율이 높게 나타났으나 이후 격차가 점점 줄어들다가 TIMSS 2019에서 다시 늘어나는 것을 볼 수 있다. 러시아 연방, 미국, 영국, 호주의 경우 대체로 성별에 따른 비율 차이가 크지 않게 나타났다. 러시아 연방, 미국, 영국의 경우 모든 성취수준에서 성별에 따른 차이가 거의 나타나지 않았고, 호주의 경우 다른 국가에 비해 수월수준과 기초수준 이하에서 여학생의 비율이 다소 높게 나타났다.
우리나라 중학교 2학년 학생들의 학업성취 변화 추이는 전체, 성별, 지역 규모별로 성취수준별 비율과 학업성취도 평균을 중심으로 살펴보았다. 또 평가틀인 내용 영역과 인지 영역에 대해서 학업성취도 평균을 중심으로 학업성취 변화 추이를 살펴보았다.
먼저 최근 5주기 TIMSS에서 우리나라 중학교 2학년 전체 학생들의 학업성취 변화 추이를 알아보았다. [그림 5]는 앞서 제시한 [그림 3]에서 우리나라 학생들이 성취수준별 비율 변화 추이를 재구성해서 나타낸 것이다. 모든 주기에서 수월수준 비율이 가장 높고, 다음으로 우수수준, 보통수준, 기초수준 이하의 순으로 비율이 높게 나타났다. 또 주기별로 다소 차이는 있으나 수월수준의 비율은 점차 증가하는 반면에 우수수준과 보통수준의 비율은 점차 감소하는 경향을 보였다. 한편 기초수준 이하는 TIMSS 2011, 2015에서 약 7%까지 감소하였다가 TIMSS 2019에서 다시 약 10%로 증가한 것을 볼 수 있다.
[그림 6]은 중학교 2학년 성취수준별 학업성취도 평균 변화 추이를 나타낸 것이다. 우리나라 전체 학생들의 학업성취도 평균은 TIMSS 2003에서는 우수수준과 유사하였으나 이후 상승하여 TIMSS 2019에서는 우수수준보다 17점 높아진 것을 볼 수 있다. 한편 수월수준의 평균은 상승하다가 TIMSS 2015에서 하락하였으나 TIMSS 2019에서 다시 상승하여 가장 높게 나타났고, 기초수준 이하의 평균은 대체로 상승하다가 하락하여 TIMSS 2019에서 가장 낮게 나타났다. 반면에 우수수준과 보통수준의 평균은 주기별로 큰 변화가 없었다. 앞서 제시한 [그림 5]와 연계하여 볼 때, 우리나라 중학교 2학년은 TIMSS 2019에서 수월수준의 경우 비율이 증가하고 학업성취도 평균도 상승한 반면에, 기초수준 이하의 경우 비율이 증가하고 학업성취도 평균이 하락하여 학생들의 학력 격차가 심회되는 것을 볼 수 있다.
[그림 7]은 [그림 4]에 제시된 우리나라 남학생과 여학생의 성취수준별 비율 변화 추이를 발췌한 것이다. 대체로 남학생과 여학생 모두 [그림 5]에 제시된 전체와 유사하게 수월수준의 비율이 가장 높고, 다음으로 우수수준, 보통수준, 기초수준 이하의 순으로 나타났다. 또 수월수준과 기초수준 이하는 남학생의 비율이 높게 나타났고, 우수수준과 보통수준은 대체로 여학생의 비율이 높게 나타났다.
[그림 8]은 우리나라 중학교 2학년 남학생과 여학생의 성취수준별 학업성취도 평균 변화 추이를 나타낸 것이다. 매주기 수월수준과 기초수준 이하에서는 학업성취도 평균의 변화가 크게 나타난 반면에, 우수수준과 보통수준에서는 학업성취도 평균의 변화가 거의 나타나지 않았다. 특히 수월수준에서는 남학생의 학업성취도 평균이 여학생의 평균에 비해 일관성 있게 높았고, 기초수준 이하에서는 주기별로 차이는 있으나 TIMSS 2003을 제외한 모든 주기에서 여학생의 학업성취도 평균이 남학생의 평균에 비해 높았다.
본 연구에서는 TIMSS에 참여한 학생들의 소속 학교를 대도시, 중소도시, 읍면지역으로 구분하고, 학교가 속한 지역 규모에 따라 학생들의 학업성취에 차이가 있는지를 알아보았다. [그림 9]는 중학교 2학년의 지역규모에 따른 성취수준별 비율 변화 추이를 나타낸 것이다. 우수수준을 제외한 성취수준에서 매주기 일관성 있는 결과가 나타났다. 수월수준에서는 대도시의 비율이 가장 높고, 읍면지역의 비율이 가장 낮은 반면에, 보통수준과 기초수준 이하에서는 대도시의 비율이 가장 낮고, 읍면지역의 비율이 가장 높게 나타났다. 한편 대부분의 주기에서 우수수준은 지역규모에 따라 차이가 크게 나타나지 않은 반면에, TIMSS 2011에서는 읍면지역의 비율이 다른 지역에 비해 높게 나타난 것을 볼 수 있다. 이것으로 볼 때, 우리나라 중학교 2학년 학생들의 성취수준별 비율은 지역 규모에 따라 차이를 보였다. 대도시에서는 학업성취가 높은 수월수준의 비율이 높고, 학업성취가 낮은 기초수준 이하의 비율이 낮은 반면에, 읍면지역에서는 학업성취가 높은 수월수준의 비율이 낮고, 학업성취가 낮은 보통수준과 기초수준 이하의 비율이 높게 나타났다.
[그림 10]은 지역규모에 따른 성취수준별 학업성취도 평균 변화 추이를 나타낸 것이다. 수월수준과 기초수준 이하에서는 지역규모에 따라 학업성취도 평균의 차이가 크게 나타난 반면에, 우수수준과 보통수준에서는 평균의 차이가 거의 나타나지 않았다. 수월수준의 경우 매주기 대도시의 평균이 가장 높고, 다음으로 중소도시, 읍면지역의 순으로 나타났으며, 대도시와 중소도시는 평가 주기에 따라 학업성취도 평균이 크게 변하고 있는 반면에, 읍면지역은 차이가 크지는 않지만 지속적으로 상승하는 것을 볼 수 있다. 기초수준 이하의 경우 읍면지역에서 학업성취도 평균의 변화가 크게 나타났는데, TIMSS 2003, 2007, 2011에서는 대도시나 중소도시보다 낮았는데 TIMSS 2015, 2019에서는 대도시나 중소도시보다 크게 상승한 것을 볼 수 있다.
TIMSS 수학 평가에서 중학교 2학년은 수, 대수, 기하, 자료와 확률로 내용 영역을 구분하고 있다. 먼저 [그림 11]은 중학교 2학년 내용 영역별 학업성취도 평균 변화 추이를 나타낸 것으로, 내용 영역별로 학업성취도 평균의 변화 추이에 차이가 있는 것을 볼 수 있다. 즉 매주기 대수 영역과 기하 영역은 학업성취도 평균의 변화가 적은 반면에, 수 영역과 자료와 확률 영역은 학업성취도 평균의 변화가 크게 나타났다. 수 영역은 TIMSS 2011에서 평균이 높게 나타났고, 자료와 확률 영역은 TIMSS 2011까지 평균이 급격하게 상승하다 TIMSS 2015, 2019에서 하락한 것을 볼 수 있다.
[그림 12]는 중학교 2학년 성취수준별 내용 영역의 학업성취도 평균 변화 추이를 나타낸 것이다. 앞서 제시한 [그림 8], [그림 10]과 마찬가지로 수월수준과 기초수준 이하에서는 우수수준이나 보통수준에 비해 내용 영역별 평균의 차이가 크게 나타났다.
먼저 수월수준의 경우 내용 영역별 평균의 변화가 큰 것을 볼 수 있다. 대수 영역은 모든 평가 주기에서 다른 영역에 비해 평균이 높게 나타났고, 다음으로 수 영역과 기하 영역의 평균이 높게 나타났으며, 자료와 확률 영역의 평균이 가장 낮게 나타났다. 특히 TIMSS 2003에서는 자료와 확률 영역의 평균이 다른 영역에 비해 매우 낮게 나타났고, TIMSS 2019에서는 이전 주기인 TIMSS 2015에 비해 모든 내용 영역의 평균이 상승하는 것을 볼 수 있다.
우수수준의 경우 TIMSS 2003에서 자료와 확률의 평균이 낮게 나타난 것을 제외하면, 모든 내용 영역에서 평균의 변화가 크지 않고, 내용 영역 간에도 평균의 차가 크지 않음을 볼 수 있다. 보통수준의 경우 내용 영역별 평균의 변화가 우수수준보다는 크게 나타났으나 다른 성취수준보다는 크지 않았다. 주기에 따라 차이는 있으나 대수 영역과 자료와 확률 영역의 학업성취도 평균의 변화가 수 영역과 기하 영역보다 크게 나타났다.
기초수준 이하의 경우 수월수준과 마찬가지로 내용 영역 간 평균의 차이가 크게 나타났다. 주기에 따라 차이는 있으나 대체로 기하 영역과 자료와 확률 영역의 학업성취도 평균이 수 영역과 대수 영역보다 높게 나타났다. 이러한 결과는 보통수준에서도 나타났는데, 기초수준 이하에서는 보통수준보다 그 차이가 크게 나타났다. 기하 영역과 자료와 확률 영역은 수학과 교육과정에서 교육 내용 간 위계성이 적어 선수 학습이 이후 학습에 미치는 영향이 적은 반면에, 수 영역과 대수 영역은 교육 내용 간 위계성이 커서 선수 학습이 이후 학습에 미치는 영향이 크다고 볼 수 있다. 한편 기초수준 이하에서는 최근 모든 내용 영역에서 학업성취도 평균이 하락하는데, 수 영역과 자료와 확률 영역은 TIMSS 2015부터 하락하였고, 대수 영역과 기하 영역은 TIMSS 2019에서 하락하였다. 이러한 결과는 수월수준에서 학업성취도 평균이 상승하는 것과 대조를 이룬다.
[그림 13]은 중학교 2학년 남학생과 여학생의 내용 영역별 학업성취도 평균 변화 추이를 나타낸 것으로, 남학생과 여학생의 학업성취도 평균 변화 추이는 내용 영역에 따라 차이가 있었다. 앞서 제시한 [그림 8]을 보면, 남학생의 학업성취도 평균이 높게 나타났는데, 내용 영역별로도 유사한 결과가 나타났다. 즉 매주기 대부분의 내용 영역에서 남학생의 학업성취도 평균이 높게 나타나거나 차이가 없는 것으로 나타났다. 수 영역의 경우 매주기 남학생의 학업성취도 평균이 높게 나타났고, 기하 영역과 자료와 확률 영역은 평가 주기에 따라 남학생의 학업성취도 평균이 높게 나타났다가 차이가 없다가 다시 높게 나타나는 것을 반복하고 있다. 반면에 대수 영역의 경우 TIMSS 2003, 2007, 2011에서는 남학생과 여학생의 학업성취도 평균에 차이가 없었으나 TIMSS 2015에서는 여학생의 학업성취도 평균이 높게 나타났고, TIMSS 2019에서는 그 차이가 줄어들었다.
[그림 14]는 중학교 2학년 지역규모에 따른 내용 영역별 학업성취도 평균 변화 추이를 나타낸 것이다. 모든 내용 영역에서 지역규모에 따라 학업성취도 평균의 차이가 매우 크게 나타났다. 매주기 대도시의 평균이 가장 높고, 다음으로 중소도시, 읍면지역의 순이며, 지역규모 간 학업성취도 평균의 차이도 매우 크게 나타났다. 특히 TIMSS 2007에서는 다른 주기에 비해 모든 내용 영역에서 읍면지역의 평균이 매우 낮게 나타났고, 이후 점차 개선되는 것을 볼 수 있다. 앞서 제시한 [그림 10]에서는 수월수준과 기초수준 이하에서 지역규모에 따라 학업성취도 평균 차이가 크게 나타났는데, [그림 14]에서는 모든 내용 영역에서 지역규모에 따라 학업성취도 평균 차이가 크게 나타나는 것으로 보아 지역 간 학력 격차가 심화되는 것을 볼 수 있다.
TIMSS 평가에서는 인지 영역을 알기, 적용하기, 추론하기로 구분하고 있다. [그림 15]는 중학교 2학년 인지 영역별 학업성취도 평균 변화 추이를 나타낸 것이다. 세 영역 모두 TIMSS 2003에서 TIMSS 2011까지 학업성취도 평균이 상승하다가 TIMSS 2015에 하락하였으나 TIMSS 2019에서 알기 영역은 다시 상승하였고 적용하기 영역은 근소하게 하락하였으며, 추론하기 영역은 근소하게 상승하였다. 또 알기 영역은 TIMSS 2011을 제외한 모든 주기에서 학업성취도 평균이 가장 높았고, TIMSS 2011까지는 적용하기 영역의 학업성취도 평균이 추론하기 영역보다 높았으나 TIMSS 2015부터 추론하기 영역의 학업성취도 평균이 적용하기 영역보다 높게 나타났다.
[그림 16]은 중학교 2학년 성취수준별 인지 영역 학업성취도 평균 변화 추이를 나타낸 것이다. 앞서 제시한 내용 영역의 결과와 마찬가지로 인지 영역에서도 수월수준과 기초수준 이하의 학업성취도 평균 변화가 우수수준이나 보통수준보다 크게 나타났다.
수월수준의 경우 매주기 알기 영역의 학업성취도 평균이 가장 높고, 다음으로 적용하기 영역, 추론하기 영역의 순으로 나타났다. 또 인지 영역 간 평균 차이는 TIMSS 2003, 2007에서 크게 나타났다가 TIMSS 2011, 2015에서 점차 줄어들었으나 TIMSS 2019에서 다시 커지는 것을 볼 수 있다. 한편 TIMSS 2019에서는 인지 영역별로 차이는 있으나 모든 인지 영역에서 학업성취도 평균이 상승하였다. 우수수준의 경우 수월수준과 마찬가지로 인지 영역 간 학업성취도 평균 차이가 TIMSS 2003, 2007에서 크게 나타났다가 TIMSS 2011, 2015에서 점차 줄어들었으나 TIMSS 2019에서 다시 커졌다. 또 이전 주기와 달리 TIMSS 2019에서는 적용하기 영역의 학업성취도 평균이 추론하기 영역보다 낮아졌다. 한편 보통수준의 경우 다른 수준에 비해 인지 영역 간 평균의 차이가 크지 않았다. 마지막으로 기초수준 이하의 경우 TIMSS 2007을 제외한 주기에서 인지 영역 간 평균 차이가 우수수준이나 보통수준에 비해 크게 나타났다. 또 매주기 추론하기 영역의 평균이 가장 높게 나타났고, 알기 영역의 평균은 TIMSS 2003 이후 지속적으로 하락하였으며, 적용하기 영역은 상승과 하락을 반복하였다. 한편 TIMSS 2019에서는 인지 영역에 따라 정도의 차이는 있으나 모든 영역에서 평균이 하락하는 것을 볼 수 있다.
[그림 17]은 중학교 2학년 남학생과 여학생의 인지 영역별 학업성취도 평균 변화 추이를 나타낸 것이다. 남학생과 여학생의 학업성취도 평균 변화 추이는 인지 영역에 따라 차이가 있었다. 적용하기 영역과 추론하기 영역에서는 매주기 남학생의 학업성취도 평균이 여학생보다 높게 나타났고, 적용하기 영역은 다른 영역에 비해 차이가 크게 나타나다가 TIMSS 2015에서 차이가 크게 줄었다. 알기 영역은 TIMSS 2003, 2011, 2019에서는 남학생의 학업성취도 평균이 여학생보다 높게 나타났고, TIMSS 2007, 2015에서는 큰 차이는 아니지만 여학생의 학업성취도 평균이 남학생보다 높게 나타났다.
[그림 18]은 중학교 2학년 지역 규모에 따른 인지 영역의 학업성취도 평균 변화 추이를 나타낸 것이다. 내용 영역과 마찬가지로 인지 영역에서도 지역규모에 따라 학업성취도 평균 차이가 크게 나타났다. 매주기 대도시의 평균이 가장 높고, 다음으로 중소도시, 읍면지역의 순으로 나타났고, 지역 간 차이도 매우 크게 나타났다. 특히 TIMSS 2007에서는 다른 주기에 비해 모든 영역에서 읍면지역의 평균이 크게 하락하였다가 TIMSS 2011에서 크게 상승하였다. 한편 앞서 제시한 [그림 10]과 연계해서 보면, 내용 영역과 인지 영역 모두 수월수준과 기초수준 이하에서 지역규모에 따라 학업성취도 평균의 차이가 크게 나타났다.
V. 결론 및 제언
본 연구에서는 최근 5주기 TIMSS 평가 결과를 통해 우리나라 중학교 2학년 학생들의 수학 학업성취 변화 추이를 분석하였다. 이를 위해 TIMSS 참여국 중 학업성취도 상위권 4개국(대한민국, 싱가포르, 대만, 일본), 중하위권 4개국(러시아 연방, 미국, 영국, 호주)을 선정하여 학업성취 변화 추이를 비교·분석하였고, 다음으로 우리나라 학생들의 학업성취 변화 추이를 심층 분석하였다. 본 연구를 통해 다음과 같은 결론을 도출할 수 있었다.
첫째, 최근 5주기 TIMSS에서 평가 주기에 따라 차이가 있으나 우리나라 중학교 2학년 학생들의 학업성취도는 지속적으로 높게 나타났다. 본 연구에서 연구 대상 국가로 선정된 상위국(싱가포르, 대만, 일본)이 우리나라와 유사한 경향성을 보였는데, 특히 싱가포르의 경우 우리나라에 비해 학업성취도 평균이나 성취수준별 비율이 높게 나타났고, 우리나라는 대만과 유사한 결과를 보였으며, 일본은 학업성취도 평균이나 성취수준별 비율에서 다른 국가에 비해 낮게 나타났다. TIMSS가 4년 주기로 시행된다는 점을 감안하면 우리나라 중학교 2학년 학생들은 최근 20년 동안 지속적으로 높은 수학 학업성취도를 보였다고 볼 수 있다.
둘째, 최근 5주기 TIMSS 결과에서 중학교 2학년 학생들의 학력 격차가 심화되고 있다. TIMSS에서는 학생들의 성취수준을 수월수준, 우수수준, 보통수준, 기초수준, 기초 이하의 5개 수준으로 구분하고 있는데, 성취수준별 학생 비율을 보면 평가 주기에 따라 우수수준과 보통수준의 비율은 변화가 거의 없는 반면에 수월수준의 비율이 늘어나는 동시에 기초수준 이하의 비율 역시 늘어나는 현상을 보였다. 아울러 학업성취도 평균 분석에서도 우수수준과 보통수준은 변화가 거의 없는 반면에 최근에 실시된 TIMSS 2019에서는 수월수준은 상승하고 기초수준 이하는 하락하는 것을 볼 수 있다. 이것은 수학 학업성취도가 높은 학생들의 수가 늘어났고, 그들의 수학 학업성취도 역시 상승하는 반면에, 수학 학업성취도가 낮은 학생들의 수도 늘어났고, 그들의 수학 학업성취도는 하락하였음을 나타낸다.
또 우리나라 중학교 2학년 학생들의 학력 격차는 성별이나 학교가 소재하는 지역규모(대도시, 중소도시, 읍면지역)에 따라서도 나타났다. 성별 결과를 보면, 남학생은 수월수준의 비율이 여학생보다 높은 반면에 기초수준 이하의 비율도 높고, 수월수준의 학업성취도 평균 역시 여학생보다 높은 반면에 기초수준 이하의 학업성취도 평균은 여학생보다 낮게 나타났다. 이것은 중학교 2학년에서 수학 학업성취도가 높은 남학생이 여학생보다 많고 그들의 학업성취도 점수도 여학생에 비해 높으며, 동시에 수학 학업성취도가 낮은 남학생도 여학생보다 많고 그들의 학업성취도 평균 역시 여학생에 비해 낮다는 것을 나타낸다. 이러한 학력 격차는 학교가 소재하는 지역 규모에 따라서도 나타났다. 대도시의 경우 수월수준의 비율이 높고 기초수준 이하의 비율은 낮은 반면에, 읍면지역은 수월수준의 비율이 낮고 기초수준 이하의 비율이 높았다. 특히 기초수준 이하나 읍면지역 학생들의 학업성취가 다른 성취수준이나 다른 지역에 비해 떨어지는데 주목을 할 필요가 있다. 이들의 학력 격차는 성별이나 지역규모와 같은 학생들의 배경 변인, 내용 영역이나 인지 영역과 같은 수학 평가틀에 따라서도 차이가 나타나고 있다.
셋째, 평가 주기에 따라 차이는 있으나 내용 영역이나 인지 영역에 따라 학생들의 학업성취에 차이가 크게 나타났다. 내용 영역의 경우 대수나 기하 영역에 비해 수 영역과 자료와 확률 영역에 대한 학업성취도 평균의 변화가 크게 나타났고, 성취수준별로는 우수수준과 보통수준에 비해 수월수준과 기초수준 이하에서 학업성취도 평균의 변화가 크게 나타났다. 특히 수월수준에서는 다른 영역에 비해 대수 영역의 학업성취도 평균이 가장 높고, 자료와 확률 영역의 학업성취도 평균이 가장 낮게 나타난 반면에, 기초수준 이하에서는 대수 영역의 학업성취도 평균이 가장 낮고, 자료와 확률 영역의 학업성취도 평균이 대체로 높게 나타났다. 인지 영역의 경우 평가 주기에 따라 차이는 있으나 대체로 알기 영역의 학업성취도 평균이 가장 높고, 다음으로 적용하기 영역, 추론하기 영역의 순이었고, 성취수준별로는 내용 영역과 마찬가지로 우수수준과 보통수준에 비해 수월수준과 기초수준 이하에서 학업성취도 평균의 변화가 크게 나타났고, TIMSS 2019에서 수월수준은 세 영역 모두 학업성취도 평균이 상승하고 있는 반면에, 기초수준 이하에서는 세 영역 모두 학업성취도 평균이 하락하였다.
이러한 결과들은 수학과 교육과정을 포함해서 우리나라 수학교육에 직․간접적으로 영향을 미치고 있다. 예를 들어, 수학과 교육과정에서는 개정 시 TIMSS나 PISA와 같은 국제학업성취도 평가 결과를 토대로 다른 국가에 비해 우리나라 학생들의 학업성취가 낮아 개선이 필요한 교육 내용을 반영하고 있다. 2015 개정 교육과정에서 실생활 중심의 통계 내용 재구성이 그 예이다(박경미 외, 2015, pp.21-22).
한편 TIMSS와 PISA와 같은 국제학업성취도 평가 결과를 통해 우리나라 학생들의 학업성취 특성을 파악하는 후속 연구를 제안한다. 공개 문항 분석을 통해 앞서 제시한 <표 1>~<표 4>의 내용 영역 또는 인지 영역의 평가 주제에 대한 학생들의 학업성취 도달 정도를 분석하고, 이를 수학과 교육과정의 성취기준과 연계함으로써 개별 성취기준에 대한 우리나라 학생들의 학업성취 특성을 분석할 수 있을 것이다. 또한 우리나라 학생들의 학업성취 변화 추이에 영향을 미친 요인들(예를 들어, 학교에서의 수학교육, 수학과 교육과정, 수학교육 정책 등)을 분석하고 이러한 요인들이 학생들의 학업성취 변화에 어떠한 영향을 미쳤는지를 분석하는 연구를 제안한다. 본 연구의 결과를 포함해서 우리나라 학생들의 학업성취 변화 추이나 이에 영향을 미치는 요인 분석 등은 수학과 교육과정 개정이나 수학교육 정책 수립 시 기초 자료로 활용될 수 있을 것이다.