I. 서 론
최근 우리나라 교육 분야에서는 급변하는 미래 사회에 대비하기 위해 적극적으로 대응할 수 있는 핵심 역량과 기초 소양을 함양한 창의적 인재 육성을 강조하고 있다(교육부, 2022). 창의적 인재의 양성은 미래 국가 경쟁력을 높이기 위한 중요한 전략이며, 세계의 많은 나라에서 다양한 방식으로 미래 사회에 필요한 핵심 역량을 배양하기 위한 교육적 노력이 이루어지고 있다(김선희 외, 2015; 이상은, 2019; 전성균, 상경아, 2023; OECD, 2019). 경제협력개발기구인 OECD(Organization for Economic Cooperation and Development)에서 주관하는 국제학업성취도 평가인 PISA(Programme for International Student Assessment)는 미래 시민이 갖추어야 할 기본적인 소양을 평가하는 역량 중심의 평가로서 자리 잡고 있다. 특히 PISA 2022는 창의적 사고력을 평가 항목으로 포함하여, 학생들의 독창적이고 다양한 아이디어를 생성할 수 있는 능력을 평가하였다. 또한, 창의적 사고력이 학생의 성과, 태도, 국가 간의 차이, 학생 및 학교 특성 등 창의적 활동 참여와 창의적 사고의 참여 기회에 따라 어떠한 차이가 있는지, 학생 성과와는 어떻게 연관되어 있는지 밝히고자 하였다(OECD, 2024a). 2024년 9월에는 한국교육과정평가원의 주관으로 국제 학업성취도 평가에 기반한 미래 교육 방향을 탐색하기 위한 주제로 국제 세미나가 개최되었는데, 각 분야의 전문가들은 PISA 2022의 창의적 사고력 성취 수준이 우리나라의 경우 최상위를 차지하였다는 점에 주목하고 이에 대한 학술적 논의가 필요하다고 하였다(김현우 외, 2024).
창의적 사고는 창의성을 발휘하기 위한 인지적 능력과 아이디어 형성 과정을 포함하는 개념으로, 복합적이며 다양한 배경 변인과의 상호작용에 의해 영향을 받을 수 있는 다차원적 역량이다(한정아, 2023). 박성익과 유경훈(2010) 연구에서도 창의성은 복합적 요소들이 모여 발생하는 것으로 창의성의 이해는 통합적인 접근이 필요하며, 창의성은 창의적 사고력과 창의적 인성 등 동시에 고려해야 한다고 강조하였다. 이에 대해 기존 연구의 대부분은 이론에 근거한 변수를 선택하고 변수들 간의 관계를 설정한 구조방정식 모형이나 회귀분석과 같은 이론 기반의 전통적 통계분석 방법에 의존하고 있으며, 데이터 기반의 실증 분석은 부족한 실정이다(김동심, 2019; 김청자, 2011; 한정아, 2023). 특히 PISA 2022와 같은 대규모 패널자료는 학생의 성취뿐만 아니라 인지적, 정서적 특성을 분석하고, 장기적인 교육정책의 효과를 평가하여 효과적인 교육정책 수립을 위한 기초자료로 활용되어 왔다. PISA 2022에서 제공하는 많은 변수 간의 비선형 관계나 복잡한 상호작용을 반영하기 어려운 기존의 분석 방법의 한계를 극복하기 위해 데이터로부터 패턴을 학습하고 다양한 변수를 효과적으로 활용할 수 있는 머신러닝 기법이 대안이 될 수 있다(Breiman, 2001). 선행 연구에서도 머신러닝 기반의 분석이 변수 간의 복잡한 상호작용과 비선형성을 반영할 수 있어 전통적인 이론 기반의 분석 방법보다 예측정확도가 높다고 하였다(안도연, 이광호, 2022). 최근 사회과학 분야에서도 전통적인 통계분석 방법에 비해 예측력이 우수하고, 많은 변수를 한 번에 분석할 수 있는 머신러닝 기법 등을 적용해 예측 변수를 탐색하는 연구가 활발하게 진행되고 있다. 그러나 머신러닝 기법의 예측 성과는 분석 대상에 따라 다르며, 예측 변수의 수, 종속 변수에 의해 예측 정확도가 달라질 수 있다는 점은 머신러닝을 기법을 적용한 연구에서 중요한 특징이다. 즉, 예측 정확도에는 절대적인 기준이 없으므로 다양한 머신러닝 기법을 적용하여 우수한 기법을 평가하고 선택하는 것이 중요하다(박소영, 정혜원, 2020). 최근 머신러닝을 활용한 한정아(2023)의 연구에서는 창의적 사고의 예측 변인을 탐색하기 위해 랜덤 포레스트 기법을 적용하였다. 해당 연구는 한국교육개발원이 2013년 전국 초등학교 5학년을 대상으로 수집한 한국교육종단연구 2013(KELS 2013)의 6차 연도 자료를 활용하여, 당시 고등학교 1학년 학생이 응답한 데이터를 분석하였다. 연구 결과, 성취 동기, 자기 확신, 자아개념, 공동체성, 협동성, 진로 행동 등의 정의적 특성이 창의적 사고력의 주요 예측 요인으로 도출되었다. 그러나 이 연구에서 사용된 창의적 사고 측정 방법은 창의적 성향 평가에 초점을 맞추고 있으며, 학생의 자기 보고식 문항을 기반으로 분석이 이루어졌기에, 연구 결과가 학생의 주관적 인식, 자기 인식, 또는 사회적 기대에 영향을 받을 가능성이 있다는 한계가 있다.
이에, 본 연구에서는 미래 사회에서 요구되는 핵심 역량으로서 청소년의 창의적 사고력을 살펴보고, 이에 영향을 미치는 요인을 탐색하고자 한다. 이를 위해 가장 최신의 국제 학업성취도 평가 자료인 PISA 2022 데이터를 활용하고자 한다. PISA 2022 자료는 읽기, 수학, 과학 영역이 2023년 12월에, 창의적 사고력 영역이 2024년 6월에 공개되어 최근 교육 환경을 반영한 데이터를 포함하고 있다. 본 연구에서는 창의적 사고력을 예측하는 주요 요인을 탐색하기 위해 머신러닝 기법을 적용하고, 최적의 예측 모형을 비교하기 위해 자동 기계학습(AutoML, Automated Machine Learning) 기법을 활용하고자 한다(Karmaker et al., 2021). 최근 사회과학 분야에서는 다양한 머신러닝 알고리즘을 활용한 분석이 활발히 이루어지고 있으며, 특히 AutoML은 여러 알고리즘의 성능을 효율적으로 비교하는 방법으로 유용하게 활용되고 있다. 창의적 사고력은 독창적이고 효과적인 문제 해결 방안과 지식의 발전, 그리고 영향력 있는 상상력의 표현을 포함하는 다차원적 역량으로, 학생의 핵심 역량으로 주목받고 있다. 본 연구를 통해 청소년의 창의적 사고력에 영향을 미치는 주요 예측 변인을 실증적으로 규명하고, 교육 격차 해소 및 창의적 역량 증진을 위한 정책 수립에 기초자료를 제공하는데 목적이 있다. 본 연구의 구체적인 연구 문제는 다음과 같다.
연구 문제 1. 청소년의 창의적 사고력을 예측하기 위한 우수 예측 모형은 무엇인가?
연구 문제 2. 청소년의 창의적 사고력 주요 예측 요인은 무엇인가?
II. 선행연구 고찰
OECD(2024a)에서는 PISA 2022에서 혁신적 역량으로 창의적 사고력을 선정하여, 독창적이고 효과적인 문제해결 방안, 지식의 발전, 영향력이 있는 상상력의 표현으로써 아이디어의 생성, 평가, 개선 과정을 생산적으로 참여할 수 있는 다차원적 역량이라고 하였다. 또한, 창의적 사고력은 창의적 작업에 필요한 인지적 과정에 중점을 두고, 교육을 통해 이를 증대시키며 일상에서 입증할 수 있는 능력으로 정의하고 있다(김성경 외, 2024). 즉, 창의적 사고력은 새로운 아이디어를 도출하거나 문제를 창의적으로 해결하는 능력으로, 이는 문제해결 과정에서 필수적인 역량으로 작용하며, 학생이 학업에서뿐만 아니라 실제 생활에서 마주하는 문제를 해결하는 데 필요한 핵심역량이다. 기존의 창의성 검사가 개인의 창의적 잠재력이나 창의적 성향을 측정하는데 초점을 맞추고 있다면(강윤정, 이순묵, 2010), PISA 2022에서 평가한 창의적 사고력은 실제 상황에서 학생들이 창의적 사고를 어떻게 적용하고 발현하는지 평가하는데 중점을 두고 있다. 이를 위해 현실적 상황이나 문제 맥락에서 해결 방안을 평가하기 위해 시나리오 기반의 문제를 제시하고, 아이디어 생성, 평가, 개선의 과정을 모두 평가하고 있다(OECD, 2024a).
PISA 2022 결과에 따르면, 우리나라는 OECD 회원국 중 1~3위에 해당하고 전체 64개국을 기준으로도 2~4위로 높은 수준의 창의적 사고력 성취 수준을 보였다. 특히, 우리나라 학생들의 창의적 사고력 성취 결과는 학교 내에서의 학생 간 차이와 학교 간 차이가 모두 OECD 회원국 평균보다 낮았고, 경제, 사회, 문화적 배경과 부모의 직업, 교육 수준, 자산 수준 등이 미치는 영향력이 비교적 작다는 결과가 나타났다. 한편, 창의적 사고력 점수가 높은 나라들에서는 공통적으로 자아효능감 지수가 낮게 나타나는 경향성을 보여, 학생들의 창의적 사고력을 증진하기 위한 학습활동의 지원 뿐만 아니라, 학생들이 창의적 과제를 수행하는데 자신감을 갖도록 환경적 도움이 필요할 것으로 보았다(교육부, 2024). 이러한 결과는 OECD(2024a)의 보고서를 기반으로 OECD 회원국 평균을 기준으로 국가 간 수치적 비교를 한 결과이므로, 우리나라 학생들의 창의적 사고력에 영향을 미치는 주요 변인과 이에 대한 해석을 위한 면밀한 분석이 필요할 것이다.
일부 연구를 제외하고, 청소년을 대상으로 창의적 사고력을 살펴본 연구는 우리나라 교육제도와 학습 분위기상 많지 않았다(김청자, 2011; 한정아, 2023). 실제로 학교급별 창의성 교육에 대한 평가 결과, 초등학교에 비해 중, 고등학교의 창의성 교육에 대한 지원이 상대적으로 취약하고, 학부모의 창의성 교육에 대한 강조도 학교급이 높아질수록 크게 낮아지며, 학교에서의 교수학습 방법 측면에서도 창의성 기법의 활용도가 낮아지는 것으로 평가하였는데, 입시 교육이 강조되고 있는 특징이 반영된 결과로 보았다(김순남, 이병환, 2004). 그러나 최근에는 입시에도 교과 활동 외에 비교과 활동이 강조되며 다양한 활동이 이루어지고 있어 창의성에 대한 인식이나 교육적 효과 등을 재평가할 필요가 있다. 이러한 맥락에서 PISA 2022의 창의적 사고력 평가 결과, 우리나라 청소년의 성취 수준이 매우 우수한 성과를 보였고 학교 간, 학생 간 성취 격차도 크지 않는 점으로 미루어보아 국내 교육환경이 창의적 사고력 향상에 중요한 영향을 미치고 있는 것으로 판단할 수 있으며, 교육적 성과 분석과 정책적 시사점을 도출하기 위한 정밀한 분석을 시도할 필요가 있다.
박성익과 유경훈(2010) 연구에서도 나타난 바와 같이, 창의적 사고력은 단일한 인지 능력으로 설명되기 어려운 복잡한 다차원적 개념이다. 이러한 특성을 고려하여 창의적 사고력에 영향을 미치는 주요 변수를 살펴보면, 먼저 인지 및 동기 요인과 관련하여, 학습 및 시험문제에 대한 태도, 성취동기, 그릿(Grit)이 창의적 사고력과 창의성에 영향을 미친다고 보고되었으며, 따라서 창의적 사고력을 증진하기 위해서는 학생들의 학습 동기 요인도 함께 교육을 병행해야 한다고 하였다(김동심, 2019; 한정아, 2023; Jaenudin, 2023). 또한, 정서적 특성 또한 창의적 사고력에 영향을 미치는 요인으로 나타났다. 감정이입과 같은 정서 지능은 창의성과 정적 상관이 있다고 하였고(김양은, 양미선, 2008), 학업 동기 부여와 긍정적 정서는 성취 수준 향상을 위해 중요하다고 하였다(강민선, 김영춘, 2022). 이는 창의적 사고가 단순한 아이디어 발산이 아닌, 복잡한 문제 상황에서의 아이디어 생성, 평가, 개선의 과정에서 인내와 집중을 필요로 하는 사고 과정이며, 정서적 요인이 중요한 심리적 기반이 될 수 있음을 시사한다.
가정 환경 역시 창의적 사고력 형성에 주요한 배경 변수로 작용할 수 있는 것으로 나타났다. 월평균 사교육비, 가정의 교육환경 및 독서 환경이 창의성과 창의적 인성의 하위 요소들에 유의한 정적 상관관계가 있다고 하였다(김명숙 외, 2002; 신윤범, 2023; 이태상, 2011). 또한, 부모의 긍정적 양육 태도가 창의성과 논리적 사고력에 긍정적 영향을 미칠 수 있다고 하였고(이현주 외, 2014), 고등학생을 대상으로 한 연구에서도 지적 자극과 지지, 격려를 해주는 가정의 분위기 등 정서적 가정 환경 변인이 창의적 사고력과 성취동기에 유의한 영향을 미치는 것으로 나타났다(김청자, 2011).
학교 교육이나 학습 경험과 관련해서는, 다양한 학습활동과 학교 수업이 창의적 사고력의 하위 범주 중 호기심이나 모험심, 탐구심에 영향을 미칠 수 있다고 하였으며(한정아, 2023), 방과 후 활동 또한 창의적 사고에 영향을 미치는 것으로 나타났다(김재령, 2020; Jaenudin, 2023). 다음으로 ICT를 활용한 수업이 새로운 정보 창출 과정에 직접 참여하도록 함으로써 학습자의 창의력과 문제 해결력을 신장시킬 수 있는 중요한 학습 방법이라고 하였다(나성태, 2003). 다만, ICT 활용 방식에 따라 학업 성취에 긍정적 또는 부정적 영향을 줄 수 있다는 점에서 질적 활용 방안이 중요하다는 선행 연구 결과도 찾아 볼 수 있었다(김혜숙, 2012). 이처럼 창의적 사고력은 다양한 교육 맥락 변인과 깊은 관련이 있으며, 각 변인은 창의적 사고력이 발현되는 아이디어 생성, 평가, 개선의 과정에서 창의적 사고력의 하위 요인에 영향을 미치는 등 다양한 방식으로 영향을 줄 수 있을 것으로 예상된다. 그러나 기존의 선행 연구들은 변인 간의 관계를 분석하는데 연구자의 관심 변인에 국한되거나, 알고리즘 사고와 창의적 문제해결 과정을 예측하는데 자기 보고식 응답에 의한 설문 결과 데이터를 활용하였다는 점에서 자기 인식, 사회적 기대에 의존한 결과를 도출할 수 있고, 복잡한 변인 간의 관계를 실증적으로 분석하는데 한계가 있다. 따라서 본 연구에서는 창의적 사고력에 대해 변수 간의 구조적 관계보다는 실제 예측 가능성과 변수 간 상대적 영향력을 실증적으로 검토할 필요가 있다.
학생의 인지적 요인에 영향을 미칠 수 있는 변인을 탐색하는 것은 교육 격차 문제를 해소하기 위한 기초 연구가 될 수 있고, 학생의 핵심역량 증진을 도모하는데 단초가 될 수 있는 중요한 연구라고 할 수 있다(최진수, 정혜원, 2022). 최근에는 방대한 양의 데이터를 분석할 수 있는 연구 기법들이 개발되고, 예측 성능이 우수한 연구모형을 적용할 수 있도록 다양한 머신러닝 기법을 사회과학 분야에 적용하고 있으며, 학생의 인지적 요인, 핵심 역량 등에 영향을 미치는 변인을 탐색하기 위해 머신러닝 기법을 사용하는 연구 사례가 많이 등장하고 있다.
최근에 주목받고 있는 AutoML(Automated machine learning)은 자동 기계 학습 기법으로 머신러닝의 주요 분석 작업인 모형 개발, 하이퍼파라미터 튜닝, 검증 과정 등을 자동화하는 연구 기법으로 사람의 개입을 최소화하고 실행 시간을 단축하여 효율성을 높일 수 있는 일반적인 과학 작업을 수행할 수 있는 자동화 시스템이다(문용혁 외, 2019; Karmaker et al., 2021). AutoML 방법을 적용하는데 가장 널리 활용되는 OSS(Open Source Software) 방식은 무료로 제공되는 소프트웨어를 통해 적용하는 방법으로, Python, R 등 각 프로그래밍 환경에 라이브러리 형태로 내장되어 있어 무료로 활용할 수 있다는 장점이 있고, 많은 개발자들이 연구에 참여해 최신 머신러닝 연구의 흐름을 반영할 수 있다는데 장점이 있다(Xin et al., 2021).
사회과학 분야에서 머신러닝을 활용한 최근 연구들을 살펴보면, 학업성취도 예측 모형을 개발하기 위한 랜덤 포레스트 기법을 활용하거나(안도연, 이광호, 2022; 정혜원 외, 2021; 2022), 기초학력 미달 학생 예측연구를 위해 심층 인공 신경망 모형을 활용한 연구도 찾아볼 수 있었다(홍유정, 2022). 머신러닝을 활용한 예측 변인 탐색 연구는 패널자료에 포함된 다양한 변수를 동시에 비교하여 예측 변수의 영향력을 확인할 수 있어 상대적인 중요도를 비교하고, 새로운 예측 변수를 탐색하는데 유용하다는 장점이 있다. 기존의 전통적인 통계 기법을 적용하는 방식은 연구자가 설정한 변인과 모형에 따라 연구 결과가 제한적일 수 있다는 점에서 한계가 있다. 이에 본 연구에서는 청소년의 창의적 사고력을 예측하는 요인을 탐색하기 위해 데이터 기반의 AutoML을 활용하되, 다양한 개인, 가정, 학교 수준의 변인에 대해 선행연구 분석을 통해 이론에 기반한 접근을 병행하고자 하였다.
III. 연구 방법
본 연구에서는 청소년의 창의적 사고력과 문제 풀이 행동을 파악하기 위하여 PISA 2022에 참여한 학생들의 응답을 활용하였다. 우리나라의 경우 PISA 2022에 응답한 만 15세 피험자는 <표 1>과 같이 총 6,454명이었고, 중학교의 경우 2016년도부터 모든 중학교에서 자유학기제를 도입하여 시행하는 등 중학교와 고등학교의 교육과정 및 학교 환경에서 크게 차이가 있을 것으로 판단하여, 분석 대상은 중학생 337명을 제외한 총 6,117명으로 선정하였다. 고등학교 1학년 학생은 총 6,113명(94.72%), 고등학교 2학년 학생은 4명(0.06%)이었다. 이 중에서 남학생은 3,122명(48.48%), 여학생은 2,995명(51.52%)이었다.
본 연구에서는 우리나라 청소년의 창의적 사고력(creative thinking)에 영향을 미치는 요인을 탐색하기 위해 ISA 2022에서 창의적 사고력 측정 결과를 반응 변수로 설정하였다. PISA 2022에서 성취도 점수는 학생이 취득한 점수에 대해 개별 학생당 10개의 측정 유의 값(Plausible Value, PV)을 부여한 값으로 제공하고 있다. PISA에서는 10개 유의 값의 평균을 사용하는 경우 발생할 수 있는 과적합 등의 문제로 평균 활용을 지양하고 있다(OECD, 2009). 이에 따라 본 연구에서는 K-fold 교차검증을 통해 예측 모형의 성능을 검증하고, 안정적인 결과를 도출하기 위해 첫 번째 유의 값인 PV1을 종속 변수로 활용하였다(김민정, 유진은, 2022; 최진수, 정혜원, 2022).
OECD(2024b)에서 설명하는 창의적 사고력 평가 방식을 살펴보면, 1단계에서 응답이 적절한지 여부를 판단하고, 적절하지 않은 경우에는 점수를 부여하지 않는다(no credit). 2단계에서 주어진 채점 가이드에 대해 응답이 창의적인 경우에는 전체 점수(full credit)를 부여하고, 일부만 창의적인 경우에는 부분 점수(particial credit), 응답이 창의적이지 않으면 점수를 부여하지 않는다(no credit). 즉, 창의적 사고력 영역에서 평가 결과는 단순히 정답의 여부와는 관계없이 응답의 독창성이 주된 평가 항목임을 알 수 있다.
PISA 2022 결과보고서에 따르면 창의적 사고력 성취에서 학생 간 성취 수준 차이에 의한 학교 내 분산 비율이 68%로 OECD 평균인 74%보다 낮은 것으로 나타났고, 학교 간 분산 비율도 17%로 OECD 평균인 26%보다 매우 낮은 것으로 나타났다(교육부, 2024). 따라서, 본 연구에서는 학생의 창의적 사고력 성취에서 학생의 개인 특징과 문제해결 과정을 심층적으로 분석하고자 하였다. 이를 위해 PISA 2022에서 제공하고 있는 교육 맥락 변인들을 토대로, 학생을 대상으로 실시한 설문 자료를 영역별로 구분하여 분석에 활용하였다. 문항은 <표 2>와 같이 개인 배경 변인(18개), 가정 환경(44개), 정서 변인(13개), 수학 관련 변인(25개), 학교 관련 변인(36개), 교외 활동(18개), ICT 관련 변인(19개), 코로나19 관련 질문(11개) 영역으로 구분하였고, 총 변수의 개수는 184개였다.
PISA 2022에서 기존의 데이터를 바탕으로 변수를 생성한 파생 변수(derived variable)를 제시하는 경우에는 파생 변수를 우선 사용하였다. 이때 파생 변수는 기존 설문 문항을 변환 또는 스케일링(scaling)하여 만든 변인으로, PISA에는 하나 이상의 문항에 대해 표준화된 가중 우도 추정법(Weighted Likelihood Estimates, WLE)을 활용한 산술적 변환 또는 재코딩, 문항 반응 이론(Item Response Theory)에 기반한 스케일링 등의 방법으로 파생 변수를 생성하고 있다(OECD, 2024a; Warm, 1989). 그 외에 개별 문항 또는 하위 문항의 평균을 산출하여 사용하였다.
AutoML은 기계학습을 데이터에 적용하는 프로세스를 자동화한 연구 기법이다. AutoML은 기존의 다양한 머신러닝 청소년들 개발과 성능을 비교하고 최적의 청소년을 도출하는 과정을 자동화하여 수행하는 연구 방법이며, 시간을 단축하고 효율성을 높일 수 있다는 장점이 있다(문용혁 외, 2019). 본 연구에서는 AutoML 기법을 활용하여 여러 머신러닝 알고리즘 중 회귀분석 청소년을 생성하고 성능을 비교하여, 최종 청소년을 선택할 수 있다. 모든 분석 과정에는 Python 3.11을 클라우드 기반의 Jupyter Notebook 환경에서 사용하였고, AutoML을 수행하기 위해 PyCaret(ver 3.3.2) 패키지(PyCaret, 2024)를 사용하였다. PyCaret은 머신러닝의 자동화 학습이 가능하도록 하는 Python 기반의 오픈 소스로 Scikit-Learn, LightGBM, CatBoost 등 여러 머신러닝 라이브러리를 지원하고 있어 AutoML에 많이 활용되고 있다.
일반적으로 머신러닝에서는 평가 데이터와 학습 데이터를 구분하여 모형의 성능을 평가하고 일반화 성능을 확인할 수 있다. 평가 데이터는 모형의 일반화 정도를 평가하고 학습 데이터는 실제 알고리즘 생성을 위해 사용된다. 전체 데이터 중 무작위로 학습 데이터와 평가 데이터를 분할하여 독립적이면서도 동일한 확률분포를 따르게 한다(Dangeti, 2017). 본 연구에서 학습 데이터와 평가 데이터는 7:3으로 구분하였다. 모형을 활용할 때는 최적의 하이퍼파라미터를 찾기 위해 그리드 검색과 K-fold 교차검증을 활용하여 청소년의 성능을 향상시키고 일반화 정도를 높일 수 있다(Geron, 2019). 본 연구에서는 하이퍼파라미터 값을 격자(grid)로 정의하고 모든 격자들의 위치를 검색하는 그리드 검색을 통해 최적의 예측 성능을 보이는 파라미터들의 조합을 도출하고자 하였다. K-fold 교차검증은 학습 데이터를 다시 k개의 fold(겹)로 나누어 k-1개는 학습데이터에서 학습 용도로 사용하고 나머지 1개는 학습 데이터에서 평가 용도로 사용하여, 총 k개의 fold에서 나타나는 오차값을 바탕으로 최적화된 모형을 찾는 검증 방법이다(Geron, 2019). 본 연구에서는 10-fold 교차 검증을 활용하였고, 하이퍼파라미터 튜닝에 사용된 조건(Microsoft, 2025)과 이를 통해 도출된 최적의 하이퍼파라미터 조합은 <표 3>과 같다. 이를 통해 추정된 모형을 평가 데이터에 적용하여 예측 모형의 성능을 다양한 평가 지수(MSE, RMSE, R2, MAE, MAPE)를 기반으로 비교하였다.
주요 예측 변인을 선별하기 위해서 SHAP(SHapley Addictive exPlanations) 중요도 지수를 활용하였다. SHAP 알고리즘을 통해 얻은 Shapley value는 변인들의 조합을 구성하여 해당 변인에 따른 평균적인 변화를 의미하는 것으로 개별 변수의 Shapley value 절댓값의 평균에 해당하는 SHAP 지수를 활용하여 변수의 평균적인 영향력의 정도를 비교할 수 있다(장은아, 정혜원, 2023; 한정아, 2023). SHAP 지수는 개별 변수의 독립적인 영향과 변수 간 상호작용을 종합적으로 고려하여 계산된다는 특징이 있다. 변수 간 상호작용을 고려하지 않는 경우 각 변수의 영향력이 과대 평가될 수 있는데, SHAP 지수는 이러한 문제를 완화시키고(서지범, 강남화, 2023), 변수 중요도의 일관성을 높일 수 있다는 장점이 있다(한정아, 2023). 영향의 방향성 정보 등을 다각적으로 살펴보고 해석하고자 이를 시각화한 자료인 SHAP 중요도 도표, 요약 도표와 SHAP 의존성 도표 등을 함께 제시하였다. 선행 연구에 따르면 정확한 변수 간의 관계를 파악하기 위해서는 SHAP 중요도 지수 및 도표 뿐만 아니라 Shapley value에 대한 분산을 제공하는 SHAP 의존성 도표 등을 함께 살펴보아야 한다고 하였다(장은아, 정혜원, 2023; Molnar, 2021). SHAP 요약 도표는 변수의 중요도와 변수의 특성 효과를 함께 시각화한 도표로 예측에 미치는 영향 정도를 파악할 수 있고(Molnar, 2021), SHAP 의존성 도표는 산점도의 형태로 개별 Shapley value 분포를 제공하여, 예측값에 대한 증감 경향성을 파악할 수 있다는 장점이 있다(김진희, 김준엽, 2022).
IV. 연구 결과
PISA 2022에서 성취 수준을 proficiency scales로 나타내었으며, 점수 구간에 따라 등급을 부여하였다. 전체 청소년 응답자의 성취 수준을 살펴본 결과는 <표 4>와 같다. 성취 수준은 다시 level에 따라 5수준 이상을 상위수준 집단(top performers), 2수준 미만을 하위 수준 집단(low achievers)으로 구분하여 결과 분석에 활용하고 있다(OECD, 2023a; 2023b; 2024a; 2024b).
연구 대상의 성취 수준은 다음의 <표 5>와 같다. 청소년의 창의적 사고력은 상위 수준에 해당하는 학생은 2,972명(48.59%)으로 가장 많았고, 그 다음으로 중위권에 2,705명(44.22%), 하위권에 440명(7.19%)인 것으로 확인되었다. 이러한 결과로 미루어보아 우리나라 청소년은 다른 영역(수학-24.37%, 읽기-11.66%, 과학-15.07%)과 비교하여, 창의적 사고력 영역에서 우수한 상위권 학생들이 많은 비율(48.59%)로 분포되어 있는 것을 알 수 있었다.
청소년의 창의적 사고력을 예측하기 위해 머신러닝 알고리즘으로 회귀 모형의 성능을 평가한 결과를 확인하였다. 학습 데이터를 활용하여 적합한 수준의 성능을 확인한 상위 10개의 머신러닝 청소년을 확인한 결과는 다음의 <표 6>과 같다. 결정계수 R2를 기준으로 Light Gradient Boosting Machine(0.3833)이 가장 우수하였고, 다음으로 Gradient Boosting Regressor(0.3731), Bayesian Ridge(0.3582)의 설명력이 높은 것으로 나타났다. RMSE를 기준으로도 Light Gradient Boosting Machine(7.7746)이 우수하였고, 다음으로 Gradient Boosting Regressor(7.8401), Bayesian Ridge(7.9347) 순으로 예측오차가 작은 것으로 나타났다. 본 연구에서는 그 외에도 여러 평가 영역에서 가장 우수한 성능을 보인 LightGBM을 최종 모형으로 채택하였다.
가장 우수한 적합도를 보인 Light Gradient Boosting Machine(이하 LightGBM) 청소년의 잔차와 예측 오차를 각각 시각화한 결과는 다음의 [그림 1], [그림 2]와 같다. 먼저 잔차는 실제값과 청소년이 예측한 값 간의 차이를 나타내는 것으로 위 그래프에서 파란색(진한) 점은 학습 데이터(train data)의 잔차를 나타내고, 초록색(연한) 점은 평가 데이터(test data)에 대한 잔차와 같다.
[그림 1]에서 학습 데이터의 결정계수(R2)가 .861로 높은 설명력을 보이지만, 평가 데이터의 결정계수가 .384로 크게 차이가 나면서 일반화 성능이 낮은 것으로 판단된다. 이는 청소년의 예측 성능이 좋지 않은 것으로 과적합(over fitting)된 결과로 해석할 수 있다. 결정계수의 기준은 주로 Cohen(1988)이 제시한 기준을 따르곤 하는데, 사회과학 분야의 회귀분석에서 0.26 이상이면 높은 수준의 설명력으로 평가된다. 다른 연구에서도 변수 간의 관계 분석에 목적이 있는 사회과학 분야에서는 조건에 따라 0.1 이상이면 수용 가능하다고 하였다(Ozili, 2022). 즉, 사회과학적 연구 맥락에서는 비교적 높은 수준의 설명력을 유지하는 것으로 해석할 수 있다. [그림 2]의 예측오차를 나타내는 그래프에서 점들은 예측값과 실제값을 나타내고, 진한 검은색 선은 예측값과 실제값 간의 최적의 적합선, 회색 점선은 예측값과 실제값의 이상적인 적합선을 의미하는 것으로 예측값과 실제값의 차이가 적을수록 이상적인 적합선에 일치하도록 데이터가 분포된다. 청소년의 성능이 좋지 않음에 따라 이상적 적합선에서 데이터가 많이 벗어난 것을 확인할 수 있다. 이러한 평가 지수를 기준으로 우수한 머신러닝 알고리즘 청소년을 활용하여 최종적으로 하이퍼파라미터 결정을 위한 그리드 검색과 10-fold 교차검증을 실시하여 청소년을 최적화하고자 하였다. 최적화한 청소년의 적합도는 다음의 <표 7>과 같다. 가장 우수한 예측 모형으로 나타난 LightGBM은 결정계수 R2를 기준으로 최적화 이전에는 0.41에서 최적화 이후 0.40으로 큰 차이가 나타나지 않았다. RMSE를 기준으로도 7.58에서 최적화 이후 7.66으로 큰 차이가 나타나지 않았으며, 오히려 예측 오차가 다소 증가한 결과로 나타났다.
Light Gradient Boosting Machine | MSE | RMSE | R2 | MAE | MAPE |
---|---|---|---|---|---|
최적화 이전 | 57.53 | 7.58 | 0.41 | 6.07 | 19.47 |
최적화 이후 | 58.47 | 7.66 | 0.40 | 6.15 | 19.47 |
최적화 후 모형의 잔차와 예측 오차를 각각 시각화한 결과를 함께 살펴보았다. [그림 3]에서 잔차 그래프를 살펴보면, 평가 데이터의 설명력이 .594로 학습데이터의 설명력인 .404보다 높다. 최적화 이전과 비교하여 성능이 다소 감소한 것처럼 보이지만, 평가 데이터와 학습 데이터 간의 결정계수 차이가 감소하면서 예측 결과에 대한 일반화 가능성을 오히려 개선된 것을 알 수 있다. 마찬가지로 세로축이 표준화된 잔차의 값, 가로축은 반응변수의 값으로, 최적화 이전의 모형에서 보다 그래프에서 잔차가 무작위로 흩어져 나타나 오차항의 등분산성이 위배되지 않았다고 볼 수 있다. 또한, 잔차가 비교적 고르게 분포하고 전반적으로 학습 데이터와 평가 데이터가 유사한 분포와 비슷한 성능을 보이는 것으로 과적합 없이 좋은 일반화 성능을 가지는 것으로 보인다. [그림 4]의 예측 오차 그래프에서도 이상적 적합선과 최적의 적합선의 차이가 다소 감소한 모습이다. 한편, 앞서 나타난 <표 7>의 결정계수와 다음 [그림 1]과 [그림 3]에서 나타난 결정계수가 서로 다르게 나타났는데, 표에서는 여러 변의 교차 검증을 통해 계산된 평균 성능이지만, 그림으로 시각화한 청소년의 잔차는 특정 데이터 세트의 데이터를 나타낸 것으로 데이터 분할에 따라 결정계수 값이 다를 수 있다.
본 연구에서는 AutoML 분석을 통해 가장 우수한 예측 모형인 것으로 나타난 LightGBM을 활용하여, 청소년의 창의적 사고력을 예측하는데 영향을 미치는 중요 변인을 탐색하였다. 투입된 예측 변수 중 청소년의 창의적 사고력에 영향을 주는 주요 변인이 무엇인지 살펴보기 위하여 예측 변수의 중요도를 산출하였다. 주요 설명 변인을 제시하는데 있어 머신러닝 기법을 적용한 선행 연구에서는 주로 중요도 지수를 기준으로 상위 20위의 변인을 주요 변인으로 제시하거나(정성경, 박환보, 2024), 전체 투입된 변수 대비 10% 내외로 선정하고 있음을 참고하여(한정아, 2023), 창의적 사고력을 예측하는 주요 변인은 전체 대비 약 10%에 해당하는 상위 20개 변인을 추출하였다. 중요도 지수 분석 결과는 다음의 <표 8>과 같다. 창의적 사고력에 영향을 미치는 주요 예측 요인은 수학 관련 요인으로 ‘일주일 수학 수업 횟수’, ‘수학 개념 친숙도’, ‘수학 자기효능감: 형식적 수학과 응용 수학’, ‘수학 인지 활성화: 수학적 사고 함양’, ‘직업에서 수학의 유용성’, ‘수학 불안’ 6개 요인이 나타났고, ICT와 관련해서는 ‘수업 이외의 주제와 관련된 ICT 사용’, ‘부적절한 온라인 콘텐츠와 사이버 폭력에 노출되었을 때 반응’, ‘ICT를 활용한 학습지원’, ‘ICT를 활용한 교내 활동’, ‘컴퓨터 프로그래밍에 대한 흥미’ 5개 요인이 나타났다. 개인 요인은 ‘목표 학력’과 ‘미래 직업 정보 탐색’, ‘초등학교 입학 시점’, ‘나이’의 4개 요인이 있었고, 가정 변인으로 ‘가정의 보유 자산’, ‘가족의 지원’ 2개 요인, 정서와 관련해서는 ‘호기심’, ‘공감’, ‘삶에 대한 만족도’의 3개 요인이 나타났다. 이를 토대로 창의적 사고력의 주요 예측 요인은 수학 및 ICT 관련한 요인이 다수 등장한 것을 확인할 수 있었다.
중요도를 시각화한 결과인 SHAP 중요도 도표(feature importance plot)는 [그림 5]와 같다. SHAP 중요도 도표는 각 변수의 평균적인 영향력을 나타내는 것으로 막대의 길이가 길수록 예측 영향력이 크고 중요도가 높은 변수라고 판단한다(한정아, 2023). ‘일주일 수학 수업 횟수(0.8154)’가 가장 중요도 지수가 높은 것으로 나타났으며, 그 다음으로 ‘수학 개념 친숙도(0.7633)’, ‘수업 이외의 주제와 관련된 ICT 사용(0.6683)’, ‘수학 자기효능감: 형식적 수학과 응용 수학(0.6290)’, ‘목표 학력(0.6089)’의 순으로 변수의 영향력이 큰 것으로 나타났다.
SHAP 요약 도표(summary plot)는 [그림 6]과 같다. 이는 주요 예측 변인의 수준에 따른 Shapley value의 분산을 통해서 관심있는 종속변인인 창의적 사고력에 각 변인들이 어떠한 관계를 보이는지 확인할 수 있는 정보를 제공한다. X축은 Shapley value, Y축은 예측 변인이며, 특성의 중요도 순위에 따라 정렬하였다. 각 관측치는 빨간색일수록 높은 값을 파란색일수록 낮은 값을 의미한다. 만약 X축의 오른쪽 방향으로 빨간색이 나타나는 경우, 해당 변인이 창의적 사고력에 정적인 영향, 왼쪽 방향으로 빨간색이 나타나는 경우에는 해당 변인이 창의적 사고력에 부적인 영향을 미치는 것으로 해석할 수 있다. [그림 6]의 요약 도표를 살펴보면, 각 변인의 창의적 사고력에 대한 방향성과 영향력을 시각적으로 확인할 수 있다. 그 중에서 ‘일주일 수학 수업 횟수’, ‘수학 개념 친숙도’, ‘목표 학력’, ‘가정의 보유 자산’, ‘ICT를 활용한 교내 활동’, ‘미래 직업 정보 탐색’의 변인이 Shapley value의 색상 대비가 빨간색(진할수록 High)과 파란색(옅을수록 Low)으로 분명히 나타난 것을 확인할 수 있다. 대부분의 변인들은 응답 수준이 높을수록 창의적 사고력에 대한 X축의 Shapley value가 오른쪽 방향으로 빨간색이 두드러지는 정적인 관계에 있다. 한편, ‘목표 학력’의 경우에는 창의적 사고력에 대한 Shapley value의 방향이 왼쪽 방향으로 빨간색이 드러나 부적인 관계인 것으로 나타났다.
SHAP 의존성 도표(dependence plot)는 [그림 7]과 같다. SHAP 의존성 도표는 X축은 각 변인별 응답한 값이고 Y축은 Shapley value로 모든 관측치에 대해서 산점도 형태로 시각화하여 종속변인에 대한 예측 변인과의 관계를 구체적인 형태로 살펴볼 수 있다(남나라, 2021; 장은아, 정혜원, 2023; Lundberg 외, 2020; Molnar, 2021). [그림 7]의 SHAP 의존성 도표를 살펴보면 ‘목표 학력’의 경우, ISCED 코드로 응답하였으며 응답 결과가 344(상급 중등교육-일반 교육)와 354(상급 중등 교육-직업교육) 두 가지 유형으로 나타났는데, 목표 학력이 특정 직업 기술 및 실무 능력과 관련이 있는 직업교육 분야 대학인 학생의 경우 창의적 사고력에 대한 Shapley value가 음의 값을 갖는 부적인 관계에 있는 것으로 볼 수 있다.
[그림 8]의 결정 도표(dependence plot)는 개별 데이터가 예측 모형에 어떻게 기여하는지를 시각화한 결과로, 회색 수직 선은 예측 모형의 기본 값, 꺾은 선은 예측 값, 괄호 안에 써진 숫자는 개별 데이터의 변수 값을 의미한다. 그래프의 하단에서 시작하여 SHAP value가 기준값에 어떻게 누적되어 그래프 상단의 최종 점수에 도달하는지의 정보를 제공한다(Gilbert, 2019). [그림 8]에서는 개별 데이터로 창의적 사고력이 39.13에 해당하는 피험자의 창의적 사고력 예측값이 변화하는데 주요 예측 변인의 종합적인 영향을 확인할 수 있었다.
[그림 9]의 Force bar는 개별 청소년의 창의적 사고력을 결정하는데 설명 변인들의 기여도를 확인할 수 있는 도표로서 Global bar나 Dependence plot와 함께 상호 보완적인 해석이 가능하다(정성경, 박환보, 2024). 왼쪽의 빨간색 화살표는 예측값을 더욱 높이는 효과(higher)로 정적 관계의 변수를, 오른쪽의 파란색 화살표는 예측값을 낮추는 효과(lower)로 부적 관계의 변수를 의미한다. 즉, 수학 자기효능감은 창의적 사고력을 높이는 예측 요인이며, 삶에 대한 만족도, 수업 이외의 주제와 관련된 ICT 사용, 스트레스 저항력은 창의적 사고력을 낮추는 요인으로 나타났다. 이는 위에서 나타난 종합 결과와 일정 부분 일치하는 것으로 나타났다.
V. 결론 및 논의
본 연구에서는 창의적 사고력을 예측하는 청소년의 성능을 비교하기 위하여 AutoML 방법을 사용하였다. 이를 위해 PISA 2022에서 학생이 응답한 학생 개인, 가정, 학교 관련 변인을 예측 변수로 활용하였고, 반응 변수는 창의적 사고력 점수를 사용하였다. 예측 모형은 AutoML을 활용하여 여러 청소년의 성능을 비교하여 적합도가 우수한 청소년을 선정하였고, 이를 하이퍼파라미터 최적화 과정을 거쳐 청소년의 성능을 확인하였다. 본 연구의 결과는 다음과 같다.
첫째, 청소년의 창의적 사고력을 예측하기 위해 머신러닝 알고리즘으로 회귀 청소년들의 성능을 평가한 결과를 확인하였고, 그 결과 LightGBM이 가장 우수한 것으로 나타났다. 머신러닝 기법의 예측 성과는 분석 대상, 변수의 수에 따라 달라질 수 있기 때문에 선행 연구에서도 다양한 머신러닝 기법을 적용하여 우수한 기법을 평가하고 선택하는 것이 중요하다고 하였다(박소영, 정혜원, 2020). 본 연구에서는 AutoML 기법을 활용하여 회귀 청소년의 성능을 평가하였고, 우수한 머신러닝 알고리즘 청소년을 활용하여 최종적으로 하이퍼파라미터 결정을 위한 그리드 검색과 10-fold 교차검증을 실시하여 청소년을 최적화하고자 하였다. 그 결과, 최적화 이전과 이후 청소년의 평가 지수 상 큰 차이가 나타나지는 않았으나, 평가 데이터와 학습데이터 간의 결정계수 차이가 감소하면서 예측 결과에 대한 일반화 가능성이 개선되었다.
둘째, 창의적 사고력에 영향을 미치는 주요 예측 요인으로 상위 20개를 선별한 결과, 수학 관련 요인으로 ‘일주일 수학 수업 횟수’, ‘수학 개념 친숙도’, ‘수학 자기효능감: 형식적 수학과 응용 수학’, ‘수학 인지 활성화: 수학적 사고 함양’, ‘직업에서 수학의 유용성’, ‘수학 불안’ 6개 요인이 나타났고, ICT와 관련해서는 ‘수업 이외의 주제와 관련된 ICT 사용’, ‘부적절한 온라인 콘텐츠와 사이버 폭력에 노출되었을 때 반응’, ‘ICT를 활용한 학습지원’, ‘ICT를 활용한 교내 활동’, ‘컴퓨터 프로그래밍에 대한 흥미’ 5개 요인이 나타났다. 주요 예측 변인으로 수학 및 ICT 관련 요인이 다수 나타난 것은 수학 및 정보 관련 요인이 창의적 사고력과 인지, 정서적 으로 밀접한 관련이 있음을 시사한다. 선행 연구에서도 ICT 요인은 읽기, 수학 및 과학 성취의 인지적 요인에 주요 예측 변인으로 나타난 바 있다(정혜원, 박소영, 2022).
개인 특성 관련 요인은 ‘목표 학력’과 ‘미래 직업 정보 탐색’, ‘초등학교 입학 시점’, ‘나이’의 4개 요인이 있었고, 가정 변인으로 ‘가정의 보유 자산’, ‘가족의 지원’ 2개 요인, 정서와 관련해서는 ‘호기심’, ‘공감’, ‘삶에 대한 만족도’의 3개 요인이 나타났다. 사회경제적 지위와 같은 가정 환경 변인과 이에 대한 학생의 정서적 요인, 다양한 학습활동이 창의적 사고력에 유의한 영향을 미친다는 것은 선행 연구와의 결과와도 맥락을 같이 한다(김명숙 외, 2002; 김양은, 양미선, 2008; 김재령, 2020; 김청자, 2011; 이태상, 2011; 한정아, 2023). 다만, 이러한 선행 연구에서는 주요 예측 변인 탐색에서 그치고 변수의 평균적인 영향력의 정도를 비교하거나 변인 간의 정확한 관계를 파악하는데 다소 한계가 있었다.
셋째, 변인 간의 관계를 파악하기 위해 SHAP 중요도 지수를 비교한 결과, ‘일주일 수학 수업 횟수’가 가장 중요도 지수가 높은 것으로 나타났으며, 그 다음으로 ‘수학 개념 친숙도’, ‘수업 이외의 주제와 관련된 ICT 사용’, ‘수학 자기효능감: 형식적 수학과 응용 수학’, ‘목표 학력’의 순으로 변수의 영향력이 큰 것으로 나타났다. SHAP 의존성 도표를 분석한 결과, 대부분의 변인은 응답 수준이 높을수록 창의적 사고력에 대한 정적인 영향력이 있는 것으로 나타났다.
우선, 수학 관련 변인이 상위에 위치한 것은 수학적 사고와 창의적 사고 간의 인지적 유사성에서 기인한 것으로 해석할 수 있다. 선행 연구에서 수학적 동기 요소는 수학 창의성과 밀접한 관련이 있는 것으로 나타났으며, 창의성 증진을 위해 인지적 요소뿐만 아니라 동기적 요소의 중요성이 밝혀진 바 있다(서종진, 황동주, 2004). ICT 활용과 관련해서는 ICT 활용의 유형과 빈도에 따라 창의성에 영향을 미칠 수 있음을 보인 선행 연구의 결과와 같이(홍성용 외, 2014), 비교과적이거나 탐색적 상황에서 적절한 목적의 ICT 활용이 창의성을 정적으로 예측하는 요소인 것으로 판단할 수 있다. 즉, 수학적 사고 증진과 ICT를 활용한 탐색적 활동은 창의적 표현과 아이디어 재구성의 기회를 제공하는 등 창의적 사고력 발현을 촉진할 수 있을 것이다.
한편, ‘목표 학력’과 관련하여 분야별 목표 학력에 따라 창의적 사고력 수준이 달라지는 점은 흥미로운 결과로 보여진다. 본 연구에서는 직업 기술 및 실무 능력과 관련이 있는 직업교육을 목표로 한 학생일수록 창의적 사고력이 낮게 나타났는데, 이는 교육 목표의 성향 차이에서 비롯된 것으로 판단된다. 선행 연구에서는 진로 결정 수준과 창의성 간에 유의한 정적 관계가 나타나 창의성과 진로 변인 간에도 밀접한 관련이 있음을 확인할 수 있었다(임효신, 정철영, 2010). 이에 대해 다른 연구에서도 지위 상승, 포부 수준, 모험 행동 등의 요인이 창의적 성향에 유의한 영향을 미쳤으나, 안정을 위한 행동은 통계적으로 유의한 영향이 없는 것으로 나타난 바 있다(류경현, 2005). 즉, 성취적 동기가 창의적 성향과 밀접한 관련이 있었다는 점에서 고등 교육 수준을 목표로 하는 학생일수록 창의적 사고력이 높은 경향을 보이며, 실용성과 효율성을 중시하는 직업 기술 중심 교육을 지향하는 성향은 창의적 사고력 발현이 상대적으로 제한될 수 있는 것이다. 이에 대해서는 창의적 사고력의 성취 수준 자체보다, 추구하는 교육 성향과 목표의 차이가 창의적 사고력 유형에 영향을 미칠 수 있으며, 나아가 후속 연구를 통해 창의적 사고력이라는 복합적 개념과 진로 관련 변인과 어떠한 관계를 보이는지 구조적으로 심층적으로 검토할 필요가 있을 것이다.
본 연구에서는 우리나라 교육과정에서 미래 사회 대비를 위해 핵심역량을 함양한 창의적 인재 육성을 강조하는 점과 PISA 2022에서 혁신적 영역으로 추가된 창의적 사고력 평가 결과 우리나라가 최상위권으로 나타난 결과에 주목하여, 청소년의 창의적 사고력 영역에 영향을 미치는 주요 예측 변인을 살펴보았다. 앞서 나타난 결론을 토대로 창의적 사고력의 주요 예측 요인으로는 개인 특성 중 수학 및 ICT 관련한 요인이 다수 등장하였으며, 가정 환경 변인이 창의적 사고력에 영향을 미칠 수 있는 것으로 나타났다. 즉, 창의적 사고력은 개인의 정서적 변인, 다양한 학습활동 및 사회경제적 지위와 같은 가정 환경 요인에 의해 영향을 받는 것을 확인할 수 있었다.
먼저, 수학 자기효능감, 수학 수업 횟수, 수학 개념 친숙도와 같은 수학 인지 요인이 창의적 사고력에 정적 영향을 준다는 점은 단순한 문제 풀이 중심의 수학 수업이 아닌, 학생의 성취감을 강화하고, 동기를 유발하는 교수학습 설계의 필요성을 시사한다. 예를 들어, 문제 해결 과정에서 다양한 풀이 방법을 탐색하거나 학생 주도형 활동, 토론 수업 등이 해답을 찾는 과정에서 스스로 의미를 탐색하고, 성취감을 경험할 수 있도록 하는 수업 전략이 될 수 있을 것이다. ICT 활용의 유형 및 빈도는 창의적 사고력에 유의한 영향을 미친다는 점에서도 탐색적이고 적절한 목적의 ICT 활용은 아이디어를 구성하고 표현하는 등 창의적 사고력 발현에 긍정적인 영향을 미치는 요인이 될 수 있다. 따라서 문제 해결을 위한 창의적 콘텐츠 제작 등 ICT를 활용한 프로젝트 기반 수업이 도움이 될 수 있을 것이다.
이 외에도 가정의 보유 자산이나 가족의 지원 정도 등 환경적 요인이 창의적 사고력에 영향을 미치는 주요 변수인 것으로 나타나, 가정 및 학교 차원에서의 학습환경과 학습지원이 학생의 창의적 사고력 향상에 많은 역할을 할 수 있을 것으로 기대된다. 김성경 외(2024) 연구에 따르면, PISA 2022 결과에 대해 한국 학생들의 창의적 사고력 수준이 높은 반면, 창의적 과제에 대한 자신감은 상대적으로 낮게 나타나는 등 창의적 활동의 촉진에 더불어 심리적 지원과 교원 역량을 강화하는 정책적 노력을 강조하였다. 따라서 청소년의 창의적 사고력 향상을 위해서는 개인, 가정, 학교, 국가 차원의 종합적 지원이 필요할 것이다. 먼저 가정에서는 청소년의 창의적 사고력을 촉진할 수 있는 환경을 조성하기 위해서 다양한 경험과 창의적 과제 참여, 문제해결 중심의 탐색적 활동을 적극 장려할 필요가 있다(김명숙 외, 2002; 이현주 외, 2014). 또한, ICT 활용에 있어서는 단순한 정보 검색 도구나 비학습적 활동에 그치지 않고, 창의적 표현, 탐색, 학습적 맥락에서 ICT를 활용할 수 있도록 지도하는 것이 중요할 것이다(김혜숙, 2012; 홍성용 외, 2014). 학교와 교육청 차원에서는 학생의 개별 목표 수준을 고려하여 다양한 관점에서 창의적 문제해결 프로젝트, 융합적 디자인 사고(Design thinking) 수업 등을 활용할 수 있도록 교육과정을 설계할 필요가 있다. 또한, 방과 후 창의성 프로그램이나 멘토링 제도를 통한 긍정적 학습 경험, 자기 주도적 탐구활동, 상담 지원 등 다양한 학습지원을 통해 창의적 사고력에 대한 사회경제적 지위에 의한 격차를 해소하고 청소년의 정서적 지원을 강화할 수 있을 것이다(김재령, 2020; 한정아, 2023). 나아가 국가 차원에서 창의적 사고력 함양을 목표로 한 학교 환경 개선, 창의적 사고력 기반의 수업 모형 개발 및 보급, 교원 연수 프로그램을 통한 역량 강화 등 종합적 정책 수립이 필요할 것이다(김성경 외, 2024). 이를 통해 미래 사회가 요구하는 창의적 사고력과 기초 소양을 갖춘 창의적 인재를 육성할 수 있을 것으로 기대된다.
본 연구의 의의와 제한점에 따른 후속 연구를 다음과 같이 제언하고자 한다. 첫째, 국내외 교육 분야에서는 효과적인 핵심역량 교육을 위해 교육과정, 교수ㆍ학습, 평가 등 교육 전반에 걸쳐 변화를 시도하고 있으며, 특히 평가는 학습의 질을 결정짓는 중요한 요소이기 때문에 학생의 성장과 발달을 측정할 수 있는 새로운 평가 체제 마련에 집중하고 있다. 본 연구에서는 OECD에서 강조한 핵심역량인 창의적 사고력에 영향을 미칠 수 있는 주요 예측 요인을 파악하여, 학습자의 핵심역량 향상을 위해 맞춤형 수업 및 평가 개선 등의 교육과정 체제 전환에 기초자료를 제공하였다는데 연구의 의의가 있다.
둘째, 창의적 사고력은 OECD에서 강조한 미래 핵심역량이며, 의사결정과 문제해결에 영향을 미칠 수 있는 요인으로 연속적이고 역동적으로 작용하기 때문에 종합적 접근이 요구되지만, 연구 대상과 데이터 수집의 한계로 결과적 정보나 자기 보고식 설문 결과에 의한 선행 연구들이 대부분이었다. 본 연구에서는 창의적 사고력 평가 문항에 대한 응답자의 응답 결과를 평가하여 산출한 점수를 분석함으로써 학생의 주관이나 자기 인식이 배제된 객관적 평가 결과를 활용하였다는 점에서 연구의 의의가 있다.
셋째, 본 연구에서는 AutoML의 머신러닝을 기반으로 창의적 사고력 예측 모형의 성능을 비교하고, 하이퍼파라미터 최적화 과정을 통해 청소년의 성능을 향상시킬 수 있었다. 최근 방대한 양의 데이터를 분석할 수 있는 연구 기법들이 개발되고, 예측 성능이 우수한 연구모형을 적용할 수 있게 됨에 따라 학업성취도나 정의적 특성 예측을 위해 머신러닝을 적용한 연구들이 많이 소개되고 있다. 다양한 변수를 동시에 비교하여 예측 변수의 영향력을 확인하는 것은 상대적인 중요도를 비교하고 새로운 예측 변수의 탐색에 활용되는데 이를 통해 학생의 정의적 특성과 성취도를 효과적이고 보다 정확하게 예측하기 위한 예측 모형을 제안하고 최적화하여 청소년의 성능을 높이는 방법을 제시하였다는데 연구의 의의가 있다.
다만, PISA 2022는 국제 학업성취도 평가인 만큼 우리나라 청소년의 창의적 사고력의 특성을 일반화하여 설명하기 위해서는 다른 나라의 학생 특성과 비교하여 설명할 필요가 있다. PISA 2022의 창의적 사고력 평가 결과가 공개되면서 높은 성취를 보인 우리나라의 결과를 주목하고 있으나, 결과보고서에서 나타난 바와 같이 OECD 평균보다 학교, 교사 환경 변인의 영향이 적고, 창의적 사고력 성취 수준이 가장 높은 싱가포르에서는 창의성이나 예체능 교육과정이 우리나라와 달리 갖추어지지 않았다는 점에서 교육과정, 학습 방법이나 다른 환경적 요인이 다른 나라와 비교하여 어떠한 영향을 미칠 수 있는지 국가 비교를 추가적으로 수행할 필요가 있을 것이다. 또한, 창의적 사고력은 다른 영역과 비교하여 정답 여부와 관계없이 독창성을 평가하였다는 점에서 다른 영역의 평가 결과에 대한 예측 요인을 서로 비교한다면 보다 객관적 해석이 가능할 것으로 판단된다.