1. 서 론
자기냉각효과(magnetocaloric effect)는 기존의 가스압축방식과 다르게 고체 소재를 사용하기 때문에 에너지 효율이 우수할 뿐 아니라, 환경오염을 일으키는 가스를 사용하지 않는 장점으로 인해서 오랫동안 연구되어 왔다.1,2,3) 자기냉각효과에 사용되는 소재인 자기냉각소재(magnetocaloric material)의 전이온도(transition temperature, Tr)에 따라서, 자기냉각효과의 작동온도가 결정되는데, 각 응용범위에 따른 다양한 자기냉각 소재들이 보고되고 있다.4,5,6,7,8) 예를 들어, 수소냉각에 사용되는 극저온 자기냉각소재는 최근 미래 대체 에너지로서의 수소사용에 대한 안정성과 운송의 편의성 등으로 연구가 되고 있으며,4,5) 상온작동 자기냉각 소재는 현재의 냉각기술을 대체하기 위해서 first order magnetic transition (FOMT) 소재 및 second order magnetic transition (SOMT) 소재로 구분되어 연구가 진행되고 있다.6,7,8) FOMT소재는 높은 자기열용량 효과의 장점이 있지만, 온도구간이 좁기 때문에 SOMT에 대한 연구가 최근 여러 소재들을 이용하여 연구가 되고 있으며, 그 중에서 벌크금속유리(bulk metallic glass, BMG) 소재가 대표적으로 연구되어지고 있는 후보물질이다.8,9,10,11) 벌크금속유리 소재는 결정성 특성이 없기 때문에 여러 장점을 가지는데, 대표적으로 SOMT 특성과, 자기이력 및 열적 이력이 작은 특성을 가지고 있다.8,9,10,11) 장거리 규칙배열(long-range ordering)이 없기 때문에 전기전도도가 작아서 와전류 손실이 상대적으로 다른 금속 자기냉각소재에 비해서 작은 장점을 가지고 있다. 또한 벌크금속유리 소재는 소재의 조성성분에 따라서 특성이 변하는데, 전이온도가 저온에서 상온 이상까지 다양한 분포를 가지는 것으로 보고되고 있기 때문에, 용도에 맞는 소재 선택이 가능한 장점 또한 가진다. 하지만 소재의 조성분포구간이 광범위하게 넓기 때문에, 실험을 통해서 최적의 소재를 탐색하는 시행착오(trial-and-error) 방법은 시간 및 경제적 손실 측면에서 최선의 방법은 아니다.12,13,14,15) 최근, 컴퓨팅 성능과 다양한 알고리즘의 소개로 기계학습을 통한 소재 탐색, 소재 특성 예측, 소재개발이 가능해지면서 이에 대한 연구가 활발히 진행되고 있다.13,14,15) 미국의 빅테크를 중심으로 소재발굴 프로토콜 소개,13) 대량의 데이터기반 신소재 개발14) 및 고성능컴퓨팅 기반 배터리 소재 개발이 대표적인 예이다.15) 기계학습 기반의 자기냉각 소재 탐색은 아직 초기 연구 단계이며, 대량의 데이터 수집과 기계학습을 위한 특성인자 추출 방법과 같은 연구가 필요함이 분명하다.12,16) 데이터 수집은 실험을 기반으로 한 데이터와 계산을 바탕으로 한 데이터 등이 가능하다. 여러 문헌을 통하여, 앞으로 데이터 수집이 지속적으로 이루어지고 공개된 데이터를 기반으로 해서 여러 연구자의 참여를 바탕으로 한 기계학습의 예측 성능에 대한 신뢰성 확보도 필요할 것으로 여겨진다. 기계학습에서 가장 중요한 요소인 특성인자(features)는 소재의 특성을 나타내는 입력데이터로서 여러 가지 방법이 지금까지 연구되어지고 있다. 대표적으로 조성기반 특성인자(compositional features) 및 구조기반 특성인자(structural features) 등이다. 조성기반 특성인자는 소재의 조성성분만으로 특성인자를 추출할 수 있으며 파이썬(Python) 기반 모듈이 소개되고 있다.17) 구조기반 특성인자는 소재의 구조 특성을 알고 있어야 하므로 예측성능이 우수한 장점이 있으나, 신물질 개발을 위해서는 밀도범함수 이론(density functional theory, DFT) 양자계산과 같은 추가 과정이 필요한 단점이 있다.18)
최근 기계학습을 이용한 자기냉각 소재의 성능예측 및 신소재 개발 연구가 소개되고 있다. 예를 들어, 기계학습을 통해서 저온 자기냉각 효과의 특징을 가지는 HoB2 소재 및 MnFeCoPSi 계열의 소재가 수소냉각 등에 응용될 수 있음이 소개되었으며, 상온작동 자기냉각 효과의 특징을 가지는 MnFePSi 소재 계열이 새롭게 소개되었다.19,20,21) 본 연구에서는 벌크금속유리 소재를 바탕으로 자기냉각 효과 및 전이온도를 예측하는 앙상블 기계학습 모델을 이용하였다. 그 결과 전이온도(Tr) 예측에서는 90개의 특성인자를 바탕으로 0.893의 R2 score를 얻었으며, 자기냉각효과(-ΔS) 특성 예측에서는 20개의 특성인자만을 이용하여 0.912의 높은 R2 score를 얻을 수 있었다. 여기서, S는 자기-엔트로피를 나타내며 ΔS = S(Happlied) - S(H = 0)로 정의된다. 음의값을(-ΔS) 사용하는 이유는 강자성체인 경우에 자기장이 없을 때는(H = 0) 자기-엔트로피값이 크며, 자기장이 가해지면(Happlied) 자기-엔트로피값이 작기 때문에 자기냉각 효과의 양의 값을 이용하기 위해서 -ΔS를 사용하였다. 과대적합을 방지하는 측면에서 적은 수의 조성기반 특성인자와 앙상블 알고리즘을 통해서 벌크금속유리 소재의 전이온도와 자기냉각 효과를 효과적으로 예측할 수 있음을 확인하였다.
2. 실험 방법
벌크금속유리는 비정질 소재에 해당하므로 결정구조 특성이 없기 때문에 조성기반 특성인자를 파이썬 모듈인 ‘Matminer’를 이용하여 얻고 이를 바탕으로 연구를 진행하였다.22) 최근 조성기반 192개의 특성인자를 바탕으로 딥러닝 기반 합성곱신경망 모델을 통하여 소재의 특성을 예측하는 연구가 보고되었다.23) 여기서 다량의 특성인자는 과대적합을 발생할 수 있으므로 본 연구에서는 고전적 기계학습의 대표적인 모델인 앙상블 알고리즘인 RandomForest를 이용하여, 적은 수의 특성인자만으로 소재의 특성을 예측할 수 있음을 확인하였다. ‘Scikit-learn’에서 제공하는 RandomForest 모델의 경우에, 주요특성인자 추출방법(feature importance method)이 제공되고 있기 때문에 이를 바탕으로 특성인자를 줄여가면서 예측성능을 비교하여 최적의 특성인자 수를 확인하였다.
Fig. 1은 여러 문헌에서 수집한 414개 벌크금속유리 소재의 특성값에 대한 분포를 보여준다.16,23,24)Fig. 1(a)는 전이온도의 분포가 0K < Tr < 650K 사이에서 골고루 분포하고 있음을 보여준다. 철(Fe)가 포함된 소재 256개와 철이 포함되지 않은 소재 158개로 구분하여 표시하면, 철이 포함된 경우는 전이온도가 200K 근처와 300~400K에서 가장 많은 분포를 보이면서 전체적으로 고른 분포를 보이는 반면, 철이 포함되지 않은 소재는 200K 이하의 값을 주로 가지는 것을 확인할 수 있다. Fig. 1(b)는 자기냉각효과 값에 대한 분포를 보여주며, 자기냉각 효과는 0 < -ΔS (J/kgK) < 18의 값을 가지는 것을 알 수 있다. 철이 포함된 소재는 2.5 J/kgK 이하의 값을 가지는 소재가 주로 있는 반면에 철이 포함되지 않은 소재는 고른 분포를 보여주는 것을 Fig. 1(b)를 통해서 알 수 있다. 전체 데이터 414개 소재는 331개의 학습데이터(training data)와 83개의 테스트데이터(test data)로 무작위로 나뉘었으며 학습과 테스트를 따로 진행하여 그 결과를 확인하였다.
3. 결과 및 고찰
Fig. 2는 벌크금속유리 소재의 특성을 예측하기 위해서 사용한 방법을 요약하여 보여준다. 우선, 소재데이터의 조성정보로부터 파이썬 모듈인 ‘Matmienr’를 이용하여 특성인자를 추출한다. 174개의 얻어진 특성인자를 바탕으로 기계학습 모델 RandomForest를 이용하여 주요특성인자를 탐색한다. 탐색방법은 ‘Scikit-learn’에서 제공하는 ‘mean decrease in impurities’ 알고리즘으로 특성인자를 제거할 때 마다 감소하는 성능지표의 값의 크기에 따라서 주요 특성인자의 중요도를 결정할 수 있다.25) 전이온도와 자기냉각효과 예측에 중요한 특성인자를 높은 순위부터 10개 표시하여 Fig. 2에 표시하였다. 전이온도 특성의 경우 가장 중요한 특성인자는 ‘Magpiedata mean GSMagmom’이며, 자기냉각효과의 경우는 ‘Fe’의 조성비율이다. 전이온도와 자기냉각효과에서의 주요 특성인자는 Table 1에도 자세히 표시하였다.
Table 1.
10 main compositional features sorted by importance-rank for Tr and -ΔS prediction with the RandomForest model.
Fig. 3은 위에서 얻은 주요 특성인자의 중요도에 따라서 낮은 순위의 특성인자를 제거하면서 얻은 전이온도와 자기냉각 효과의 특성 예측성능을 보여준다. 소재의 특성값을 예측하는 경우 회귀모델을 사용하므로 본 연구에서 성능지표는 R2 score를 사용하였다. R2 score는 회귀 예측이 우수할수록 1에 가까운 값을 가지게 된다. Fig. 3(a)는 전이온도에 대한 예측성능 변화이며, 특성인자 10개부터 100개까지 10개씩 변화시키면서 그 성능을 확인한 결과이다. 특성인자 90개를 사용할 때 가장 좋은 R2 score를 얻었으며 그 값은 0.893이다. Fig. 3(b)는 특성인자수에 따른 자기냉각 효과 예측성능의 변화를 보여주고 있으며, 특성인자 20개를 사용할 때 가장 좋은 R2 score를 보여주며 그 값은 0.912이다.
Fig. 4는 초기 174개 특성인자와 위 실험을 통해서 얻은 특성인자 90개(전이온도 예측)와 20개(자기냉각효과 예측)에 대한 피어슨 상관관계 계수(Pearson correlation coefficient)결과를 보여준다. 피어슨 상관관계 계수는 전이온도 또는 자기냉각효과 값과의 상관 관계성을 나타내는 계수로서 1에 가까우면 양의 상관관계, -1에 가까우면 음의 상관관계, 상관관계성이 없으면 0에 가까운 값을 가진다. Fig. 3은 0과 1사이의 값을 가지는 절댓값 피어슨 상관관계 계수를 보여줌으로써, 높은 상관관계 계수만이 주요 특성인자로 추출되지 않는 것을 알 수 있다. 즉 전이온도와 자기냉각효과를 예측하는데 있어서, 피어슨 상관관계계수가 높은 것만 택하게 되면 과대적합(overfitting)이 일어날 수 있으므로 이를 방지하기 위해서 특성인자를 줄이는 방법을 선택하였다. 주요 특성인자 추출 방법을 통해서 적절한 특성인자가 추출되었으며, 이를 통해서 테스트데이터에 대한 예측성능이 높게 유지되는 것을 알 수 있다.
Fig. 5는 회귀 예측성능에 대한 결과를 보여주며, 학습데이터와 테스트데이터에 대한 결과를 함께 보여줌으로써 상호 비교를 진행하였다. 전이온도 예측의 경우에는, 학습데이터의 성능을 보면 500K 이상의 소재에 대해서 과소예측(under-prediction)을 보여주는 것을 Fig. 5(a)를 통해서 알 수 있다. 테스트데이터의 결과도 학습데이터와 유사한 경향을 보이며, 큰 오차를 보이는 소재 3개는 Fe79B12Cr8La1, Fe64Mn14.5Co0.5Si10B11, Fe77.35Co4.55Cr9.1Zr7B2이며 오차는 112 %, 80.1 %, 44.5 %이다. 여기서 오차(error)는 실제값과 예측값의 차이를 실제값으로 나눈 백분율 값으로 표현한 것이다. 자기냉각 효과에 대한 예측의 경우에는 학습데이터의 결과를 보면 10 J/kgK 이상에서 약간의 과소예측이 나타나는 것을 볼 수 있으며, 테스트 데이터도 유사한 경향을 보이는 것을 Fig. 5(b)를 통해서 확인할 수 있다. 자기냉각효과 예측의 경우, 오차가 큰 소재는 Gd56Si44이며 실험값은 1.7 J/kgK이지만 예측값은 5.82 J/kgK로 과대예측이 되었다. Fig. 5에서 오차가 큰 소재는 화살표로 표시되어 있다. 전이온도와 자기냉각효과 예측에 대한 학습데이터, 테스트데이터에 대한 각각의 결과는 Table 2에 요약되어 있다. Table 2에서 RMSE (root-mean-squared-error)는 평균제곱근오차를 나타내는 것으로 아래 식 (1)로 나타낼 수 있다.
여기서, y는 실제값이며, ŷ은 예측값, N은 데이터 개수를 나타낸다.
Table 2.
R2 scores and RMSE values as metrics for the prediction of Tr and -ΔS with the RandomForest model.
| Tr | -ΔS | |||
| Training data | Test data | Training data | Test data | |
| R2 score | 0.984 | 0.893 | 0.983 | 0.912 |
| RMSE | 18.96 | 45.197 | 0.55 | 1.196 |
Fig. 6은 소재데이터에서 철이 포함된 소재와 전체 데이터에 대한 예측성능 비교를 나타낸 것이다. Fig. 2에서 확인한 것처럼 자기냉각효과 예측에서 가장 중요한 특성인자는 ‘Fe’ 성분 비율이다. 하지만 전이온도 예측에 있어서는 주요 특성인자 20개중에 ‘Fe’ 성분 비율이 포함되지 않는다. Fig. 6(a)는 자기냉각 효과 예측 성능 비교에서, 전체 데이터의 예측 결과와 철을 포함하는 데이터의 예측 결과를 함께 보여준다. 철을 포함하는 데이터의 예측성능은 R2 score가 0.982로 테스트 데이터의 예측성능에 비해서 훨씬 좋은 결과를 보여준다. Fig. 6(c)의 전체 데이터와 철을 포함하는 데이터에 대한 자기냉각 효과의 실제값과 예측값의 차이를 나타내는 잔차-오차(residual error) 히스토그램을 통해서도 유사한 결과를 확인할 수 있다. 전체 데이터에 비해서, 철을 포함하는 데이터에 대한 자기냉각 효과의 예측 성능에 대한 오차가 작게 나타남을 알 수 있다. 하지만 Fig. 6(b, d)에서 볼 수 있는 것처럼, 전이온도 예측에서는 전체데이터와 철을 포함하는 데이터의 예측 성능에 큰 차이가 나타나지 않는다. 이를 통해서 주요특성인자 추출을 통해서 확인한 것처럼 자기냉각효과 예측 성능에서 주요 특성인자 1순위로 나타난 ‘Fe’ 성분 비율에 대한 효과가 유효하게 작동하고 있음을 알 수 있다. 반면에 전이온도에서는 철을 포함하는 데이터의 특별한 예측 성능차이가 나지 않는 것을 보아서 주요특성인자 추출방법이 어느 정도 유효한 효과가 있음을 간접적으로 확인할 수 있었다.

Fig. 6.
Parity Plots of the (a) -ΔS and (b) Tr prediction for the full dataset with the trained RandomForest model, where the Fe-contained BMG materials are indexed as red colors. Residual error histograms are shown in (c) -ΔS and (d) Tr prediction for both the full and Fe-contained datasets for comparison.
4. 결 론
기계학습 모델의 하나인 앙상블 모델을 이용하여 자기냉각 효과 특성을 가지는 벌크금속유리 소재 데이터 414개를 바탕으로 전이온도와 자기냉각 효과를 예측하였다. 소재의 조성성분 특성인자만으로 예측성능을 확인하였으며, 회귀 예측에서 R2 score를 이용하여 예측 성능을 비교하였다. 과대적합을 방지하기 위해서 174개의 특성인자를 줄여가면서 최적의 모델을 탐색하였으며, 그 결과 전이온도에서는 90개의 특성인자, 자기냉각효과 예측에서는 20개의 특성인자만으로 우수한 예측 성능을 확인하였다. 특성인자 수를 줄이기 위한 방법으로는 주요특성인자를 순위별로 나열하여 예측 성능에 효과가 낮은 특성인자부터 줄이는 방법을 택하였다. 자기냉각효과 예측에서는 ‘Fe’ 성분비율 특성인자가 가장 중요한 특성인자로 확인되었다. 위의 방법의 적절성을 확인하기 위해서, 철이 포함된 데이터와 전체 데이터로 나누어 예측성능을 비교한 결과, 철이 포함된 소재의 예측성능이 전체 데이터 예측 성능과 비교했을 때 우수한 결과를 보였으며, 이를 통해서 ‘Fe’ 성분 비율의 특성인자가 자기냉각효과 예측의 주요한 특성인자임을 확인할 수 있었다.







