[23′ Nature Article] An autonomous laboratory for the accelerated synthesis of novel materials

This entry is part 6 of 7 in the series Battery

1. 들어가며

재료 과학 분야에서 새로운 물질을 발견하거나 새로운 합성 방법을 찾아내는 과정은 전통적으로 시간이 매우 많이 소요됩니다. 왜냐하면 이 과정은 필연적으로 실험을 통해 이루어져야 하기 때문인데요. 이러한 실험을 세팅하는 과정은 대부분 과학자의 경험적 방법에 의존하며, 실험을 수행하는 과정은 제작과 열처리 등 아주 오랜 시간동안의 작업을 요구합니다. 이는 높은 실험 실패율과 막대한 자원 소모를 수반하는 과정입니다.

그러나 최근의 데이터 과학과 AI 기술의 발달은 이러한 과정을 혁신적으로 변화시키고 있습니다. 특히, 대규모 언어 모델(LLM)을 사용하면 기존 문헌에서 얻은 방대한 지식을 바탕으로 실험 세팅을 최적화할 수 있습니다. 또한, 로봇 기술의 발전은 실험 과정 자체를 자동화하고 정밀도를 높일 수 있는 기회를 제공합니다. 이러한 기술의 조합은 실험 과정의 자동화를 가능하게 하며, 새로운 물질의 발견과 합성 방법의 탐색을 가속화할 수 있습니다.

이번 포스팅에서 소개하는 “An autonomous laboratory for the accelerated synthesis of novel materials” 논문, 혹은 A-Lab은 이러한 혁신적 접근 방식을 구현한 대표적인 사례입니다. A-Lab은 자동화된 실험 접근 방식을 통해 재료 과학 분야의 연구 개발 과정을 혁신적으로 가속화하는 방법을 제시합니다. 이 과정에서 중점을 둔 것은 연구의 효율성을 극대화하고, 실험 과정에서의 정확도를 높이며, 새로운 재료 발견의 속도를 향상시키는 것입니다.

따라서, 본 포스팅을 통해 A-Lab의 기술적 구성, 실행 방법, 그리고 그로 인해 가능해진 새로운 재료의 발견과 합성 과정에 대해 자세히 살펴볼 것입니다. 이러한 접근 방식이 재료 과학 분야 뿐만 아니라 넓게는 과학 및 공학 전반의 연구 개발 방식에 어떠한 변화를 가져올 수 있을지에 대한 흥미로운 논의를 시작해보려 합니다.

2. A-Lab

이번 챕터에서는 A-Lab에서 제안하는 방법을 자세히 살펴보겠습니다. A-Lab의 제안 방법은 크게 네가지로 구성되어 있습니다.
첫 번째는 타겟 물질을 찾는 과정입니다. LLM을 사용하여 성공 가능성이 높은 새로운 타겟 합성 물질을 찾아냅니다.
두 번째는 합성 방법을 찾는 과정입니다. 마찬가지로 LLM 등을 활용하여 앞서 찾은 새로운 타겟 합성 물질을 합성할 수 있는 방법, 즉 레시피를 찾습니다.
세 번째는 자동화된 실험 과정입니다. 앞서 찾은 타겟 물질과 합성 방법으로 실험을 진행하는 단계인데요. 로봇을 사용하여 이 모든 과정을 자동으로 수행합니다.
네 번째는 결과 분석과 새로운 합성법을 제안하는 단계입니다. 앞서 로봇으로 새로운 타겟 물질을 합성했는데요. 이 결과를 분석하여 합성에 성공했는지, 실패했는지를 분석합니다. 만약 목표 달성에 실패했다면 합성법을 수정하여 새로운 합성법을 제안할 겁니다.

그림1. A-Lab 전체 과정
그림1. A-Lab 전체 과정

위 그림은 이러한 네 가지 A-Lab 과정을 표현한 그림입니다. 이제부터 하나씩 자세히 살펴보겠습니다.

2-1. 타겟 물질 찾기

가장 먼저 수행해야 하는 과정은 타겟 물질을 찾는 것입니다. 어떤 물질을 새롭게 합성할 것인지 찾는 단계인데요. 이때 아무 물질이나 선정할 수는 없습니다. 이론적으로 합성이 가능한 물질인지를 따져보고, 합성 가능성이 가장 높은 물질을 찾아내야 하죠. 이를 위해서 AI를 사용합니다. 논문에서는 Text Mining을 사용했다고 표현하고 있습니다. 구체적인 방법을 설명하지는 않았기 때문에 LLM을 사용했다고 가정하고 생각해보겠습니다.

먼저 데이터는 Materials Project 라는 데이터 베이스를 사용합니다. 이 데이터 베이스는 수천 개의 물질에 대한 DFT (밀도 기능 이론) 계산 결과가 포함되어 있는데요. 이는 각 물질의 열역학적인 안정성과 결정 구조, 에너지 레벨 등 물질 합성에 관련된 정보를 제공해줍니다. 이제 이 데이터를 LLM을 사용하여 학습 또는 Fine Tuning 해 줍니다. LLM은 이 과정을 통해 합성 조건과 전구체, 온도 범위 등 물질 합성과 관련된 정보를 학습하게 됩니다.

이렇게 학습된 LLM은 이제 새로운 타겟 물질을 제안해줄 수 있는데요. 이때 학습 데이터를 바탕으로 아직 합성되지 않았거나, 합성 성공 가능성이 높은 새로운 물질을 제안해줍니다. 이때 물론 열역학적인 안정성과 실험 환경에서의 합성 가능성, 그리고 새로운 물질의 잠재적 가치, 응용 가능성 등을 범용적으로 고려해 제안합니다.

2-2. 합성 방법 제안

이렇게 찾은 타겟 물질을 합성하려면 최적의 합성 방법 (레시피)를 찾아야 하는데요. 이러한 합성 방법은 주로 과학 문헌에서 찾을 수 있습니다. 여기서 말하는 합성 방법이란 예를 들어 전구체 물질, 합성 조건, 가열 및 냉각 속도, 기타 실험 변수 등을 말합니다. 앞선 타겟 물질을 찾아낼때와 마찬가지로 과학 문헌을 학습한 LLM을 사용하여 합성 방법을 제안했을 것으로 추정됩니다.

전체 과정을 고려했을때 학습한 모델이 제안하는 합성 방법을 예로 들면 다음과 같은 형태일 것으로 추정됩니다. 예를 들어 새로운 고체 촉매 물질 “ABC3” 를 합성해야 하는 상황이라고 가정해보겠습니다. 그럼 먼저 A 금속의 니트레이트와 B 금속의 옥사이드, 그리고 C 금속의 아세테이트를 준비합니다. 이들을 1:1:1 비율로 혼합해줍니다. 그리고 500℃에서 4시간동안 열처리를 진행해줍니다. 이 과정에서 ABC3의 전구체가 반응해서 초록색 분말 형태의 중간체를 형성해야 합니다. 마지막으로 형성된 중간체를 700℃에서 추가로 2시간동안 열처리해 줍니다. 이후 실온에서 냉각 과정을 거치면 최종적으로 ABC3 촉매 물질의 합성이 완료됩니다.

2-3. 자동화된 실험

이렇게 나온 합성 방법을 사용해서 이번에는 실제 실험을 수행해야 하는데요. 이 과정 또한 사람이 개입하지 않고, 전 과정을 로봇으로 진행합니다. 이렇게 로봇으로 진행되는 과정은 크게 세가지 단계로 구성되어 있습니다.

첫 번째 단계는 전구체 준비 단계입니다. 이 단계에서는 합성에 필요한 모든 전구체를 자동으로 계량하고 혼합해줍니다.
두 번째 단계는 열처리 단계입니다. 첫 번째 단계에서 준비된 혼합된 전구체를 다른 로봇팔을 사용하여 가열 장치로 이동해줍니다. 이후 레시피에 명시된 조건에 따라 온도, 시간, 분위기를 맞춰 열처리를 해주면 합성 반응이 일어납니다. 이 단계에서 타겟 물질 합성은 완료됩니다.
세 번째 단계는 분석 단계입니다. 합성된 물질을 X선 회절 (XRD)을 사용하여 분석하는 단계인데요. XRD 분석을 통해 합성된 물질의 구조와 상태를 평가합니다. 이 평가 정보는 합성물의 결정 구조, 상 순도, 기타 필요 정보들을 포함합니다.

2-4. 결과 분석 & 새로운 합성법 제안

마지막 단계는 XRD 분석을 통해 나온 정보로 실험 결과를 평가하는 단계입니다. XRD 패턴을 통해 특정 물질의 상 존재 여부와 그 양을 알 수 있는데요. 미리 정해놓은 기준을 통해 원하는 물질 합성의 성공 실패 여부를 특정할 수 있습니다.

만약 합성에 실패했다면 레시피를 수정하여 다시 합성 과정부터 반복해줄건데요. 이때 수정된 레시피 제안 또한 이 전에 레시피를 제안해준 LLM을 통해 수행합니다. 다만 이 LLM은 어떠한 실험을 했을때는 성공했고,어떠한 실험을 했을때는 실패했는지에 대한 정보를 지속적으로 학습해줍니다. A-Lab에서는 이러한 Active Learning을 ARROWS라는 알고리즘을 사용했다고 명시하고 있습니다.

3. 실험 결과

이렇게 A-Lab에서 제안하고 있는 자동화된 실험 방법을 통해 수행한 실험 결과는 어떤지 살펴보겠습니다.

그림2. A-Lab 실험 결과
그림2. A-Lab 실험 결과

위 그림은 A-Lab 제안 방법을 통해 수행한 실험 결과를 분석한 표 입니다. 총 58개의 타겟 물질 합성 실험을 진행했는데요. 그중 41개 물질의 합성에 성공했습니다(파란색). 이는 71%의 성공률을 의미합니다. Minor Modification과 Computational Technique까지 개선해주면 78% 성공률까지 개선된다고 합니다. 위 그래프에서 사선은 Active Learning을 적용한 결과를 의미합니다. 즉 몇번 실험을 수행해보고 계속 실패하면 Active Learning을 수행해서 지금까지의 실험 결과를 LLM에게 알려주고 다시 실험을 반복하는 과정을 수행했음을 의미합니다. Active Learning을 진행해도 끝까지 실패한 경우도 꽤 많이 보이는 모습입니다. 이 Active Learning 알고리즘을 조금 더 손보면 정확도를 꽤 많이 올릴 수 있어 보입니다.

4. 의의

지금까지 A-Lab 논문의 주요 내용을 살펴봤습니다. A-Lab은 최소한 네 가지 의의가 있습니다.

첫 번째는 재료 공학 분야의 연구 개발 시간을 단축해준다는 것입니다. 전통적인 재료 공학 방법에 비해 실험 설계와 실행을 자동화하여 새로운 재료의 합성과 특성화에 소요되는 시간을 대폭적으로 줄일 수 있습니다. 덕분에 연구 개발 속도를 가속화할 수 있으며, 빠르게 변화하는 기술 환경에 효과적으로 대응할 수 있게 해줍니다.

두 번째는 데이터 기반 의사 결정을 강화해준다는 점입니다. 실험 과정에서 발생하는 대량의 데이터를 실시간으로 분석하고, 이를 바탕으로 실험 조건을 지속적으로 최적화할 수 있습니다. 이러한 데이터 기반 의사결정은 실험의 성공률을 높이고, 연구 결과의 신뢰도를 개선해줍니다.

세 번째는 재료 합성의 새로운 가능성을 탐색해준다는 점입니다. 계산 재료 과학과 기계 학습의 통합을 통해 기존에 알려지지 않은 새로운 재료와 그 특성을 발견할 가능성을 열어줍니다.

네 번째는 환경 및 경제적 지속 가능성을 확대해준다는 점입니다. 기존 전통적인 방법은 아주 많은 실험 과정을 동반하는데요. A-Lab을 통해 실험 과정이 효율화 되므로 불필요한 자원 소모를 줄이고 실험 폐기물 양을 최소화할 수 있습니다.

5. 마치며

이번 포스팅을 통해 소개된 “An autonomous laboratory for the accelerated synthesis of novel materials”, 약칭 A-Lab은 재료 과학 분야에서의 혁신적인 접근 방법을 제시하며, 새로운 물질의 발견과 합성 과정을 혁명적으로 가속화할 수 있는 가능성을 열었습니다. A-Lab의 자동화된 실험 접근 방식은 연구와 개발의 효율성을 극대화하고 실험의 정확도를 높이며, 무엇보다 새로운 재료 발견의 속도를 크게 향상시킬 수 있는 장점을 가지고 있습니다.

A-Lab의 사례는 데이터 과학과 인공 지능 기술이 전통적인 과학 연구 방식에 어떻게 적용될 수 있는지를 보여주는 하나의 사례입니다. 이는 단순히 연구 방법의 자동화에 그치지 않고, 연구 개발 과정에서 발생하는 대량의 데이터를 실시간으로 분석하고, 이를 바탕으로 실험 조건을 지속적으로 최적화하는 새로운 패러다임을 제시합니다.

더불어, A-Lab에서 사용된 Active Learning 알고리즘과 같은 첨단 기술들은 실험의 실패로부터 학습하고, 이를 바탕으로 다시 실험 조건을 조정하는 과정을 자동화함으로써, 실험 과정의 효율성과 성공률을 동시에 향상시킬 수 있음을 입증했습니다. 이러한 접근 방식은 연구자들이 더 빠르고 정확하게 새로운 발견을 이루어내는 데 기여할 뿐만 아니라, 실험 과정에서의 자원 소모와 환경적 영향을 줄이는 데도 중요한 역할을 합니다.

마지막으로, A-Lab의 성공은 재료 과학 분야 뿐만 아니라 화학, 생물학, 의학 등 다양한 과학 및 공학 분야에서의 연구 개발 방식에 대한 새로운 시각을 제공합니다. 이러한 자동화된 실험 접근 방식이 앞으로 과학 기술의 발전과 혁신을 촉진하는 데 어떤 역할을 할 수 있을지 기대가 모아지고 있습니다.

본 포스팅을 통해 A-Lab과 그가 가지는 잠재력에 대해 조금이나마 이해하시는 데 도움이 되었기를 바라며, 이러한 기술의 발전이 우리의 미래 과학 연구에 어떤 영향을 미칠지 함께 지켜보는 것도 흥미로운 일이 될 것입니다.

6. 참고 자료

  1. Szymanski, Nathan J., et al. “An autonomous laboratory for the accelerated synthesis of novel materials.” Nature 624.7990 (2023): 86-91.
  2. ARROWS
  3. Jablonka, Kevin Maik, et al. “Leveraging large language models for predictive chemistry.” Nature Machine Intelligence (2024): 1-9. 논문 리뷰
Series Navigation<< [21′ Royal Society of Chemistry] Pathways towards managing cost and degradation risk of fast charging cells with electrical and thermal controls[21′ Elsevier] Hybrid Physics-Informed Neural Networks for Lithium-Ion Battery Modeling and Prognosis >>
0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x
Scroll to Top