핵심 개념
자연어 처리를 통해 폴리머 태양전지 소재 데이터 추출 및 시뮬레이션을 통한 데이터 기반 방법의 잠재적인 가속화를 증명합니다.
초록
자연어 처리 파이프라인을 소개하고, 데이터 추출 및 시뮬레이션을 통해 새로운 소재 발견을 가속화하는 방법을 제시합니다.
기계 학습 모델을 훈련하여 전력 변환 효율을 예측하고 유망한 기부자-수용체 조합을 식별합니다.
다양한 활성 학습 전략을 비교하고 실험적인 방법 대비 데이터 기반 방법의 시간 절약을 측정합니다.
다양한 데이터 선택 방법을 분석하고 예측 성능의 진화를 살펴봅니다.
다중 속성 최적화와 확장 가능성에 대한 전망을 제시합니다.
통계
우리의 파이프라인은 폴리머 태양전지 소재에 대한 3300편 이상의 논문에서 데이터를 추출합니다.
예상된 발견 시간 절약은 약 15년에 해당합니다.
인용구
"기계 학습을 통해 새로운 소재 시스템을 실험적으로 결정하는 시간을 비교한 첫 번째 양적적 증거를 제공합니다."
"GP-TS는 다른 전략과 비교하여 최적의 소재 시스템을 빠르게 발견하고 강력한 속성 예측기를 동시에 훈련합니다."