Core Concepts
データ駆動型方法を使用して、新しい材料を素早く発見し、イノベーションを加速する。
Abstract
この研究は、自然言語処理パイプラインを使用してポリマーソーラーセルの特性データを抽出し、機械学習モデルをトレーニングして効率的な予測を行うことで、新しい有望なドナー/アクセプター組み合わせを特定した。さらに、実験的な試行錯誤にかかる時間の約75%削減が可能であり、機械学習手法が新しい材料の発見に与える影響が示されています。また、ガウス過程トンプソンサンプリングが他の戦略と同等の速度で最適なドナー/アクセプター系を発見することが示されました。
この研究は、NLPから始まりMLモデルへと進化するパイプライン全体に焦点を当てており、新たな材料や性質への洞察も提供しています。将来的には他の性質や材料クラスへの拡張が期待されます。
Stats
抽出されたデータセットには3307件の文書が含まれており、そのうち861件(約26%)がキュレートされました。
ファラデー数値は2.07%です。
最高PCE値は16.4%です。
Quotes
"我々は初めて機械学習手法による材料探索で節約された時間を定量化した。"
"GP-TSは他の戦略と同等の速度で最適なドナー/アクセプター系を発見しますが、同時に強力な予測子も訓練します。"