NEDO: 複数のAIを活用し、複雑な材料データからさまざまな機能を予測する技術を開発

NEDOの「超先端材料超高速開発基盤技術プロジェクト」で産業技術総合研究所、先端素材高速開発技術研究組合、日本ゼオンは、複数の人工知能(AI)を用いることで複雑な構造を持つ材料のデータを処理し、高速・高精度にさまざまな機能を予測する技術を開発した。

今回開発されたマルチモーダルAI技術は、母材・添加剤・充填剤といったさまざまな配合を持つ材料(複雑材料系)に対して、深層学習(ディープラーニング)を適用する新しい技術である。画像や分光スペクトルといった異なる複数のデータを計測・統合することで、従来のAI技術を適用できなかった複雑材料系も、2万分の1以下の時間で高精度に異なる複数の特性の予測が可能になる。これは、膨大な条件から選定・成形加工・評価を行う材料開発における大幅な高度化・高速化につながる。

概要

材料開発のさらなる高度化・高速化に向けて、現在、機械学習や深層学習(ディープラーニング)※1などの人工知能(AI)技術を活用したデータ駆動型の材料開発が盛んに行われている。これまでは、単純な化学構造を持つ低分子材料や無機材料に対して、元素や化学結合を元にしたAI技術※2によって、材料が持つ機能が予測されてきた。しかし、多くの材料系は多数の成分を含む複雑材料系であるため、比較的単純な元素や化学結合だけでは機能を予測することが困難だった。また、物理・化学構造が複雑に変化し、求められる機能も多元的になるため、材料の特徴を捉えた画像などの単独の計測データを用いた従来のAI技術では、予測できる特徴が限定的で、狭い範囲しか適用できなかった(図1)。

このような背景のもと、NEDO(新エネルギー・産業技術総合開発機構)は「超先端材料超高速開発基盤技術プロジェクト※3」(2016年度~2022年度)で、機能性材料開発の高速化を目指し、データ駆動を活用した研究を進めている。本事業で産業技術総合研究所(産総研)は、先端素材高速開発技術研究組合(ADMAT)、日本ゼオンと共同で、より汎用性の高い、複雑な構造を持つ材料へ適用できる革新的なマルチモーダルAI※4技術を開発した。これは図1に示すデータ駆動型の技術開発において、多元的な機能を持つ複雑材料を扱える右上の領域に位置する技術である。

マルチモーダルAI技術では、画像や分光スペクトルといった異なる種類のデータを計測・統合し、物理・化学構造の情報を広くAIに取り込むことができる(図2)。これによって、母材、添加剤、充填剤をさまざまな配合で持つために従来のAI技術を適用できなかった複雑材料系について、その特性予測に国内外で初めて成功した。マルチモーダルAI技術では、母材5種、添加剤2種、充填剤3種の組成のケースにおいては、1日で約10万条件分の複数の計測データの生成と特性の予測結果の出力が可能になる。開発したAI技術を用いることで、実際に実験に要する時間と比較して2万分の1以下の時間で特性予測が可能になり、膨大な配合条件などから選定・成形加工・評価を行う材料開発において大幅な期間短縮につながる。

図1 データ駆動型の技術開発の位置づけ
図2 開発した汎用仮想実験AIの概要

今回の成果

【1】AIによる複数の計測データの生成

今回開発した技術では、複数の異なる計測データへ敵対的生成ネットワーク(GAN)※5が適用された(図2)。GANはAI技術の一種で、複雑なデータが持つ特徴を学習し、疑似データとして画像などのデータを生成することができる。今回はGANを拡張させ、対応する配合における材料の物理・化学構造を反映した画像(図3-1)や分光スペクトル(図3-2)といった複数の計測データの生成を実現した。

図3 GANを用いた画像や分光スペクトルの生成

【2】複数のAIモデルを束ねた統合AIによる特性の予測

生成した異なる計測データを統合し、AIに取り込んで特性の予測が行われた(図2)。従来のような単独の計測のみの計測データを用いたAIと比較して、複数のAIを用いたモデルでは予測精度が向上した(図4)。単独の計測からなるAIでは、材料の物理構造や・化学構造の限られた情報しか得られないのに対し、複数のAIを用いる本技術では、多次元で幅広い情報を獲得し得る仕組みであるため、これまで困難であった複雑材料系へのAIの適用実現につながる。

図4 複数のAIを用いた特性の予測結果

従来の単独と複数(マルチモーダル)のAI技術を用いて、任意の材料について、異なる8種類の特性が予測された(図2と図5)。単独のAIでは、学習に用いたデータを元に予測しようとするものの、獲得できる材料情報が少ないためにテストデータ※6による予測が極めて低い精度を示した。これに対しマルチモーダルAIでは、テストデータにおいても獲得できる材料情報が多いために、特性を高い精度で予測できることがわかり、従来のAI技術と比較して、より複雑・複合的な材料開発への適用を実現した。

構築したAIモデルを用いると、非常に多様な条件における特性の変化を調べることができ、異なる成分の配合における特性をAIにより出力し、可視化された(図6)。例えば成分Bに注目すると、添加量の増加に伴って特性Xの予測値は低下するのに対し特性Yの予測値は向上し、その寄与が大きいことがわかる。本技術は、多数の成分の配合条件などを組み合わせて特性を制御する際に、特性の変化を確認できるだけではない。相反する特性がある場合には、両者の最適組成を制御したり、要求される特性の上限と下限を見極めたり、製造コストなどを考慮しながら配合やプロセスを調整する上でも有効である。マルチモーダルAIによる特性予測は、実際の材料の成形加工や評価と比較して、極めて高速に実行することができる。本技術は1日あたり、異なる配合条件などに対して約10万件の予測が可能。この速さは実験に要する時間の2万分の1以下に相当する。なお、本研究におけるAIの計算は産総研AI橋渡しクラウド(ABCI)※7を使用して行われた。

図5 複数のAIを用いた特性の予測精度の向上
図6 予測特性の推移の可視化

【注釈】

※1 深層学習(ディープラーニング) コンピューターに大量のデータを与えて複雑な特徴を認識させる技術で、人工知能分野に広く用いられている。その中で人間の神経回路(ニューロン)を模したシステムであるニューラルネットワークを多層にした手法をディープラーニングと呼んでいる。入力と出力の複雑な関係を結び付け、分類や予測したい問題に広く適用することができる。

※2 元素や化学結合を元にしたAI技術 例えば、低分子化合物や創薬の分野では、元素や化学結合から材料の特性や生理活性を予測する技術は、ケモインフォマティクスと呼ばれている。元素や化学結合を表した文字列、フィンガープリントや分子記述子と呼ばれるデータなどを用いた機械学習が行われてきた。

※3 超先端材料超高速開発基盤技術プロジェクト

※4 マルチモーダルAI 人間が五感という異なる感覚器で外部から入ってくる複数の情報を処理して高度な判断を行うように、複数のデータを組み合わせて入力と出力の複雑な関係を結び付け、分類や予測したい問題に適用する人工知能技術のこと。

※5 敵対的生成ネットワーク(GAN) GANはGenerative Adversarial Networksの略。ニューラルネットワークを用いて、入力されたデータや画像から新しい疑似データを生成するモデルをGANと呼んでいる。例えば、人の顔の持つ特徴を抽出して学習することで、実在しない人物の写真を生成することができる。二つのニューラルネットワークを互いに競わせて入力データの学習を進めていくことから敵対的ネットワークと呼ばれている。

※6 テストデータ AIを賢くするためにモデルに与えるデータは学習データ、学習データと異なるデータを与えた際の挙動を見てモデルの調整に使うデータは検証データ、学習・検証データに用いていない条件でモデルの性能を確かめるために使われるデータはテストデータと呼ばれている。ここではテストデータとして学習・検証データで全く用いていない材料の配合のデータを使い、構築したモデルの性能を調べている。

※7 産総研AI橋渡しクラウド(ABCI) ABCIはAI Bridging Cloud Infrastructureの略。人工知能技術開発に必要となる計算資源として、世界最大級の人工知能クラウドプラットフォーム。産総研が2018年8月に運用を開始した。

キーワードで検索する

著者プロフィール

Motor Fan illustrated編集部 近影

Motor Fan illustrated編集部