友田:私は2023年7月に中途採用で入社しました。前職は化学メーカーで車載用リチウムイオン電池の開発に従事していましたが、ドイツに出向して大掛かりなデータサイエンス分野の仕事を経験したことを機に、データ駆動開発に興味を持つようになりました。その後この分野に本気で取り組みたいという思いが強くなり、ダイキンに移りました。いまTICではデータ基盤チームのリーダーとして、データベースの構築や、その周辺のデータ基盤の開発を担当しています。
友田:私は2023年7月に中途採用で入社しました。前職は化学メーカーで車載用リチウムイオン電池の開発に従事していましたが、ドイツに出向して大掛かりなデータサイエンス分野の仕事を経験したことを機に、データ駆動開発に興味を持つようになりました。その後この分野に本気で取り組みたいという思いが強くなり、ダイキンに移りました。いまTICではデータ基盤チームのリーダーとして、データベースの構築や、その周辺のデータ基盤の開発を担当しています。
前編でも少し話が出ましたが、有機高分子材料(ポリマー)は構造が複雑で、MIを導入する際に設計データの入出力が関連付けられていないため、新開発が進まない分野でした。同じ組成でも重合やサンプル作製の条件などで構造が変化するため、物性値も変動してしまいます。またポリマーは他の部材に比べてシミュレーションの精度が低いという課題もありました。
そこで良質かつ大量のデータを生成する技術と、高精度な物性予測技術を構築することで、材料候補を高効率に探索するMI活用を目指しました。そのために自動分子シミュレーションと、ロボットを駆使した自動実験を軸に技術開発を進めました。今回の取り組みでは、高分子・複合材料を対象にしていますが、その中でも高周波向け基板材料をターゲットに設定しました。
まずコンピュータ上で分子シミュレーションを実施し、分子構造を入力として目的となる物性を自動計算し、分子構造から物性を予測する機械学習モデルを構築しました。そこから希望する物性(低誘電率・低誘電正接・低線膨張係数)にするために、逆にどのような分子構造ならば有望かを探索・提案し、新材料の開発を行えるようにしました。
具体的には50万種ものポリマー構造に対し、機械学習で1000種まで絞り込み、さらに代理指標の活用によって多段階スクリーニングを実施することで、最終的に30種類の候補となる分子構造を発見しました。従来の方法でシミュレーションを行って選定しようとすると、とんでもない時間を要しますが、このアプローチの場合は3カ月ほどで効率的に絞り込めるようになりました。
また、ロボットを駆使した自動実験のプロトタイプも東大の研究室と構築しました。これは、人間が手作業に頼っていたサンプル加工から物性測定(誘電率)に至る一連の工程を自動化したシステムです。サンプル移動用のベルトコンベアを採用し、ロボットアームと各種装置を連携させて、人と同等の精度で物性値を再現性高く測定でき、併せて該当の実験データも蓄積可能です。
今回、見出した新材料は、これから次世代通信として普及していくであろう5G・6G分野で活用できる有望な候補材料になるでしょう。
その一方で、データ基盤を内製化しようとすると、化学とはまったく異なる技術が必要になります。この材料開発に特化したデータ基盤は、データベース、データパイプライン、データマートなどの要素をすべてプライベートクラウド上(AWS)で構築しています。実験データを手元のExcelだけで処理するのではなく、可視化/解析ツールと連携して結果を簡単に出力し、それらを研究者チームと共有・蓄積しながら活用できるようにしました。
システム開発に関しては、外部に委託すると手戻りが発生しやすく、またブラックボックス化する恐れがあるため、内製することにしました。幸いダイキンのTICには、データ活用と情報技術の専門部隊がいました。新技術を試せるクラウド環境も整備され、ベストプラクティスの共有も頻繁に行われていました。情報技術の専門家が同じ部署にいることはダイキンの強みのひとつです。化学と情報の技術者が連携し、同じ目線で化学研究開発というニッチな分野のデータ基盤を半年で開発できました。
――クラウドを活用して実験データを効率よく体系的に収集・分析するデータパイプラインの仕組みについて教えてください。