月曜日にネイチャー・コミュニケーションズ誌に掲載された研究によると、AIは化学者が従来のモデリング手法よりもはるかに速く結晶の分子構造を解明するのに役立つという。
スイスの研究機関、ローザンヌ連邦工科大学(EPFL)の科学者たちは、磁場にさらされたときに分子内の原子がどのように変化するかを予測する「ShiftML」と呼ばれる機械学習プログラムを構築した。
核磁気共鳴(NMR)は、化合物の構造を解明するために広く用いられています。原子団は特定の周波数で振動し、それぞれの原子に含まれる電子の数と位置を明らかにします。しかし、この技術は分子、特に数千もの異なる原子を含む複雑な分子の化学構造を完全に解明するには不十分です。
密度汎関数理論(DFT)と呼ばれる別の手法も必要です。これは複雑な量子化学計算を用いて特定の領域における電子密度をマッピングするため、膨大な計算量を必要とします。しかし、ShiftMLははるかに高速にこの処理を実行でき、場合によってはDFTプログラムと同等の精度で実行できます。
「比較的単純な分子の場合でも、このモデルは既存の方法よりほぼ1万倍高速であり、より複雑な化合物を考慮すると、その利点は飛躍的に増大します」と、論文の共著者でEPFL助教授のミシェル・セリオッティ氏は述べた。
「約1,600個の原子からなる結晶のNMR特性を予測するのに、私たちの技術であるShiftMLでは約6分しかかかりません。従来の技術では同じことをするのに16年かかっていたでしょう。」
認知コンピューティング:IBMは相変化材料を使って脳のニューロンをモデル化する
続きを読む
研究者たちは、ケンブリッジ構造データベースを用いてシステムを学習させた。これは、数千種類の化合物のDFT化学シフト計算データを含むデータセットである。各化合物は、炭素、水素、酸素、窒素を含む200個未満の原子から構成されている。学習と検証には2,000個の構造が使用され、残りの500個はテスト用に残された。
ShiftMLは、コカインと同じ化学元素を86個含み、異なる結晶構造を持つ分子の化学シフトを計算することに成功しました。この処理はCPU時間1分未満で完了しました。これは、DFTを用いて86個の原子を含む分子の化学シフトを計算するのに通常必要なCPU時間62~150時間と比較して大幅に短縮されました。
研究チームは、ShiftMLがNMR実験を補完し、新薬設計に活用できることを期待しています。「計算時間が大幅に高速化されることで、これまで不可能だったより広いコンフォメーション空間をカバーし、構造を正確に決定できるようになるため、非常にエキサイティングです。これにより、現代の複雑な薬物分子のほとんどが手の届く範囲になります」と、本研究の共著者であり、EPFLの化学教授であるリンドン・エムズリー氏は述べています。
ShiftMLはオープンソースです。「誰でも分子をアップロードして、わずか数分でNMRシグネチャを取得できます」とCeriotti氏は述べています。®