ディープマインドは木曜日、AIを活用したタンパク質折り畳みモデル「アルファフォールド」が2億個以上のタンパク質を予測したと発表した。これは科学的に知られているほぼすべてのタンパク質構造に相当する。
タンパク質は、DNAに記録された指令に基づいて生体内で生成される複雑な生体分子です。20種類ものアミノ酸から構成されるこれらのナノスケールの鎖は、あらゆる生体機能を果たすために細胞にとって重要な役割を担っています。タンパク質の三次元構造を理解することは重要です。その物理的構造は、タンパク質の挙動や役割を理解するためのヒントを与えてくれるからです。これは、医薬品の開発や、タンパク質を欠く人のための模倣タンパク質の作成などに役立ちます。
タンパク質には、食物の消化に関与するタンパク質のように有益なものもあれば、腫瘍の成長に関与するタンパク質のように有害なものもあります。しかし、それらの複雑に曲がりくねった形状を解明するのは困難です。分子生物学者はタンパク質の構造を解読するために何年も実験を繰り返すことがありますが、AlphaFoldは分子の大きさにもよりますが、アミノ酸組成から数分で構造を解明することができます。
AlphaFoldは数十万種類の既知のタンパク質構造を学習し、構成アミノ酸と最終的な全体形状の関係を学習しました。任意のアミノ酸配列を入力すると、このモデルは3Dタンパク質構造を予測できます。現在、このモデルは科学的に知られているほぼすべてのタンパク質構造を予測しています。
DeepMindの最新のタンパク質解析AI「AlphaFold」は、生物学の50年来の難問の解決に一歩近づいた。
以前
DeepMind は、欧州バイオインフォマティクス研究所と連携して、AlphaFold タンパク質構造データベースを拡張し、動物から植物、細菌からウイルスに至るまで 2 億個を超えるタンパク質の 3D 形状を収録しました。これは、わずか 1 年で分子数が 100 万個近くから 2 億個以上に 200 倍以上増加したことになります。
「この画期的なリソースが、世界中で科学研究と発見を加速させ、他のチームがアルファフォールドで私たちが成し遂げた進歩から学び、それを基にしてさらなる飛躍的進歩を生み出すことを期待しています」とディープマインドの共同創業者兼CEO、デミス・ハシビス氏は木曜日の声明で述べた。
その希望は、私たちが夢見ていたよりもはるかに早く現実のものとなりました。わずか12ヶ月後、AlphaFoldは50万人以上の研究者によって利用され、プラスチック汚染から抗生物質耐性に至るまで、現実世界の重要な問題解決の加速に役立っています。
The RegisterはDeepMindにさらなるコメントを求めた。
AlphaFoldは、新薬の設計においても大きな可能性を示しています。この構造は、標的タンパク質に結合して病的な機能を治療または阻害する化合物を解明する上で、科学者の助けとなります。Insilico Medicineをはじめとする企業が、このモデルを用いて新薬の発見に取り組んでいます。CEOのアレックス・ザヴォロンコフ氏はThe Register紙に対し、このプロセスは想像以上に複雑で、複数のステップを踏むと語りました。
AlphaFoldの予測がどれほど正確であるかは明らかではない。タンパク質のリボン状構造は薬剤と相互作用するとしばしば形状を変えるが、AlphaFoldはこの点について学習していないため、科学者の助けにはならない。ザヴォロンコフ氏は、このモデルは「非常に注目すべきブレークスルー」だとしつつも、過剰な宣伝には警戒感を示した。
「アルファフォールドによって、追加の実験なしで、大きな病気の新たな標的の構造が得られ、その予測構造を使ってAIや他の方法を使って分子が設計され、合成され、最後までテストされ、一流の学術誌に掲載されるまでは、祝うことはできません。」
大手製薬会社は、AlphaFoldのようなAIツールの助けを借りて設計された分子が実際にマウスやヒトで試験されることを望んでいます。「純粋なアルゴリズムによる成果は、製薬会社、特に患者にとって価値がありません」とザヴォロンコフ氏は付け加えました。
希少遺伝性疾患の治療薬開発に機械学習アルゴリズムを活用するスタートアップ企業、コラボレーション・ファーマシューティカルズのシニアサイエンティスト、ファビオ・ウルビナ氏は、AlphaFoldが自身の研究においてまだ有用性を発揮していないと述べた。ウルビナ氏は異なる技術を用いており、標的タンパク質よりも、潜在的な新薬の構造に重点を置いている。
タンパク質構造が希少疾患の新しい薬を発見するのに役立つかどうかはまだ分からない。
「これにはいくつかの理由がある。多くの薬剤ターゲットのタンパク質構造は研究者にとって容易に入手できるものではなかったし、タンパク質情報は初期の機械学習モデルの予測力を大幅に向上させるのに役立たなかったようだ」と彼はThe Registerに語った。
AlphaFoldが最初の問題を本質的に『解決』したと、私は慎重ながらも楽観的に見ています。しかし、タンパク質構造が、機械学習の予測力を向上させ、希少疾患の新たな治療薬の発見を支援するという、下流のアプリケーションにおいて十分に役立つかどうかはまだ分かりません。しかしながら、タンパク質構造情報が新しい機械学習手法の一部として考慮されることが増えており、私たちも同様のことを検討しています。
DeepMindが約束したように、既知のタンパク質構造をほぼ全て網羅したデータベースを公開することで、より多くの科学者が実験を行い、より強力なAIモデルを構築するためのリソースを得られるようになると、Urbina氏は述べた。「私は慎重ながらも楽観的ですが、タンパク質構造のライブラリ全体が利用可能になったことで、AlphaFoldの構造が私たちの機械学習モデルの一部に組み込まれ、最終的には新しい治療法の発見に役立つ可能性は高いと言えるでしょう。」®