DeepMindはAIでゲームをするのはやめ、機械学習コードでタンパク質の賭け金を上げる

Table of Contents

DeepMindはAIでゲームをするのはやめ、機械学習コードでタンパク質の賭け金を上げる

DeepMind の研究者たちは、科学者がより迅速に新薬を設計するのに役立つことを期待して、AI ソフトウェアを使用してタンパク質がどのように折り畳まれるかを研究しています。

人体は数千種類もの異なるタンパク質を生成し、それぞれが独自の形状をしています。アミノ酸はわずか20種類しかありませんが、それらは天文学的な数の方法で構成されています。

タンパク質の配置は、結果として得られるタンパク質の働きや役割に影響を与えます。例えば、抗体タンパク質はウイルスや細菌に引っ掛かり、排除のために目印を付けます。タンパク質の構造を解明することで、研究者たちはこれらのタンパク質を模倣した化学物質を含む薬を開発し、人々の健康を改善することができます。

子供たちはミルクシェイクを飲む

Google: 私たちのDeepMind健康食品は完全に合法です

続きを読む

しかし、特定のタンパク質の3D構造を解明するには、膨大な作業が必要です。タンパク質の形成方法に関する指示はDNAにコード化されていますが、これらの指示は、最終的に複雑なタンパク質構造へと折り畳まれるアミノ酸残基からなる長いポリペプチド鎖の形成方法を体に伝えるに過ぎません。

どのように折り畳まれるかは明らかではないため、難しいのは特定の酸の鎖から最終的に折り畳まれた形を解明することです。そのため、遺伝子配列からタンパク質がどのように形成されるかを解明することをタンパク質折り畳みと呼びます。

アメリカの分子生物学者サイラス・レビンサルは、単一のポリペプチド鎖の折り畳みの組み合わせをすべてモデル化するには宇宙の年齢よりも長い時間がかかるだろうと考えていました。

AlphaFoldが参入

ここでDeepMindのAlphaFoldが役に立つかもしれません。AlphaFoldは、タンパク質を構成するアミノ酸から3D構造を予測する3つの異なるニューラルネットワークで構成されています。これらのシステムは、アミノ酸のペア間の正確な距離と角度を決定します。別のモデルは、提案された構造の精度を判定します。

科学者たちは、X線結晶構造解析からクライオ電子顕微鏡法に至るまでの技術を駆使し、あるいは長年にわたり、ボランティアのマシン群の余剰プロセッササイクルを活用して、様々なタンパク質構造を解明してきました。タンパク質データバンク(PDB)には14万6000種類のタンパク質が登録されており、DeepMindはそのうち2万9000種類をニューラルネットワークの学習に使用しました。

タンパク質の計算には2つの方法があります。1つは「テンプレートベースモデリング」、もう1つは「フリーモデリング」と呼ばれます。

「新たな標的配列の構造を予測する際の標準的な戦略の一つは、PDBデータベースを調べて、類似の配列と既知の構造を持つタンパク質があるかどうかを確認することです」と、AlphaFoldのチームリーダーであるアンドリュー・シニア氏は水曜日にThe Register誌に説明した。「もしあれば、その類似配列のPDB構造を『テンプレート』として使い、標的配列と一致するように調整するのが良い戦略です。」

しかし、テンプレートベースのモデリングは、比較可能な既知のタンパク質が存在する場合にのみ機能します。そのようなタンパク質がない場合、開発者はフリーモデリングに頼ってゼロから構造を構築する必要があります。ここでDeepMindのニューラルネットワークソフトウェアが登場し、与えられたアミノ酸セットから新しい構造を生成し、その精度を評価します。

garry_kasparov_shutterstock

AIに勝とうとするのではなく、AIと融合すべきだとチェスチャンピオンのガルリ・カスパロフは言う

続きを読む

「どんなタンパク質でもモデル化することはできるが、その精度は多くの要因によって変化する」とシニア氏は語った。

「長いタンパク質や、配列データベースに類似の配列が見つからないタンパク質はモデル化が難しいため、私たちは球状タンパク質に重点を置いてきました。膜タンパク質ではかなり良い結果が得られましたが、繊維状タンパク質や無秩序なタンパク質では、このシステムがうまく機能するとは期待していません。」

このアイデアをテストするために、DeepMindの研究者は、最新のタンパク質折り畳み技術をテストするコンテストであるフリーモデリングCASP(タンパク質構造予測の批判的評価)に「A7D」で参加し、優勝した。

DeepMindのCEO兼共同創業者であるデミス・ハサビス氏は、El Reg紙に対し、同社の手法は最先端ではあるものの、タンパク質の折り畳み構造の問題はまだ解決されていないと語った。「生物学者にとって有用なものにするためには、さらに精度を高める必要があります」と彼は述べた。

DeepMindは2年間この問題に取り組んできました。囲碁、チェス、将棋といったゲームを制覇するシステム構築における成功が、タンパク質フォールディングにも応用できることを期待していました。しかし、AlphaFoldはAlphaGoやAlphaZeroとは異なり、強化学習を採用していないため、その実現は未知数です。「最終的には強化学習を取り入れたいと考えています」とハサビス氏は語りました。®

Discover More