PLOS One に掲載された論文によると、AI は科学者が小さな折り畳みタンパク質結晶を見つけるのを手助けし、将来的には研究者による新薬設計を支援する可能性があるという。
この種の科学的な研究が可能であることを実証するため、米国のデューク大学、グーグル、英国の製薬大手グラクソ・スミスクラインの研究者を含む、学界と産業界の大規模な研究者チームが、微細なタンパク質結晶を認識する畳み込みニューラル・ネットワークを構築した。
このプロジェクトは、X線結晶構造解析実験からタンパク質結晶の写真を収集する国際的な取り組みである結晶化結果の機械認識(MARCO)イニシアチブによって開始されました。
時間の経過とともに、493,214枚のタンパク質結晶画像が収集され、そのデータセットはGoogleの研究者と共有され、ニューラルネットワークの学習とテストに使用されました。50,284枚の画像でテストした結果、システムは溶液中のタンパク質結晶の存在を94%の精度で検出することができました。
タンパク質は、アミノ酸が連続して結合した複雑な分子です。ホルモンの伝達やウイルスからの防御といった身体機能において重要な役割を果たします。
タンパク質を研究・理解し、医薬品開発に役立てる上で重要なステップの一つは、これらの分子を結晶化することです。問題は、実験室環境では結晶を見つけるのが容易ではないことです。そのため、結晶の検出を支援する機械学習システムが必要になります。
科学者たちはDNA分子から作られたニューラルネットワークを構築している
続きを読む
MARCOイニシアチブによると、「タンパク質の構造が分かれば、その生物学的機能を理解することができ、新たな治療法の開発につながる可能性があります。したがって、タンパク質結晶を得ることは、生命の起源を解明し、疾患を治療するための重要な第一歩です。」
これは非常に面倒な作業です。タンパク質を分類するためには、科学者はまずタンパク質を単離し、適切な溶液の配合で適切に培養する必要があります。この培養液中で新たなタンパク質が形成される可能性は低く、結晶学者が顕微鏡で液体の滴を観察する際に、タンパク質を見逃してしまうことも少なくありません。
ここでニューラルネットワークの出番です。ニューラルネットワークは科学者が滴の画像を調べ、結晶、沈殿物、透明、その他という4つのクラスに分類するのに役立ちます。理想的には、自律的なアルゴリズムによってエラーが削減され、研究がスピードアップします。
「タンパク質結晶は非常に希少であるため、見逃すたびに重要な生物医学的発見を見逃すリスクがある」と、デューク大学化学准教授でMARCOイニシアチブのリーダー研究者であるパトリック・シャルボノー氏は先月末に語った。
データは公開されており、チームはモデルをオープンソース化しました。このモデルはTensorFlowを使用して記述されており、ネットワークの学習には19時間のNvidia K80 GPU 50基が必要でした。®