AIよ、戻ってきてくれ。全て許す。過去に君を嘲笑したことは承知しているが、COVID-19とコロナウイルスに関する2万6000件の論文を分析するのに協力が必要だ。

Table of Contents

AIよ、戻ってきてくれ。全て許す。過去に君を嘲笑したことは承知しているが、COVID-19とコロナウイルスに関する2万6000件の論文を分析するのに協力が必要だ。

COVID-19およびコロナウイルス科全体に焦点を当てた29,000件を超える科学論文のデータセットが公開され、最終的には医療界が生物学的脅威を阻止するのに役立つことになる。

具体的には、COVID-19オープンリサーチデータセット(CORD-19)を徹底的に調べ、ウイルスの治療と封じ込めの方法に関する重要な手がかりと洞察を掘り出すためのAIベースのツールが開発されることが期待されています。

アメリカのジョージタウン大学のセキュリティおよび新興技術センターの人々が、ホワイトハウス主導の取り組みを主導し、マイクロソフト、米国国立衛生研究所の国立医学図書館、およびチャン・ザッカーバーグ・イニシアチブに協力を依頼して、データセットの関連文献を大量に収集した。

その後、データは、マイクロソフトの共同創業者である故ポール・アレン氏が設立した研究機関であるアレンAI研究所(AI2)に渡され、アルゴリズムが処理できるよう機械が読み取り可能な形式に変換されました。

「このデータセットは自然言語処理の研究者によって最も活用されるだろう」とAI2のセマンティック・スカラー部門ゼネラルマネージャー、ダグ・レイモンド氏はThe Registerに語った。

2015年にリリースされたSemantic Sc​​holarは、様々なAI技術を駆使して膨大なジャーナル記事から情報を発掘する専門検索エンジンです。CORD-19は現在、Semantic Sc​​holarのサイトでご利用いただけます。

「ユーザーはこの包括的なデータセットを用いて、これまでどのような研究が行われてきたのか、その研究で何が説明されているのか、結果をどのように再現するのかなど、様々な疑問に答えることができます」とレイモンド氏は付け加えた。「私たちは数百誌のジャーナルから論文を提供しており、その多くは中国と韓国のものです。この新しいマスターリソースを使わなければ、研究者が包括的な情報を見つけることは非常に困難です。状況の変化や新たな研究の発表に応じて、このデータセットを継続的に更新していきます。」

このデータセットは、Google傘下でオンラインコーディングコンテストで知られるKaggleでもホストされています。Kaggleは、CORD-19を精査するための新たなテキストマイニングツールとデータマイニングツールの開発に協力する「人工知能の専門家」を募る新たなコンテストを立ち上げました。

「2万件以上の論文を手作業で調べて結果をまとめるのは難しい」とKaggleの共同創業者兼CEOのアンソニー・ゴールドブルーム氏は語る。

サンフランシスコのコロナウイルス

トランプ大統領のCOVID-19検査ウェブサイト開設の誓約に「何だって?」と首をかしげた週末の後、Google-Verilyのサイトがついに始動…そして約束とは違った

続きを読む

「近年の技術進歩は、ここで役立つ可能性があります。私たちは、これらの論文の機械可読版を、400万人を超えるデータサイエンティストのコミュニティに提供しています。AIを活用して、COVID-19に関する重要な疑問への答えを見つけられることを願っています。」

医療関係者が、Semantic Sc​​holar 製か特注品かを問わず AI ツールをデータセットと組み合わせて使用​​し、進行中のコロナウイルスのパンデミックと闘うために必要な情報 (ウイルスがどのように変異して広がるのか、潜在的なワクチンを開発するにはどのような種類の薬剤が最も効果的かなど) を入手できるようになることが期待されています。

パンデミックの間、小規模なテクノロジー企業も貢献しようと努めている。機械学習モデルの実行用にGPUとCPUをレンタルするクラウド企業Paperspaceは、自社のハードウェアリソースの一部を無償提供すると発表した。

「COVID-19に関連した研究であれば、特定の研究を支援するつもりはありません」と、ペーパースペースの広報担当者はEl Reg紙に語った。「機械学習とディープラーニングが解決策を加速させてくれることを心から期待しています。」

NVIDIAのQuadro M4000(2015年発売)やP5000(2017年発売)といった旧型のGPUモデルで起動されたクラウドインスタンスは無料です。後期型のV100やP100など、より高性能なチップについては、価格が大幅に引き下げられています。

「COVID-19の予防、検出、治療、そして解決策の開発には、アメリカの科学技術企業による断固たる行動が不可欠だ」とアンクル・サムのCTO、マイケル・クラツィオス氏は述べた。

ホワイトハウスは、この全員参加型の取り組みにおいて、引き続き強力なパートナーであり続けます。各機関が自発的に専門知識と革新性を提供してくれたことに感謝するとともに、米国の研究コミュニティに対し、新型コロナウイルスに関する重要な科学的疑問の解明に人工知能技術を活用するよう呼びかけます。®

Discover More