Googleは、AIの助けを借りて、英語話者のウェブ検索が10%向上すると主張している。

Table of Contents

Googleは、AIの助けを借りて、英語話者のウェブ検索が10%向上すると主張している。

Google は検索アルゴリズムを更新し、従来のシステムよりもネットユーザーのクエリをよりよく理解できる AI 言語モデルを活用した。

Google フェロー兼検索担当副社長の Pandu Nayak 氏は今月、Chocolate Factory がその最も基本的な製品である Google 検索に BERT (Bidirectional Encoder Representations from Transformers) を導入したことを発表しました。

これらすべてを実現するために、Google AIの研究者たちはTransformerと呼ばれるニューラルネットワークを構築しました。このアーキテクチャはデータ内のシーケンス処理に適しており、言語処理に最適です。文を理解するには、文中のすべての単語を特定の順序で見なければなりません。従来のTransformerモデルは単語を左から右の一方向のみで考慮していましたが、BERTは文全体の文脈を遡って考慮することができます。

「BERTモデルは、単語の前後の単語を見ることで単語の完全な文脈を考慮することができます。これは、検索クエリの背後にある意図を理解するのに特に役立ちます」とナヤック氏は述べた。

たとえば、「2019 ブラジル旅行者が米国に渡航するにはビザが必要」とクエリを実行した場合、以前の Google 検索と新しい BERT を利用した検索は次のようになります。

google_search_before_after

左:以前のGoogle検索では、検索クエリを「ブラジルに向かうアメリカ人旅行者」と誤認識しています。右:BERTを使用した新しいGoogle検索では、検索クエリが「アメリカに向かうブラジル人旅行者」であると正しく認識しています。画像提供:Google

BERTは、新しい検索における「to」という単語の意味をより適切に理解しています。以前のモデルでは、ブラジルへ旅行するアメリカ人旅行者の情報を表示する結果が表示されていましたが、その逆ではありませんでした。しかし、BERTの精度には多少ばらつきがあるようです。今日のGoogle検索では、依然としてブラジルへの旅行を希望するアメリカ人旅行者の情報が表示されるようです。

現在のGoogle検索

「2019年にブラジルから米国へ渡航する旅行者はビザが必要」というクエリの現在の検索結果。この文は依然として、米国人旅行者がブラジルへ渡航することを意味すると解釈されています。

The Register紙がGoogleにこの件について問い合わせたところ、広報担当者は次のように答えました…スクリーンショットは単なるデモです。状況によって結果は異なる可能性があります。

「正確な例をご覧いただけないという点についてですが、今回お見せした比較画像は評価プロセスから得たものであり、実際の検索画面で表示されるものと完全に一致するとは限りません」と広報チームは説明しました。「これらは評価プロセスから得た比較画像であり、BERTがクエリをより適切に理解できる特定の種類の言語理解の課題を特定した際に使用したもので、主に説明的なものです。」

ハッピーコンピュータ

AIオタクの皆さん、ご注意ください。Google Cloudの不具合により、一部の仮想マシンの推定請求額にNvidia T4 GPUが含まれなくなりました。

続きを読む

検索は動的で、ウェブ上のコンテンツは変化します。そのため、どの時点でも、どのクエリに対しても、必ずしも予測可能な結果が表示されるとは限りません。ウェブは常に変化しており、私たちも年間を通してアルゴリズムを頻繁にアップデートしています。

ナヤック氏は、BERTによって検索全体の10%が改善されると主張した。最も大きな変化は、文中に「for」や「to」といった前置詞が散りばめられた長いクエリで見られるようだ。

「BERT により、米国での英語による検索の 10 件中 1 件をより正確に理解できるようになります。今後、これをさらに多くの言語と地域に展開していく予定です」と彼は述べた。

GoogleはBERTを自社製のCloud TPUチップ上で実行する予定ですが、モデルの動作に必要なチップ数は明らかにしませんでした。現在最も強力なCloud TPUオプションは、64個のASICを搭載し、各ASICは420テラフロップスの性能と128GBの高帯域幅メモリを搭載するCloud TPU v3 Podです。

現時点では、BERTは英語で行われたクエリで最も効果的に機能します。Googleによると、韓国語、ヒンディー語、ポルトガル語など、24か国以上の言語でもテキストの「注目スニペット」として機能しています。®

Discover More