Googleは数字を操作してAIの渇望度を低く見せようとしている

Table of Contents

Googleは数字を操作してAIの渇望度を低く見せようとしている

Googleが新たに発表したレポートによると、AIの水飲み習慣は大幅に誇張されていたという。同レポートでは、ソフトウェアの進歩により、ジェミニの1回の水の消費量は約5滴にまで削減され、これまでの推定よりも大幅に減少したと主張している。

Google は、新しい総合的なテスト手法を誇示し、Gemini アプリが平均の長さのテキスト プロンプトを生成するために 0.24 ワット時の電力と 0.26 ミリリットル (ml) の水を消費すると推定しています [PDF]。

Google は、これは Mistral AI とカリフォルニア大学リバーサイド校の研究者が、Mistral Large 2 や GPT-3 のような中規模モデルを使用しておよそ 1 ページ分のテキストを生成するのに必要な水量 45 ~ 47.5 ml よりはるかに少ないと指摘している。

しかし、カリフォルニア大学リバーサイド校の電気・コンピュータ工学准教授で、Googleの報告書で引用された論文の著者の一人であるシャオレイ・レン氏によると、Googleの主張は、現場での消費量と全体の水消費量を誤って同等視しているため、誤解を招くものだという。

その理由を理解するには、データセンターが敷地内と敷地外の両方で水を消費していることを知っておくことが重要です。

電力を大量に消費する施設では、多くの場合、冷却塔が使用されています。冷却塔は、ポンプで送り込まれた水を蒸発させます。このプロセスにより、施設に入る空気が冷却され、CPUやGPUの過熱を防ぎます。水を使用する方が冷媒よりも電力効率に優れています。Google自身の推計によると、データセンター周辺の流域から汲み上げられる水の約80%が、データセンターの蒸発冷却に消費されています。

しかし、大量のサーバーを稼働させるために必要なエネルギーを生成する過程でも水は消費されます。データセンターと同様に、ガス、石炭、原子力発電所にも冷却塔が設置されており、これも(ネタバレ注意)大量の水を使用しています。そのため、直接水を消費しないデータセンターであっても、地域の流域に大きな影響を与える可能性があります。

レン氏は、問題はGoogleが社外の水消費量を全く考慮していなかったことではないと強調する。検索大手がリンゴとオレンジを比べたことこそが問題なのだ。新しい数字は社内の水消費量のみであるのに対し、「信用できない」数字にはすべての水消費量が含まれている。

「現場での水の消費量に焦点を当てたい場合は問題ありませんが、そうする場合は、現場のデータを以前の作業の現場データと比較する必要もあります。」

Googleはそうしなかった。また、カリフォルニア大学リバーサイド校の調査に現地での推定が含まれていなかったわけでもない。Googleは同一条件での比較を行うこともできたのに、そうしなかったとレン氏は主張する。

「彼らのやり方は、グーグルの論文はもちろん、あらゆる論文に期待される最低基準を満たしていない」と彼は語った。

カリフォルニア大学リバーサイド校が 2023 年に発表した論文「AI の水の渇きを軽減: AI モデルの隠れた水フットプリントの発見と対処」では、米国の平均的なデータセンターのオンサイト水消費量をリクエストあたり 2.2 ml と推定しています。

カリフォルニア大学リバーサイド校の論文からわかるように、現場での水分消費量はGoogleの報告書で引用されている1回あたり50mlよりもはるかに少ない。

カリフォルニア大学リバーサイド校の論文からわかるように、現場での水分消費量は、Googleの報告書で引用されている1回あたり50mlよりもはるかに少なかった。(クリックして拡大)

グーグルが論文で50ミリリットルとしている1リクエストあたり47.5ミリリットルという水消費量は、レン氏のチームが記録した最高の水消費量であり、米国平均の2.8倍に相当した。

「彼らは合計を選んだだけでなく、18か所の中で最高の合計を選んだのです」とレン氏は語った。

Google は比較に関する私たちの質問に答えず、代わりにカリフォルニア大学リバーサイド校の研究者による以前の研究結果に欠陥があるとして信用できないとする声明を出しました。 

「カリフォルニア大学リバーサイド校の研究における主張を検討した結果、当社の水資源エンジニアと水文学者は、その主張と手法に欠陥があると結論付けました」と、Googleのインフラ戦略・持続可能性担当責任者であるベン・タウンゼント氏は声明で述べた。「カリフォルニア大学リバーサイド校の一般化された研究における重大な欠陥は、電力網の電力供給が主に従来の水冷式火力発電所によって行われていると想定していることです。これはGoogleのデータセンターの運用には当てはまりません。」

Google がカリフォルニア大学リバーサイド校の論文から敷地内および敷地外の水使用に関するデータを取り入れた理由については、検索大手は明らかにしていない。

  • 干ばつが発生しています。英国政府は古いメールを削除して水を節約することを提案しています。
  • Googleは、電力需要の急増時に電力網を保護するためにAIワークロードを一時停止することに同意した。
  • データセンターの水消費量と、その習慣を断つのがほぼ不可能な理由
  • 迫り来るエネルギー危機によりデータセンターの将来は不透明

グーグルが主張するプロンプトあたり0.26mlは、カリフォルニア大学リバーサイド校の米国データセンターの現場平均2.2mlよりはまだ大幅に低いが、レン氏はこれらの数字が2023年に初めて公表されたことを強調している。

もしグーグルが本当にジェミニのエネルギーフットプリントを過去1年間で33分の1に削減できたとしたら、レン氏のチームが結果を発表した時点でもこのモデルの水効率ははるかに悪かったということを意味することになる。

AIワークロードが時間とともに効率化していくという考えは驚くべきことではないとレン氏は指摘する。当初の論文では、彼のチームは水とエネルギーの消費量の改善を予測していた。®

Discover More