マイクロソフトと同様に、グーグルもクラウドでAIをユーザーの頭上に注ぎ込むのを止めることはできない

Table of Contents

マイクロソフトと同様に、グーグルもクラウドでAIをユーザーの頭上に注ぎ込むのを止めることはできない

Googleは水曜日、ユーザーが試用し、場合によっては導入できるように、一連のAIモデルをクラウドプラットフォームに公開した。

その一つが、先週開発者や企業向けに発表されたテキスト生成システム「Gemini Pro」です。他のモデルとしては、Googleの画像生成システム「Imagen 2」と、医療関連の生成AIツール「MedLM」シリーズがあります。

これらの製品は、Googleがこれまでで最も強力な大規模言語モデルアーキテクチャを搭載するとされるコンテンツ生成モデルのコレクションであるGeminiのリリースに続くものです。これは、MicrosoftやGoogleを含むクラウドおよびビジネスIT業界の大手企業が、機械学習の強化と称して自社製品を次々と投入した後のことです。これは2023年、そしておそらく2024年、そして残念ながら2025年も続くテーマです。

Geminiには、デバイス上のワークロード向けのNanoから、バックエンドサーバーでの高負荷処理向けのUltraまで、様々なサイズが用意されています。先週水曜日に発表された中規模のGemini Proは、Google CloudのVertex AIが提供するAPIを介してプレビュー版としてアクセスできるようになりました。開発者はこのリモートインターフェースを使用して、Gemini Pro上に独自のチャットボットアプリケーションを構築できるとのことです。プログラマーは、プロンプトを慎重に設計することでモデルを適応させ、独自のデータで微調整し、他のAPIに接続して特定のタスク向けの動作や機能をカスタマイズできます。

アプリに自然言語インターフェースを組み込みたい場合は、OpenAI の ChatGPT などを使用するのと同じように、Gemini Pro を使用できます。

Gemini Proの詳細については、開発者向けの姉妹サイトDevClassをご覧ください。

Googleは本日、プログラマーの生産性向上(効果は人それぞれ)を目的としたチャットボットサービス「Duet AI for Developers」の一般提供を開始したと発表しました。これはよくあるプログラミングアシスタント機能です。様々なIDEに対応し、開発者の入力に合わせてソースコードを自動補完したり、コーディングに関する質問に答えたり、トラブルシューティングを支援したり、MongoDB、Crowdstrikeなどのサードパーティ製ソフトウェアの使い方ガイドを提供したりといった機能を提供するとのことです。

実際、25 社を超えるサプライヤーが Google と協力し、自社製品が Duet AI for Developers に理解され、カバーされるように努めているとのことです。

「例えば、MongoDBを使用してコードを書く開発者は、Duet AI for Developersに『過去30日間の50ドル以上の顧客注文を地域別にフィルタリングし、地域別の総売上を計算してください』と依頼することができます。すると、Duet AI for DevelopersはMongoDBの製品からの情報を使用して、タスクを完了するためのコードを提案するので、開発者はさらに迅速に開発できるようになります」とGoogle副社長のゲイブ・モンロイ氏は説明した。 

今後数週間のうちに、Duet AIサービス全体を支える大規模言語モデルもGeminiにアップグレードされます。開発者向けサービスは現在、2024年1月12日まで無料でご利用いただけます。

セキュリティ オペレーションにおける Duet AI も一般提供が開始されました。これは、インフラストラクチャの保護、ネットワーク ログの分析などに関するクエリを処理するために構築されたチャットボット サービスです。

  • GoogleのProject Ellman:写真と検索データを統合してデジタルツインチャットボットを作成
  • GoogleがAlphaCode 2を発表 – Geminiで刷新されたコード生成AI
  • GoogleがGemini AIシステムを発表、OpenAIなどを大きく上回ると主張
  • Google、AIトレーニングを加速するTPU v5pポッドを発表

デジタルアートやロゴの作成など、視覚的なタスクにAIを活用したい企業は、Vertex AIから一般提供が開始されたImagen 2を検討してみる価値があるかもしれません。このテキスト画像変換ツールはGoogle DeepMindのエンジニアによって開発され、最新バージョンでは、ブランドプロモーションのためのフォトリアリスティックな画像の生成とテキストのより正確なレンダリングがさらに向上していると、Bumfは述べています。また、キャプションの作成や画像に関する質問への回答も可能です。

ソーシャルアプリのSnapchat、グラフィックデザインプラットフォームのCanva、ストック画像サイトのShutterstockは既にImagenを使用しているとのことです。Imagen 2で生成されるすべての画像には、SynthIDというデジタル透かしが埋め込まれます。これは肉眼では見えず、コンピューターで検出することで合成画像であることを識別できると言われています。

ロボット

Copilot を手に入れれば、Copilot を手に入れられます – Microsoft は Copilot の会社になりまし

その間

ついにGoogleは、医療分野における医療利用に特化した大規模言語モデル「MedLM」を発表しました。2つのモデルがあり、どちらもGoogleのMed-PaLM 2システムに基づいています。

片方はもう片方よりも規模が大きく、より高性能で、学術論文や文書を精査して新薬候補の糸口を見つけるといった複雑なタスク向けに設計されています。もう片方は、医師と患者の会話の要約や医療に関する質疑応答といった、より簡単なタスクに対応しています。

MedLM モデルを早期に導入した企業には、クリニックの HCA Healthcare、医薬品設計会社の BenchSci、Accenture、Deloitte などがあります。®

Discover More