DeepSeekはテクノロジー業界全体に好奇心と疑念を巻き起こす

Table of Contents

DeepSeekはテクノロジー業界全体に好奇心と疑念を巻き起こす

GenAIにとって慌ただしい一週間となった今、テクノロジー業界は法学修士課程(LLM)界に新たに参入した企業の影響を慎重に見極めようとしている。中国のDeepSeekは月曜日、株式市場に衝撃を与え、かつてAIの黄金時代を担っていたNVIDIAの時価総額を6,000億ドルも下落させた。

騒ぎが収まり市場が回復するにつれ、業界ではその影響や​​、中国の見かけ上の AI 復興が本当に見た目通りのものなのか疑問視し始めている。

関心の高まりの根拠は、投資アナリストが ServiceNow の CEO である Bill McDermott 氏に、同社の業績についてではなく、ServiceNow が LLM をワークフロー ソリューションに組み込む中で DeepSeek をどう評価しているかについて質問したことにあります。

「これらのモデルは急速にコモディティ化しており、おそらく誰も夢にも思わなかったほどの速さだ」とビッグ・マックは同社の第4四半期決算発表後にアナリストらに語った。

「私たちのようなプラットフォームやアプリのベンダーにとって、アプリケーションやビジネスプロセスに関して競争上の差別化が私たちのレベルで実現し、最終的にビジネス上の成果が得られるので、これは非常に喜ばしいことです。」

マクダーモット氏は聴衆に対し、顧客へのメリットだけでなく、ServiceNow にとって LLM が大幅に安くなる「粗利益のメリット」の可能性も考慮していると語った。

しかし、CEOは慎重な姿勢も示した。「DeepSeekに関しては、二度、いや三度と計測し、一回で切り取るという強い信念を持っています。何が起こっているのかを真に理解することに非常に力を入れており、責任あるAIの実現に強くコミットしています。」また、ServiceNowのチームはDeepSeekの導入が及ぼす影響について調査中であると述べた。

麒麟 - 中国の伝説に登場する神話上の獣

中国で好まれるデスクトップLinux、openKylinがバージョン2.0でAI PCを追いかける

続きを読む

マクダーモット氏がDeepSeekに熱狂する理由は、同社がV3と最新のR1モデルを効率的かつ比較的安価に構築したという主張にある。欧米の競合他社がLLMの学習に数百億ドルを費やしている一方で、DeepSeekはR1のベースとなるLLMであるV3で、クラウドでの学習コストが600万ドル未満で同等のパフォーマンスを達成したと言われている。

しかし、この推定額は、DeepSeekがV3のトレーニングに費やしたNVIDIA H800 GPUの稼働時間に、一般的なクラウドレンタル料金である1時間あたり2ドルを掛けて算出されたものです(論文5ページ参照)。実際には、DeepSeekは自社所有の数千基のGPUを用いてモデルを構築し、数百万ドルを投じています。ある独立系分析によると、DeepSeekはAIハードウェアに16億ドルを費やしたとされています。さらに、研究開発費も考慮に入れる必要があります。

確かに、V3 と R1 の構築には、シリコンバレーが好んでかき集めるような巨額の費用がかかったわけではないが、決して小さな出費でもなかった。

  • マイクロソフト、ディープシークへのAI業界からの反応を受け「大規模な資本投資」を主張
  • OpenAIとその仲間たちが懸念している中国のLLMメーカーはDeepSeekだけではない。そうだろう、アリババ?
  • チャットログやAPIキーなどを公開したままデータベースを放置したのは誰だと思いますか?そう、DeepSeekです。
  • 米国のAI株は、昨日のDeepSeekの暴落後、打撃を受けながらも持ちこたえている

クラウドAPIの価格設定に関しては、DeepSeekのR1推論モデルはOpenAIのo1よりも安価であるように思われます。しかし、中国の研究機関の主張には疑問を抱く人もいます。

まず、他のベンダーが提供するLLMに代わるオープンソースの優れた選択肢であるという考え方があります。一部の米国ベンダーはオープンソースの資格を主張していますが、学術研究によると、実際にはそれほどオープンではないことが分かっています。

同様に、DeepSeekのオープンソースに関する主張も精査に値する。システムインテグレーター兼ITサービスベンダーのVersion1は、DeepSeekはモデルの重みを公開しているものの、学習データや学習コードは公開していないため、再現は不可能だと指摘している。

OpenAIに特化したRedditのディスカッショングループで、あるネットユーザーが、DeepSeek R1がベンチマーク回答でモデルをトレーニングし、汎用モデルを作らずに市場を操作する可能性があったことを示唆する証拠を共有した。

ユーザーの中には、一部の回答がベンチマーク回答と50~90%の類似性を示していると主張した人もいました。一方、グループ内の他のユーザーは、このアプローチで汎用LLMのようなものを実現できるかどうか疑問視していました。

DeepSeek のパフォーマンスとオープンソースの主張が真実かどうかは別として、同社はバックエンドのデータベースをオープンにしたままにし、進行中とされるサイバー攻撃のために、同社のモデルへの Web ベースのインターフェースの新規サインアップを制限しなければならなくなったため、セキュリティの信頼性にも打撃を受けている。

「DeepSeekのサービスに対する大規模な悪意ある攻撃のため、サービスの継続を確保するため、一時的に登録を制限しています」と同社はステータスページのメモで述べた。

株価への影響とは関係なく、中国が欧米のソフトウェア市場への進出を続けるにつれ、技術ユーザーはより多くの疑問を抱くことになるだろう。®

Discover More