DeepSeek V4登場：100万トークンで米AI業界に衝撃

なぜ今、DeepSeek V4が世界を揺るがすのか

2025年1月、中国の杭州に拠点を置くAIスタートアップDeepSeekが、低コストで米国のトップモデルに匹敵する推論能力を持つ「R1」を公開し、世界のAI業界に衝撃を与えた。DeepSeek-R1の公開は、投資家がフロンティアAI開発に必要な計算リソースの前提を再評価した結果、NVIDIAの時価総額を一日で約6,000億ドル消し飛ばした。あれから約1年——2026年4月24日、DeepSeekは再び世界の注目を集める新シリーズDeepSeek V4を発表した。

V4のリリースは、OpenAIがGPT-5.5を同日に発表し、AnthropicがセカンダリーマーケットでバリュエーションがAI企業最大規模に達する中、米中AI競争が通商・テクノロジー政策の明確な争点となった局面で登場した。今回の発表は単なるモデルのバージョンアップではなく、AIの経済性そのものを塗り替える可能性を秘めた技術的飛躍として業界から注目されている。

DeepSeek V4シリーズの詳細スペック

二つのモデルラインナップ

DeepSeek V4シリーズには2つの強力なMixture-of-Experts（MoE）言語モデルが含まれる。DeepSeek-V4-Proは総パラメータ数1.6兆（アクティブ490億）、DeepSeek-V4-Flashは総パラメータ数2,840億（アクティブ130億）であり、いずれも100万トークンのコンテキスト長をサポートする。

DeepSeek-V4-Pro：総パラメータ1.6兆を有し、世界最大のオープンウェイトモデルとなった。前世代V3.2（6,710億パラメータ）を大幅に上回り、Moonshot AI Kimi K 2.6（1.1兆）やMiniMax M1（4,560億）も超える規模だ。
DeepSeek-V4-Flash：V4-Proと比較して世界知識はやや劣るものの、推論性能は同等に近い。パラメータ数が少なく活性化コストが低いため、より高速な応答と経済的なAPI価格を実現している。

モデルの動作モード

両モデルは100万トークンのコンテキストとデュアルモード（Thinking／Non-Thinking）をサポートする。V4-ProおよびV4-Flashは、いずれも3つの推論努力モードをサポートしている。これにより、利用シナリオに応じてコストとパフォーマンスのバランスを柔軟に調整できる。

トレーニングデータと後処理

両モデルは32兆トークン以上の多様かつ高品質なデータで事前学習を実施。後処理は2段階パラダイムを採用し、SFTとRLを用いたドメイン特化エキスパートの独立育成、続いてオンポリシー蒸留による統合モデルへの統合という手順を踏む。

技術的革新：100万トークンを実用的にする新アーキテクチャ

ハイブリッドアテンションアーキテクチャ（CSA + HCA）

V4の最も顕著な技術的達成は、ネイティブの100万トークンコンテキストウィンドウだ。従来、このような大きなコンテキストを維持するには膨大なメモリ（KVキャッシュ）が必要だった。

DeepSeek V4シリーズは、圧縮スパースアテンション（CSA）と重度圧縮アテンション（HCA）を組み合わせたハイブリッドアテンション機構を設計し、長文コンテキスト処理の効率を劇的に改善している。

この革新により、計算コストは以下のように劇的に削減された：

V4-Pro：100万トークンのコンテキスト設定において、単一トークン推論FLOPsはDeepSeek-V3.2比でわずか27%、KVキャッシュは10%に抑制される。
V4-Flash：100万トークンのコンテキスト設定において、単一トークンFLOPsはV3.2比で10%、KVキャッシュサイズは7%という極めて高い効率を達成する。

Manifold-Constrained Hyper-Connections（mHC）

mHCを導入することで従来の残差接続を強化し、レイヤー間のシグナル伝播の安定性を高めながら、モデルの表現力を維持している。

エージェント機能の強化

V4はマルチターンエージェントワークフローにおいて、ユーザーメッセージをまたいで推論内容を保持する。モデルはすべてのラウンド（ユーザーターンをまたいだものも含む）の推論履歴を完全に保持する。これにより、複数のツール呼び出しを連鎖させる複雑なタスクにおいて大幅な性能向上が実現された。

ベンチマーク性能：米国勢との比較

世界的な知識ベンチマークでは現行オープンモデル中トップを誇り、Gemini-3.1-Proにのみ後れをとる。数学・STEM・コーディングにおける推論性能は現行オープンモデルを凌駕し、トップのクローズドソースモデルと肩を並べる。

Codeforces（競技プログラミングプラットフォーム）においてV4-Proは3,206レートを記録し、人間競技者の上位23位に相当する。標準的な推論・エージェントベンチマークではGPT-5.2とGPT-5.4の間に位置する。

ただし、現行クローズドソースのフロンティアモデルに対しては「わずかに届かない」と自社評価しており、「開発軌跡」は最先端のフロンティアモデルより約3〜6か月遅れているという率直な自己評価も示している。

差のある部分を推定値として公開するという姿勢は、AI業界では異例であり、独立評価に先立ち保守的な期待値を設定する戦略的な動きとも見られる。

ビジネス視点：企業・経営者にとっての意味

破壊的な価格設定

DeepSeek V4シリーズが企業に与える最大のインパクトは、その価格設定にある。

V4 Flash：入力100万トークンあたり0.14ドル、出力100万トークンあたり0.28ドルという価格を実現。GPT-5.4 Nano、Gemini 3.1 Flash、Claude Haiku 4.5を下回る。
V4 Pro：入力0.145ドル、出力3.48ドル（100万トークンあたり）で、Gemini 3.1 Proを下回る。

DeepSeek-V4-Flashは、GPT-5.5やClaude Opus 4.7と単純比較した場合、入出力合算でコストが98%以上低く、約100分の1のコストに相当する（性能は下がるものの）。

大規模な推論ワークロードを運用する企業にとって、この価格差は何を自動化する価値があるかを変え得る。GPT-5.5やClaude Opus 4.7ではコスト面で見合わないタスクも、DeepSeek-V4-ProやさらにV4-Flashであれば経済的に実行可能になる可能性がある。

オープンウェイトとデータ主権

V4はHugging Face上でオープンライセンスの下で公開されており、開発者はモデルの重みをダウンロードし、ローカルで実行（適切なインフラがあれば）したり、自社クラウドにデプロイしたりできる。これはOpenAIのGPT-5.5（APIのみ）、GoogleのGemini 3.1 Pro（APIのみ）、Claude Opus 4.7（APIのみ）とは対照的だ。データレジデンシーの制約やベンダーロックインへの懸念を持つ企業にとって、DeepSeekは最も高い運用上の柔軟性を提供している。

米国大手テック企業への競争圧力

米国のテック企業は2026年、AIインフラとデータセンターに約6,500億ドルの投資を計画しており、性能向上と長期的なコストのバランスを取ろうとしている。その中でDeepSeekが低コストで同等性能を提供し続けることは、米国企業の投資戦略に疑問を呈し続けることを意味する。

消費者・生活者視点：一般の人々への影響

100万トークンが変えるAI体験

100万トークンのコンテキストウィンドウにより、ユーザーはコードベース全体や長大なドキュメントを1つのプロンプトに入力できるようになる。これは実際の利用シーンを大きく変える。

プログラマー：大規模コードベースを丸ごとモデルに渡してバグ修正や機能追加を依頼できる
研究者・学生：複数の論文や文書を一度に処理して横断的な分析が可能になる
ビジネスパーソン：長大な契約書・報告書・議事録をまとめて要約・分析できる
クリエイター：長編小説や脚本の全体的な一貫性を保ちながら編集・加筆できる

API価格競争による恩恵

100万トークンのコンテキストウィンドウは、プロンプトエンジニアリングのパターンを変え、外部チャンキングなしに長文書の推論、検索・書き込みワークフロー、複数文書の要約を可能にする。AIサービス全体の価格競争が激化することで、最終的には消費者が受けるAIサービスの品質向上とコスト低減につながる可能性がある。

専門家の見解

テクノロジー業界の著名なエンジニア・サイモン・ウィリソンは、V4の価格効率性の背景にある技術的根拠を解説した。DeepSeekの論文に記されたノートが、この価格設定の理由を説明している。長いコンテキストプロンプトの効率性に多大な注力を行い、100万トークンのシナリオでさえV4-Proがいかに少ない計算リソースで動作するかを示している。

VentureBeatは技術的意義をこう評価した。「これらの数字は、DeepSeekが単に推論コストを最適化しただけでなく、ベースアーキテクチャのインテリジェンス密度を根本的に改善したことを裏付けている。」

Hugging Faceのブログは実用性について、「DeepSeek V4は、100万トークンを仕様書上のチェックボックスではなく、実際にデプロイできる運用上の現実として提供している」と指摘した。

国際比較：米中AIレースの最前線

ハードウェア制約を超えた中国AIの躍進

DeepSeekは2025年1月、陳腐化したハードウェアと600万ドル未満の予算で業界リーダー（OpenAI、Google）レベルのモデルを訓練できることを証明した。これはAIのリーダーシップが数百億ドルの資金と最新のNvidiaチップを必ず必要とするという通念を覆した。

DeepSeek V4は、中国への半導体輸出規制という地政学的圧力が続く中でリリースされた。同社はハードウェアの制限があっても革新を続けられることを示してきており、V3.2からV4への6か月でのジャンプは、制約が開発ペースを止めていないことの最新の証拠だ。

ファーウェイチップへの移行と計算主権

DeepSeekは、ファーウェイのAscend 950チップを搭載したクラスターが今年後半に稼働を開始すれば、さらなるコスト削減が見込まれると予測している。この転換は米国の半導体メーカーへの依存を低下させ、中国のAIインフラを強化する可能性がある。

複数の報道は、V4とファーウェイのアクセラレーターとの関連を示しており、NVIDIAのGPUへの依存を減らす動きを示唆している。

地政学的懸念

このリリースは精査の目にもさらされている。米当局はDeepSeekが制限されたチップを使用していると非難しており、Anthropicは自社のClaudeシステムの悪用を申し立てている。ホワイトハウスは、中国の組織が大規模なデータ・モデル取得活動に従事していることへの懸念を示しており、DeepSeekは検閲や政治的にセンシティブなクエリへの対応を巡る批判にもさらされてきた。

今後の展望と注目ポイント

短期的な動向（2026年内）

独立ベンチマークの検証：両モデルは現時点ではプレビューリリースであり、最終的な製品版ではない。独立したベンチマーク評価は記事執筆時点では完了しておらず、DeepSeek自身のベンチマークはサードパーティによる評価で確認されるまでは暫定的なものとして扱うべきだ。
既存APIの廃止：DeepSeekは旧来のアーキテクチャを急速に廃止する方向だ。従来の「deepseek-chat」および「deepseek-reasoner」エンドポイントは2026年7月24日に完全廃止される予定で、全トラフィックは現在V4-Flashアーキテクチャに移行されており、100万トークン標準への完全移行を意味する。
Ascend 950展開後の価格低下：DeepSeekの技術レポートによれば、Pro版のサービス処理能力は現在、高性能計算リソースの限界から非常に制限されている。Ascend 950スーパーノードが下半期に量産稼働すれば、Proの価格が大幅に引き下げられると予測されている。

中長期的な影響

1M（100万）トークンコンテキストは、今後すべてのDeepSeek公式サービスの標準となる。これは業界全体のコンテキスト長の標準を引き上げる可能性がある。
DeepSeekはTencentホールディングスおよびAlibaba Groupとの初の資金調達ラウンドについて協議中であり、インフラ拡大に向けた計画を示している。
アーキテクチャの革新が生の計算リソースの最大化に代わり得ることを証明したことで、AIの最高水準の知能が世界の開発者コミュニティにより低いコストでアクセス可能になっている。

まとめ：DeepSeek V4の3つのポイント

📌 規模と効率の両立：DeepSeek V4は、V4-Pro（2,840億パラメータ・アクティブ130億）とV4-Flash（1.6兆パラメータ・アクティブ490億）の2モデルを提供。ともにMixture-of-Expertsモデルであり、100万トークンのコンテキストウィンドウをサポートする。
📌 破壊的な低価格：DeepSeekは先進的なモデルの経済性をはるかに低い水準に圧縮し、開発者や企業にプレミアムクローズドモデルのコスト対効果の再評価を迫っている。
📌 オープンソースで世界最大：最大推論努力モードのDeepSeek-V4-Pro-Maxは、オープンソースモデルの知識能力を大幅に向上させ、現在利用可能な最高のオープンソースモデルとしての地位を確立。コーディングベンチマークで最高水準のパフォーマンスを達成し、推論・エージェントタスクでリーディングなクローズドソースモデルとの差を大幅に縮めた。

参考情報

著者プロフィール

伊東雄歩（いとうゆうほ） / ゆぽゆぽ

株式会社ウォーカー代表取締役 / MENSA会員 / NLPマスタープラクティショナー

IQ130超のADHD経営者。「社会不適合」ゆえに会社員を2年で挫折し、フリーランスを経由せずいきなり起業。訴訟4回、2000万円の損失、役員の裏切り、オフショア開発の地獄を乗り越え10年生き残る。心理学・教育学に1000万円投資し、独自の「成長力学」を確立。現在は生成AI教育に注力し、「3年を2日に変える」AIプログラミング2Daysキャンプを全国展開中。AIフレンズコミュニティを運営。

夢は「世界征服」——世界の常識を変え、新しい価値観を提示すること。