グーグル、Apache IcebergとBlackwellでデータ基盤を強化
グーグルは「Google Cloud Next 2026」で、開放型データ基盤「Apache Iceberg」を軸に、異なる処理基盤やAIエージェントが同じデータへ直接つながる仕組みを広げた。BigQueryとSpark、Flink、Trinoで重複保存を減らす構想に加え、NvidiaのBlackwell搭載AI基盤も打ち出した。
起こった背景
グーグルは先月のApache Iceberg Summitで、BigQuery向けのIceberg RESTカタログを予告した。複数の処理基盤が同じIceberg表を扱えるため、データを複製せずに更新や検索ができる仕組みだ。グーグルは、運用負担の軽減も狙う。
その後、グーグルはAWS、Azure、Databricks、Snowflakeをまたぐ横断型の仕組みも示した。さらに、AIエージェント向けの基盤「Agentic Data Cloud」や、NvidiaのBlackwellを使うAI基盤も公表し、企業と政府向けの高負荷処理を視野に入れた。
データ基盤の再編
Googleは、Apache Icebergの相互運用性をBigQueryに拡張した。プレビュー版のサーバーレスIceberg RESTカタログにより、チームはBigQueryやSpark、Flink、Trinoなどのエンジンで同じApache Icebergテーブルを作成、更新、クエリできる。
また、クラウドプロバイダーは、Icebergの導入時に手作業で行われることが多いメタデータ、テーブル保守、同期タスクのマネージドサポートも導入した。
これって何が重要?
この動きの重要な点は、複数のツールがデータを複製せず、独自形式に依存せずに同じデータセットを扱えるようにしたことだ。Googleは、組織がデータをオープンな形式のまま保ちつつ、異なる処理・分析ツールを同じデータセットで使えるようにすることを目指している。
その結果、データプラットフォームのチームは、複数のコンピュートエンジンを支える構成でIcebergをより扱いやすくなる。
今後の予測
グーグルは今後1〜3ヶ月で対応機能を増やし、利用できる基盤の範囲を広げると見られる。複数クラウドで同じ表を扱えるなら、企業は部門ごとの構成差を少しずつ減らす方向へ動くと予想される。
一方で、運用の自動化が進むほど、他社製品との互換性や権限管理の詰めが厳しくなる。ここでつまずけば採用は鈍る。逆に安定すれば、AI向け処理と分析処理の統合が進む。








