トランプ政権、急騰するエネルギーコストを受けてテック大手にAI用発電所の資金提供を促す
電力料金が急騰する中、トランプ政権はAIデータセンターの電力需要を支えるために、大手テクノロジー企業に新しい発電所の資金提供を迫っている。

大型モデルのトレーニングからリアルタイム環境への展開への業界のシフトを際立たせる決定的な一手として、LiveKitはシリーズCで1億ドルの資金調達を実施し、企業価値を10億ドルに押し上げました。このラウンドはIndex Venturesが主導し、Salesforce Venturesや既存投資家のAltimeter Capital、Redpoint Ventures、Hanabi Capitalが大きく参加しました。
Creati.aiの観測者にとって、この評価額は単なる財務上のマイルストーン以上の意味を持ちます。それは「AIインフラストラクチャ(AI infrastructure)」層の成熟を示しています。2024年と2025年はOpenAIやAnthropicのようなファウンデーションモデルプロバイダー間の軍拡競争が定義していましたが、2026年は視覚・聴覚・発話が可能なマルチモーダルエージェント(multimodal agents)のアプリケーション層の年として急速に形作られつつあります。LiveKitは2021年にRuss d'SaとDavid Zhaoによって設立され、これらのインタラクションを瞬時かつヒューマンライクに感じさせるために不可欠な基盤を静かに構築してきました。
新たな資金は、LiveKitのグローバルなエッジノードネットワークの拡大と、複雑なAIパイプラインのオーケストレーションを容易にする「Agents」フレームワークの強化に向けられます。企業がテキストベースのチャットボットから音声ネイティブのアシスタントへと移行する中、専門的で低レイテンシのインフラストラクチャへの需要は急増しており、LiveKitは次世代コンピューティングにおけるデフォルトのトランスポート層としての地位を確立しています。
LiveKitの急速な台頭を理解するには、まず会話型AIの技術的ボトルネックを把握しなければなりません。音声エージェントを構築するには、単に音声認識(STT)エンジンを大規模言語モデル(LLM)と音声合成(TTS)に接続すればよいというものではありません。本当の課題はレイテンシと状態管理にあります。
一般的なHTTPベースのアーキテクチャでは、ユーザーが話し始めてからAIが応答を返すまでに2~3秒以上の遅延が発生することも珍しくありません。これは人間の会話においては非常に長い時間であり、知性の錯覚を破壊し、ユーザーのフラストレーションを引き起こします。LiveKitはもともとビデオ会議向けに設計されたWebRTCを用い、AI推論向けに再活用することでこの問題を解決しています。
LiveKitのインフラストラクチャは高性能なプログラム可能ネットワークとして機能します。オーディオストリームの取り込みから超低レイテンシパイプラインでの処理、そしてミリ秒単位でのAI応答のユーザーへの配信を管理します。
"ターンテイキング(turn-taking)"ロジック―ユーザーが話し終えたタイミングやAIを遮っているタイミングを把握する仕組み―を担うことで、開発者はトランシーバーのようなやり取りではなく、自然な電話通話のように感じられる体験を構築できます。この機能は、流動性が成功の主要指標となる新しい波の“Voice Mode”アプリケーションにおいて極めて重要です。
同社の技術はジッターバッファ、エコーキャンセレーション、接続切断の管理といった複雑さを抽象化し、AIエンジニアがエージェントのロジックに専念できるようにします。この開発者ファーストの哲学により採用は急速に広がり、現在では年間何十億分ものAI対話を支えています。
LiveKitの技術に対する最大の裏付けは、OpenAIとのパートナーシップから生まれています。LiveKitはChatGPTのAdvanced Voice Modeのバックボーンとして機能しており、その感情的にニュアンスを持ったリアルタイム会話能力はテック業界を驚嘆させました。
企業向け購買担当者にとって論理はシンプルです。もしLiveKitのインフラストラクチャがChatGPTのグローバルユーザーベースによる膨大な同時接続負荷に耐えうるなら、顧客サポートエージェント、テレヘルス相談、社内ツールなども十分に対応可能だということです。この「OpenAI効果」により、SalesforceやTeslaなどのFortune 500企業が次々とLiveKitを自社のAI戦略に組み込んでいます。
| Feature | Traditional WebRTC | LiveKit AIインフラストラクチャ(AI Infrastructure) |
|---|---|---|
| レイテンシ管理 | 変動が大きく、多くの場合予測不能 | 100ms以下に最適化されたトランスポート |
| AI統合 | 手動でのグルーコードが必要 | STT/LLM/TTS用のネイティブパイプライン |
| 割り込み処理 | 実装が困難 | 組み込みのターン検出ロジック |
| 拡張性 | 高い運用コスト | マネージドされたグローバルエッジネットワーク |
| プロトコルアーキテクチャ | ピアツーピア中心 | サーバーサイド転送(SFU) |
会話型AIが現時点での成長の原動力である一方、LiveKitのロードマップはマルチモーダルエージェントのより広い領域へと広がっています。リアルタイムで映像データをストリーミングできる能力により、AIモデルは物理世界を「見る」ことができ、そこから推論を行えます。
この機能はロボティクスや産業オートメーションの新たなフロンティアを開いています。例えば、遠隔操作スタートアップはLiveKitを利用してロボットから人間のオペレーターやAI監督者へ低レイテンシの映像を送信しています。ヘルスケア分野では、メンタルヘルスプロバイダーがプラットフォームを活用し、患者の声の微妙な感情的手がかりを検出できる自律型セラピーアシスタントを実現しています。これは標準の電話回線では提供できない高忠実度のオーディオ伝送を必要とするタスクです。
さらに、このシリーズCラウンドにおけるSalesforce Venturesの参画は、顧客関係管理(CRM)ワークフローへの深い統合を示唆しています。今後は、AI音声エージェントがサポートコールを処理するだけでなく、顧客レコードを自動的に更新し、リアルタイムでワークフローをトリガーする「エージェント型CRM(Agentic CRM)」システムが登場するでしょう。これらすべてがLiveKitのデータ基盤によって支えられています。
ユニコーン評価とエンタープライズフォーカスにもかかわらず、LiveKitはオープンソースコミュニティに深く根ざしています。技術の核は開発者に開放されており、プラグインや統合の活発なエコシステムが育まれています。
"LiveKit Agents"フレームワークは、開発者がPythonやNode.jsでエージェントロジックを書き、複雑なオーディオ/ビデオ処理を標準ライブラリのインポート感覚で扱えるようにします。このリアルタイムメディア技術の民主化により、洗練されたAIアプリケーションを構築するハードルは大きく下がりました。以前はVoIPエンジニアのチームと数か月の開発期間が必要だった音声アシスタントのプロトタイプを、1人の開発者が午後のうちに実現できるようになっています。
2026年が深まるにつれ、LiveKitへの資本注入はより広範なトレンドを裏付けています。あらゆるAIアプリケーション向けに専用インフラを構築する時代は終わりつつあります。SMS APIのデファクトスタンダードがTwilioであり、決済APIのスタンダードがStripeであったように、AIと人間のコミュニケーションにおけるデフォルトAPIはLiveKitになるでしょう。
Creati.aiの読者にとってのポイントは明快です。AIの有用性を制約しているのはもはやモデルの知能ではなく、インターフェースの速度と信頼性です。10億ドルの評価額と1億ドルの資金を得たLiveKitは、未来のインターフェースを瞬時かつシームレスに、あらゆる場所で実現しようとしています。