川普政府敦促科技巨頭資助 AI 電力廠,以應對飆升的能源成本
隨著電價飆升,川普政府正施壓主要科技公司資助新電廠,以支援 AI 資料中心的能源需求。

在一項決定性的舉動中,該舉動強調產業正從訓練大型模型轉向在實時環境中部署它們,LiveKit 成功獲得 1 億美元 C 輪融資,推動其估值達到 10 億美元。此次融資由 Index Ventures 領投,Salesforce Ventures 參與投資,先前投資者 Altimeter Capital、Redpoint Ventures 和 Hanabi Capital 亦有顯著參與。
對 Creati.ai 的觀察者而言,這樣的估值不僅是一個財務里程碑;它也標誌著 AI 基礎設施(AI infrastructure)層的成熟。儘管 2024 和 2025 年是由 OpenAI 與 Anthropic 等基礎模型(foundation model)供應商之間的軍備競賽所定義,2026 年則迅速發展成為應用層之年—具備「看、聽、說」能力的多模態代理(multimodal agents)。LiveKit 由 Russ d'Sa 和 David Zhao 於 2021 年創立,已靜悄悄地構建了讓這些互動感受既即時又具人性化的關鍵管線。
這筆新資金將用於擴展 LiveKit 的全球邊緣節點網絡並強化其「Agents」框架,該框架簡化了複雜 AI 管道的協調。隨著企業從文字聊天機器人轉向以語音為原生的助理,對專用、低延遲基礎設施的需求飆升,使 LiveKit 成為下一代計算的預設傳輸層。
要理解 LiveKit 的快速崛起,首先必須了解對話式 AI 的技術瓶頸。構建語音代理不僅僅是將語音轉文字(speech-to-text,STT)引擎連接到大型語言模型(Large Language Model,LLM)和文本轉語音(text-to-speech,TTS)合成器。真正的挑戰在於延遲和狀態管理。
在標準的基於 HTTP 的架構中,使用者講話與 AI 回應之間的時間延遲很容易超過二到三秒—在人類對話中這幾乎是無限漫長。這種延遲破壞了智能的錯覺,並讓使用者感到沮喪。LiveKit 通過採用最新的網頁即時通訊(WebRTC,Web Real-Time Communication)方法——該技術最初為視訊會議而設計——並將其改造用於 AI 推論,解決了這一問題。
LiveKit 的基礎設施作為一個高效能可編程網路運作。它管理音頻流的接收,通過超低延遲管線處理,並在數毫秒內將 AI 的回應傳回給使用者。
通過處理「輪替講話」(turn-taking)邏輯——識別使用者何時停止講話或何時打斷 AI——LiveKit 讓開發者能構建類似自然電話通話,而非對講機式交談的體驗。對於以流暢度作為主要成功指標的新一代「語音模式」應用而言,這項能力至關重要。
該公司的技術抽象化了抖動緩衝(jitter buffer)、回聲消除(echo cancellation)和連線中斷等管理複雜性,讓 AI 工程師能全心專注於其代理的邏輯。這種以開發者為先的理念促成了廣泛的採用,該平台每年現已促成數十億分鐘的 AI 互動。
或許對 LiveKit 技術最重要的認可來自與 OpenAI 的合作。LiveKit 成為 ChatGPT 進階語音模式(Advanced Voice Mode)的核心支柱,該功能以其能進行情感細膩且即時的對話能力震驚了科技界。
對企業買家而言,邏輯很簡單:如果 LiveKit 的基礎設施足夠強大,可應對 ChatGPT 全球用戶群的大量並發負載,那麼其處理客服代理、遠距醫療諮詢或內部企業工具的能力更是綽綽有餘。這種「OpenAI 效應(OpenAI Effect)」加速了 LiveKit 在《財富》500 強企業中的採用,像 Salesforce 與 Tesla 等公司都將該技術整合到自身的 AI 策略中。
在傳統通訊棧上嘗試構建語音 AI(voice AI)與使用專用基礎設施之間的差異顯而易見。下表概述了驅使開發者轉向 LiveKit 的主要技術差異。
| 功能 | 傳統 WebRTC | LiveKit AI 基礎設施 |
|---|---|---|
| 延遲管理 | 不穩定且常具不可預測性 | 優化至 100 毫秒以下傳輸 |
| AI 集成 | 需手動編寫連接程式 | 原生 STT/LLM/TTS 管線 |
| 中斷處理 | 實現困難 | 內建輪替偵測邏輯 |
| 可擴展性 | 高運營開銷 | 可管理的全球邊緣網路 |
| 協議架構 | 強調點對點 | 伺服器端轉發 (SFU) |
儘管對話式 AI 目前是增長的驅動力,LiveKit 的路線圖已延伸至更廣泛的多模態代理(multimodal agents)領域。實時串流視訊資料的能力使 AI 模型能「看」見並推理物理世界。
這項能力正在為機器人技術和工業自動化開闢新前沿。例如,遠程操作(teleoperation)新創公司正使用 LiveKit 將低延遲視訊從機器人傳輸到人類操作員或 AI 監督者。在醫療保健領域,心理健康提供者則利用該平台驅動自主治療助理,能偵測病人語音中的細微情緒線索,這需要標準電話無法提供的高保真音訊傳輸。
此外,Salesforce Ventures 參與本輪 C 輪融資意味著與客戶關係管理(CRM)工作流程的深度整合。我們可以預期會出現「具自主代理的 CRM(Agentic CRM)」系統,讓 AI 語音代理不僅處理支援通話,還能自主更新客戶記錄並實時觸發工作流程,全部由 LiveKit 的數據管道驅動。
儘管擁有獨角獸估值並專注於企業市場,LiveKit 仍深植於開源社群。其技術核心對開發者開放,促進了繁榮的外掛與整合生態系。
「LiveKit Agents」框架讓開發者能以 Python 或 Node.js 撰寫代理邏輯,並視複雜的音/視訊處理為標準函式庫匯入。這種即時多媒體技術的民主化,降低了構建複雜 AI 應用的門檻。單一開發者現在能在一下午內構建語音助理原型,以往這需要一支 VoIP 工程師團隊和數月的開發時間。
隨著我們進入 2026 年,LiveKit 的資本化驗證了一個更廣泛的趨勢:AI 堆疊正在固化。為每個 AI 應用構建量身訂做基礎設施的時代正在結束。就像 Twilio 成為 SMS 的預設 API,Stripe 成為支付的預設 API 一樣,LiveKit 正定位為 AI 與人類溝通的預設 API。
對 Creati.ai 的讀者而言,重點很明確:AI 實用性的瓶頸不再是模型的智慧,而是介面的速度與可靠性。擁有 10 億美元估值和 1 億美元的資金,LiveKit 正確保未來的介面將是即時、無縫且無處不在。