Un nuevo unicornio en la pila de infraestructura de IA (AI infrastructure)
En un movimiento decisivo que subraya el cambio de la industria, pasando de entrenar grandes modelos a desplegarlos en entornos de tiempo real, LiveKit ha asegurado 100 millones de dólares en financiación de serie C, impulsando su valoración hasta los 1 000 millones de dólares. La ronda fue liderada por Index Ventures, con una participación significativa de Salesforce Ventures y de los inversores que volvieron a apostar, Altimeter Capital, Redpoint Ventures y Hanabi Capital.
Para los observadores de Creati.ai, esta valoración es más que un hito financiero; indica la madurez de la capa de infraestructura de IA. Mientras que 2024 y 2025 estuvieron definidos por la carrera armamentística entre proveedores de modelos fundacionales como OpenAI y Anthropic, 2026 se está perfilando rápidamente como el año de la capa de aplicaciones—específicamente, agentes multimodales que pueden ver, oír y hablar. LiveKit, fundada en 2021 por Russ D’Sa y David Zhao, ha construido sigilosamente la plomería crítica necesaria para que estas interacciones se sientan instantáneas y humanas.
El nuevo capital se destinará a ampliar la red global de nodos edge de LiveKit y a mejorar su framework "Agents", que simplifica la orquestación de pipelines complejos de IA. A medida que las empresas pasan de chatbots basados en texto a asistentes nativos de voz, la demanda de infraestructura especializada y de baja latencia se ha disparado, posicionando a LiveKit como la capa de transporte predeterminada para la próxima generación de computación.
La «plomería» detrás de la revolución de la voz
Para comprender el rápido ascenso de LiveKit, primero hay que entender los cuellos de botella técnicos de la IA conversacional. Construir un agente de voz no consiste simplemente en conectar un motor de speech-to-text (STT) a un Large Language Model (LLM) y un sintetizador de text-to-speech (TTS). El verdadero desafío radica en la gestión de la latencia y del estado.
En una arquitectura estándar basada en HTTP, el retraso entre que un usuario habla y la IA responde puede fácilmente superar los dos o tres segundos—una eternidad en la conversación humana. Esta demora rompe la ilusión de inteligencia y frustra a los usuarios. LiveKit resuelve esto utilizando un enfoque moderno de WebRTC (Web Real-Time Communication), diseñado originalmente para videoconferencias, y reorientándolo para la inferencia de IA.
Resolviendo el cuello de botella de latencia
La infraestructura de LiveKit opera como una red programable de alto rendimiento. Gestiona la ingestión de flujos de audio, los procesa a través de un pipeline de latencia ultrabaja y entrega la respuesta de la IA al usuario en milisegundos.
Manejando la lógica de «turn-taking»—saber cuándo un usuario ha dejado de hablar o está interrumpiendo a la IA—LiveKit permite a los desarrolladores crear experiencias que se sienten como llamadas telefónicas naturales en lugar de intercambios tipo walkie-talkie. Esta capacidad es crítica para la nueva ola de aplicaciones de «Voice Mode», donde la fluidez es la métrica principal de éxito.
La tecnología de la empresa abstrae la complejidad de gestionar buffers de jitter, la cancelación de eco y las caídas de conexión, permitiendo a los ingenieros de IA centrarse exclusivamente en la lógica de sus agentes. Esta filosofía developer-first ha llevado a una adopción generalizada, con la plataforma facilitando ahora miles de millones de minutos de interacción con IA al año.
La validación de OpenAI
Quizás el respaldo más significativo de la tecnología de LiveKit proviene de su asociación con OpenAI. LiveKit sirve como columna vertebral de Advanced Voice Mode de ChatGPT, una función que sorprendió al mundo tecnológico con su capacidad de mantener conversaciones en tiempo real y con matices emocionales.
Para los compradores empresariales, la lógica es simple: si la infraestructura de LiveKit es lo suficientemente robusta para manejar la enorme carga concurrente de la base de usuarios global de ChatGPT, es más que capaz de soportar agentes de atención al cliente, consultas de telemedicina o herramientas internas de la empresa. Este «OpenAI Effect» ha acelerado la adopción de LiveKit en la lista Fortune 500, con compañías como Salesforce y Tesla integrando la tecnología en sus propias estrategias de IA.
Comparación: infraestructura heredada vs. infraestructura nativa de IA
| Característica |
WebRTC tradicional |
LiveKit infraestructura de IA |
| Gestión de latencia |
Variable, a menudo impredecible |
Transporte optimizado por debajo de 100 ms |
| Integración de IA |
Requiere código de pegamento manual |
Pipeline nativo para STT/LLM/TTS |
| Manejo de interrupciones |
Difícil de implementar |
Lógica integrada de detección de turnos |
| Escalabilidad |
Alta sobrecarga operativa |
Red global de edge gestionada |
| Arquitectura de protocolo |
Enfoque Peer-to-Peer |
Reenvío del lado del servidor (SFU) |
Más allá de los chatbots: el futuro Agentic
Si bien la IA conversacional es el motor de crecimiento actual, la hoja de ruta de LiveKit se extiende al ámbito más amplio de los agentes multimodales. La capacidad de transmitir datos de vídeo en tiempo real permite a los modelos de IA «ver» y razonar sobre el mundo físico.
Esta capacidad está abriendo nuevas fronteras en la robótica y la automatización industrial. Por ejemplo, startups de teleoperación utilizan LiveKit para transmitir vídeo de baja latencia desde robots a operadores humanos o supervisores de IA. En el sector sanitario, los proveedores de salud mental están utilizando la plataforma para impulsar asistentes de terapia autónomos capaces de detectar matices emocionales sutiles en la voz de un paciente, una tarea que requiere una transmisión de audio de alta fidelidad que la telefonía estándar no puede ofrecer.
Además, la participación de Salesforce Ventures en esta ronda de serie C sugiere una integración profunda en los flujos de trabajo de gestión de relaciones con clientes (CRM). Podemos esperar ver sistemas de «Agentic CRM» donde los agentes de voz de IA no solo gestionan llamadas de soporte, sino que también actualizan registros de clientes de forma autónoma y disparan flujos de trabajo en tiempo real, todo impulsado por las data rails de LiveKit.
Ecosistema centrado en el desarrollador
A pesar de su valoración de unicornio y su enfoque en la empresa, LiveKit sigue profundamente enraizado en la comunidad de código abierto. El núcleo de su tecnología es accesible para los desarrolladores, fomentando un ecosistema vibrante de plugins e integraciones.
El framework «LiveKit Agents» permite a los desarrolladores escribir la lógica del agente en Python o Node.js, tratando el complejo procesamiento de audio/vídeo como una importación de biblioteca estándar. Esta democratización de la tecnología de medios en tiempo real está reduciendo la barrera de entrada para construir aplicaciones sofisticadas de IA. Un único desarrollador ahora puede prototipar un asistente de voz en una tarde, algo que antes habría requerido un equipo de ingenieros de VoIP y meses de desarrollo.
Implicaciones de mercado para 2026
A medida que avanzamos en 2026, la capitalización de LiveKit valida una tendencia más amplia: la pila de IA se está consolidando. La era de construir infraestructura a medida para cada aplicación de IA está llegando a su fin. Así como Twilio se convirtió en la API predeterminada para SMS y Stripe para pagos, LiveKit se está posicionando como la API predeterminada para la comunicación de IA a humanos.
Para los lectores de Creati.ai, la conclusión es clara. El limitante de la utilidad de la IA ya no es la inteligencia del modelo, sino la velocidad y la fiabilidad de la interfaz. Con una valoración de 1 000 millones de dólares y una caja de guerra de 100 millones de dólares, LiveKit está asegurando que la interfaz del futuro sea instantánea, fluida y omnipresente.