¿Qué es Grok Video?
Grok Video es el modelo de texto a video de xAI, ahora disponible en Synclip. Genera video a 720p en tres relaciones de aspecto, produce una miniatura automáticamente junto al clip y admite una imagen de referencia para anclar la identidad visual o el estilo de escena.
El modelo está diseñado para salidas cinemáticas de formato corto: desde 6 segundos (un loop o teaser) hasta 15 segundos (un beat narrativo completo). A diferencia de los modelos de tarifa plana, Grok Video usa facturación lineal por segundo para que solo pagues lo que realmente generas.
- Salida a 720p con miniatura generada automáticamente
- Relaciones de aspecto 3:2 horizontal, 2:3 vertical, 1:1 cuadrado
- Imagen de referencia opcional para consistencia de personaje o escena
- Duraciones de 6 s / 10 s / 15 s
- Precios lineales: 3 monedas / segundo (18 → 30 → 45 monedas)
Relaciones de aspecto — Elige el encuadre adecuado para tu plataforma
Grok Video ofrece tres relaciones, cada una optimizada para un canal de distribución distinto:
| Ratio | Format | Best for |
|---|---|---|
| 3:2 | Horizontal / Cinemático | YouTube, reels de cine, visualización en escritorio |
| 2:3 | Vertical / Formato corto | Reels, TikTok, Shorts, feeds mobile-first |
| 1:1 | Cuadrado / Redes sociales | Publicaciones de Instagram, anuncios de producto, reposts multiplataforma |
Elige la relación antes de escribir el prompt: la composición varía según la orientación. Para vertical, describe movimiento vertical; para horizontal, usa staging horizontal.
Duración y precios — Facturación lineal y transparente
Grok Video cuesta exactamente 3 monedas por segundo. Sin niveles ocultos ni recargos:
| Duration | Grok Video | Veo 3.1 Fast | Sora 2 |
|---|---|---|---|
| 6 s | 18 monedas | 18 monedas (Veo 3.1 Fast, cualquier duración) | 8 monedas (Sora 2, 10 s) |
| 10 s | 30 monedas | 18 monedas (Veo 3.1 Fast, cualquier duración) | 8 monedas (Sora 2, 10 s) |
| 15 s | 45 monedas | 18 monedas (Veo 3.1 Fast, cualquier duración) | 12 monedas (Sora 2, 15 s) |
Veo 3.1 Fast es de tarifa plana: el mismo coste por generación independientemente de la duración. Si necesitas el clip más largo al menor coste, Veo 3.1 Fast gana en pura economía. La ventaja de Grok Video es la calidad cinemática en duraciones cortas y el flujo de imagen de referencia.
Imagen de referencia — Una imagen, resultados consistentes
Sube una sola imagen junto a tu prompt y Grok Video la usará para anclar la identidad visual del clip. Esta es la herramienta de consistencia principal: cara/vestuario del personaje, localización de la escena, look del producto o incluso la paleta de colores pueden fijarse con una sola referencia.
- Consistencia de personaje en múltiples clips generados
- Continuar una escena con el mismo fondo o localización
- Tomas de producto que deben coincidir con el visual de marca existente
- Fijar un grado de color o estilo de iluminación
Tip: Usa una imagen de referencia limpia y representativa. Una cara bien iluminada o un producto sobre fondo neutro da la señal más clara al modelo. Evita composiciones complejas con múltiples focos de atención.
Flujo de trabajo en cuatro pasos
Una secuencia repetible tanto para clips individuales como para series de formato corto.
Paso 1 · Selecciona Grok Video en el selector de modelo
Abre el espacio de trabajo de Video Creator en Synclip y elige Grok Video en el desplegable de modelos. La interfaz mostrará las tres opciones de relación de aspecto y el selector de duración.
Paso 2 · Escribe tu prompt
Estructura el prompt con cinco elementos: sujeto, escena, movimiento de cámara, beat de movimiento y restricciones de estilo. Mantenlo por debajo de 120 palabras y evita pedir texto legible en el encuadre.
- Sujeto: quién o qué aparece en el plano
- Escena: entorno y fondo
- Cámara: tipo de plano (primer plano / plano medio / plano general) y movimiento (travelling / paneo / órbita)
- Beat de movimiento: qué cambia durante el clip
- Estilo: realista / cinemático / comercial / etc.
Paso 3 · Configura relación, duración e imagen de referencia opcional
Elige la relación de aspecto para tu plataforma objetivo. 6 s para un loop o teaser, 10 s para un beat de producto, 15 s para un momento narrativo completo. Si necesitas consistencia visual, sube una imagen de referencia antes de generar.
Paso 4 · Genera e itera
Ejecuta la generación. El modelo devuelve el video y una miniatura generada automáticamente. Si la dirección del plano es correcta pero los detalles necesitan ajuste, modifica el beat de movimiento o el lenguaje de cámara y vuelve a ejecutar — la imagen de referencia se mantiene fija entre iteraciones.
Plantillas de prompt — Copia, reemplaza, genera
Sustituye los campos entre corchetes con los detalles de tu proyecto.
A) Horizontal cinemático (3:2) — plano de establecimiento
- Intros de YouTube
- B-roll estilo cinematográfico
- Contenido de viajes y destinos
B) Vertical formato corto (2:3) — historia de personaje vertical
Tip: Combina con una imagen de referencia del personaje para mantener consistencia facial entre clips.
C) Cuadrado social (1:1) — presentación de producto
- Anuncios de Instagram
- Videos de producto para e-commerce
- Contenido de marca
Comparativa de modelos — Grok Video vs Veo 3.1 Fast vs Sora 2
Referencia rápida para elegir el modelo adecuado según el caso de uso:
| Característica | Grok Video | Veo 3.1 Fast | Sora 2 |
|---|---|---|---|
| Resolución de salida | 720p | 720p | 720p |
| Relaciones de aspecto | 3:2 / 2:3 / 1:1 | 16:9 / 9:16 | 16:9 / 9:16 / 1:1 |
| Duración máxima | 15 s | 25 s | 15 s |
| Imagen de referencia | 1 imagen | Múltiples (ingredients) | No |
| Fotograma inicial/final | No | Sí (Veo 3.1) | No |
| Miniatura automática | Sí | No | No |
| Precio (15 s) | 45 monedas | 18 monedas (fijo) | 12 monedas |
FAQ
¿Qué resolución tiene la salida de Grok Video?
720p. El modelo también genera una miniatura automáticamente junto al clip de video.
¿Puedo usar más de una imagen de referencia?
Grok Video actualmente admite una sola imagen de referencia por generación. Para flujos de trabajo con múltiples imágenes de referencia (estilo ingredients), usa Veo 3.1 en Synclip.
¿Por qué 15 segundos cuesta más que Veo 3.1 Fast?
Grok Video usa facturación lineal por segundo (3 monedas/s), por lo que los clips más largos cuestan proporcionalmente más. Veo 3.1 Fast tiene tarifa plana por generación independientemente de la duración. Si la eficiencia de monedas al máximo de duración es tu prioridad, Veo 3.1 Fast es la mejor opción.
¿Puedo usar Grok Video para contenido vertical?
Sí — la relación de aspecto 2:3 está diseñada para plataformas de formato corto vertical como Reels, TikTok y Shorts.