Grok Video

Grok Video en Synclip — Video IA cinemático de 6 a 15 segundos
Tres relaciones de aspecto. Una imagen de referencia. Precios lineales y transparentes.

El modelo Grok Video de xAI llega a Synclip. Escribe un prompt, elige la relación de aspecto (3:2 cinemático / 2:3 vertical / 1:1 cuadrado), añade una imagen de referencia opcional para continuidad de personaje o escena, elige 6, 10 o 15 segundos — y obtén un resultado a 720p con miniatura incluida. El precio es sencillo: 3 monedas por segundo, siempre.

Grok Video

¿Qué es Grok Video?

Grok Video es el modelo de texto a video de xAI, ahora disponible en Synclip. Genera video a 720p en tres relaciones de aspecto, produce una miniatura automáticamente junto al clip y admite una imagen de referencia para anclar la identidad visual o el estilo de escena.

El modelo está diseñado para salidas cinemáticas de formato corto: desde 6 segundos (un loop o teaser) hasta 15 segundos (un beat narrativo completo). A diferencia de los modelos de tarifa plana, Grok Video usa facturación lineal por segundo para que solo pagues lo que realmente generas.

  • Salida a 720p con miniatura generada automáticamente
  • Relaciones de aspecto 3:2 horizontal, 2:3 vertical, 1:1 cuadrado
  • Imagen de referencia opcional para consistencia de personaje o escena
  • Duraciones de 6 s / 10 s / 15 s
  • Precios lineales: 3 monedas / segundo (18 → 30 → 45 monedas)

Relaciones de aspecto — Elige el encuadre adecuado para tu plataforma

Grok Video ofrece tres relaciones, cada una optimizada para un canal de distribución distinto:

RatioFormatBest for
3:2Horizontal / CinemáticoYouTube, reels de cine, visualización en escritorio
2:3Vertical / Formato cortoReels, TikTok, Shorts, feeds mobile-first
1:1Cuadrado / Redes socialesPublicaciones de Instagram, anuncios de producto, reposts multiplataforma

Elige la relación antes de escribir el prompt: la composición varía según la orientación. Para vertical, describe movimiento vertical; para horizontal, usa staging horizontal.

Duración y precios — Facturación lineal y transparente

Grok Video cuesta exactamente 3 monedas por segundo. Sin niveles ocultos ni recargos:

DurationGrok VideoVeo 3.1 FastSora 2
6 s18 monedas18 monedas (Veo 3.1 Fast, cualquier duración)8 monedas (Sora 2, 10 s)
10 s30 monedas18 monedas (Veo 3.1 Fast, cualquier duración)8 monedas (Sora 2, 10 s)
15 s45 monedas18 monedas (Veo 3.1 Fast, cualquier duración)12 monedas (Sora 2, 15 s)

Veo 3.1 Fast es de tarifa plana: el mismo coste por generación independientemente de la duración. Si necesitas el clip más largo al menor coste, Veo 3.1 Fast gana en pura economía. La ventaja de Grok Video es la calidad cinemática en duraciones cortas y el flujo de imagen de referencia.

Imagen de referencia — Una imagen, resultados consistentes

Sube una sola imagen junto a tu prompt y Grok Video la usará para anclar la identidad visual del clip. Esta es la herramienta de consistencia principal: cara/vestuario del personaje, localización de la escena, look del producto o incluso la paleta de colores pueden fijarse con una sola referencia.

Best for:
  • Consistencia de personaje en múltiples clips generados
  • Continuar una escena con el mismo fondo o localización
  • Tomas de producto que deben coincidir con el visual de marca existente
  • Fijar un grado de color o estilo de iluminación

Tip: Usa una imagen de referencia limpia y representativa. Una cara bien iluminada o un producto sobre fondo neutro da la señal más clara al modelo. Evita composiciones complejas con múltiples focos de atención.

Flujo de trabajo en cuatro pasos

Una secuencia repetible tanto para clips individuales como para series de formato corto.

Paso 1 · Selecciona Grok Video en el selector de modelo

Abre el espacio de trabajo de Video Creator en Synclip y elige Grok Video en el desplegable de modelos. La interfaz mostrará las tres opciones de relación de aspecto y el selector de duración.

Paso 2 · Escribe tu prompt

Estructura el prompt con cinco elementos: sujeto, escena, movimiento de cámara, beat de movimiento y restricciones de estilo. Mantenlo por debajo de 120 palabras y evita pedir texto legible en el encuadre.

  • Sujeto: quién o qué aparece en el plano
  • Escena: entorno y fondo
  • Cámara: tipo de plano (primer plano / plano medio / plano general) y movimiento (travelling / paneo / órbita)
  • Beat de movimiento: qué cambia durante el clip
  • Estilo: realista / cinemático / comercial / etc.

Paso 3 · Configura relación, duración e imagen de referencia opcional

Elige la relación de aspecto para tu plataforma objetivo. 6 s para un loop o teaser, 10 s para un beat de producto, 15 s para un momento narrativo completo. Si necesitas consistencia visual, sube una imagen de referencia antes de generar.

Paso 4 · Genera e itera

Ejecuta la generación. El modelo devuelve el video y una miniatura generada automáticamente. Si la dirección del plano es correcta pero los detalles necesitan ajuste, modifica el beat de movimiento o el lenguaje de cámara y vuelve a ejecutar — la imagen de referencia se mantiene fija entre iteraciones.

Plantillas de prompt — Copia, reemplaza, genera

Sustituye los campos entre corchetes con los detalles de tu proyecto.

A) Horizontal cinemático (3:2) — plano de establecimiento

Prompt
"Un [SUJETO] en [LOCALIZACIÓN]. Plano general de establecimiento, travelling lento de izquierda a derecha. Luz natural, leve lens flare, gradación cinemática. Movimiento realista, ligero temblor de cámara. Sin texto."
When to use:
  • Intros de YouTube
  • B-roll estilo cinematográfico
  • Contenido de viajes y destinos

B) Vertical formato corto (2:3) — historia de personaje vertical

Prompt
"Retrato en primer plano de [PERSONAJE] en [ESCENA]. La cámara se mantiene estática, el sujeto mira directamente a cámara y luego aparta la vista. Fondo con bokeh suave, tonos de piel cálidos. Estética documental auténtica y con mano en cámara. Sin texto."

Tip: Combina con una imagen de referencia del personaje para mantener consistencia facial entre clips.

C) Cuadrado social (1:1) — presentación de producto

Prompt
"Plano de producto comercial de [PRODUCTO] sobre [FONDO]. La cámara comienza en un macro de detalle y retrocede hasta revelar el producto completo. Iluminación de estudio limpia, reflejos nítidos, sensación premium. Sin texto."
When to use:
  • Anuncios de Instagram
  • Videos de producto para e-commerce
  • Contenido de marca

Comparativa de modelos — Grok Video vs Veo 3.1 Fast vs Sora 2

Referencia rápida para elegir el modelo adecuado según el caso de uso:

CaracterísticaGrok VideoVeo 3.1 FastSora 2
Resolución de salida720p720p720p
Relaciones de aspecto3:2 / 2:3 / 1:116:9 / 9:1616:9 / 9:16 / 1:1
Duración máxima15 s25 s15 s
Imagen de referencia1 imagenMúltiples (ingredients)No
Fotograma inicial/finalNoSí (Veo 3.1)No
Miniatura automáticaNoNo
Precio (15 s)45 monedas18 monedas (fijo)12 monedas

FAQ

¿Qué resolución tiene la salida de Grok Video?

720p. El modelo también genera una miniatura automáticamente junto al clip de video.

¿Puedo usar más de una imagen de referencia?

Grok Video actualmente admite una sola imagen de referencia por generación. Para flujos de trabajo con múltiples imágenes de referencia (estilo ingredients), usa Veo 3.1 en Synclip.

¿Por qué 15 segundos cuesta más que Veo 3.1 Fast?

Grok Video usa facturación lineal por segundo (3 monedas/s), por lo que los clips más largos cuestan proporcionalmente más. Veo 3.1 Fast tiene tarifa plana por generación independientemente de la duración. Si la eficiencia de monedas al máximo de duración es tu prioridad, Veo 3.1 Fast es la mejor opción.

¿Puedo usar Grok Video para contenido vertical?

Sí — la relación de aspecto 2:3 está diseñada para plataformas de formato corto vertical como Reels, TikTok y Shorts.