流程页

文本到 lipsync 视频:脚本、语音、人像、输出

适合想从脚本走到口型同步视频、并使用与站点一致的口播产品路径的用户——而不是先开一场节点图搭建。

第一版刻意保持紧凑:输入脚本、生成语音、驱动肖像、需要时开启身体动作、最后审片。

这个流程强调什么

脚本优先

内容从文案开始,需要尽快变成面部主导视频时很有用。

主步骤更少

几秒即可理解:文本、语音、肖像、成片。

为迭代而设

替换脚本或音频后可重跑对应阶段,无需手动画图。

便于团队复用

读起来像制作流程,而不是图示意图。

工作原理

01

撰写或粘贴脚本

从视频必须说出的原文开始。

02

生成或选择语音

在同一条路径内把脚本转成语音,或自带录音。

03

驱动肖像

将生成或上传的音频送入口播步骤并选择面部。

04

审阅输出

确认、导出,或调整脚本/语音/动作后重跑。

真实输出

lipsync

新闻主播风格

适用场景

场景01

销售外联开场

脚本驱动的短口播用于外联或落地页嵌入。

场景02

产品入职口播

基于纯文本的可复用支持或培训片段。

场景03

多市场口播草案

同一肖像换不同脚本服务不同地区。

场景04

咖啡馆或演播室风格开场

人像配脚本,需要更强身体存在感时再开身体动作。

常见问题

为何这是流程页而不是通用场景页?

主要搜索意图是「从文本到口型输出」的步骤顺序。

必须先买单独 TTS 吗?

不必。重点是让文本—语音—视频留在同一产品环境里。

以后能接更复杂工作流吗?

可以。当前页轻量,但结构上可映射到更复杂的多步创作。

必须开身体动作吗?

不必。默认口播路径更简单稳定;身体动作是可选增强。

继续探索