人像一致性决定了一段图生视频草稿是否有用。第一秒很像,后面脸型、发型或服装不断变化,这样的草稿很难进入审核。
Spark Robin 不能消除 AI 视频生成的所有限制,但通过更清晰的参考图、更克制的动作和更明确的审核目标,可以减少常见漂移。
相关阅读:
什么是人像一致性
在 Spark Robin 中,人像一致性指同一个主体在生成片段里保持可识别。对人物来说,包括脸型、发型、表情范围、服装和身体语言。对产品来说,包括形状、logo 位置、颜色、材质和比例。
为什么会漂移
常见原因都很实际:参考图模糊或滤镜太重、提示词要求动作太多、镜头运动过于激烈、多张参考图互相冲突、时长超过概念能承受的范围,或者提示词描述泛泛美感而不是具体运动。
参考图层级
每张参考图都应该有明确任务。
- 主图:最重要的身份锚点。
- 角度图:可选,用来稳定脸部或产品形状。
- 半身或版式图:可选,用来保持服装、姿态或摆放连续性。
- 动作参考:可选,用来提供镜头节奏,而不是身份。
如果两张参考图互相矛盾,模型需要在冲突中平均,稳定性会下降。
有帮助的提示词锚点
可以使用直接约束:使用上传图片作为身份锚点、保持脸部结构稳定、保持同一套服装和轮廓、只允许一个轻微表情变化、固定镜头缓慢推进、不要突然变焦或大幅转头。
避免在同一个草稿里同时要求跑动、旋转、大笑、挥手、环绕镜头和光线变化。
一致性优先的测试流程
- 先用最小动作生成短草稿。
- 检查脸部、手部、产品边缘和背景稳定性。
- 每次只增加一个新动作。
- 短草稿稳定后再提高时长。
- 多段视频里保持同一张主参考图。
这比写一段超长提示词慢一些,但通常比反复失败的长渲染更省积分。
最后建议
更好的人像一致性来自干净参考图和更小的决策。Spark Robin 最有用的方式,是让每个草稿只测试一个动态问题,同时保护最重要的视觉身份。

