中国AI视频模型Seedance2.0海外爆火,免费生成惊艳全球

阿木 发布于 22 小时前 1 次阅读


在2026年2月11日的晚上八点,字节跳动的AI视频模型2.0静悄悄地展开了上线内测,然而海外创作者却着急得不得了,急得跳脚,他们什么办法都没有,只能眼巴巴傻看着国内网友利用漫画分镜生成电影片段,而他们自己连试用资格都没办法抢到。这款模型所带来的并非是那种靠参数堆砌起来的升级,而是实实在在地让视频创作从以往的“剪素材”状态转变成为了“写脚本”状态。

单指令生成多镜头

之前,AI视频工具仅能生成时长为几秒的零零散散的片段,人物的长相在这一刻呈现的还是黄皮肤,然而到了下一秒却变成了白人模样。字节2.0所搭载的双分支扩散变换器架构,将这个在行业里普遍存在的问题给解决掉了。当用户输入“傍晚城市追车戏”这样一个简单的指令后,模型可以自动规划出七八个连贯的镜头,先是从远景进行跟拍,而后再到车内特写,主角的衣服、车身的颜色以及黄昏时的光线,自始至终都保持着一致。上海有一位参与内测的广告导演跟我讲,他花费三分钟生成的一条时长为15秒的短片,甲方仅仅看了一遍就通过了。

这表述的是,以往专业视频团队要耗费一天时间方可完成的预视觉化分镜工作,如今一个实习生在喝杯咖啡的这段时间便能够完成敲定下来。字节内部展开进行的测试所生成的数据表明,2.0针对镜头连贯性的处理效率相较于1.0版本增加提升了将近四倍。

自带原生音轨不是配乐

好多人觉得AI视频加音轨就是马马虎虎塞一首背景音乐了事,字节2.0做的可不是这样。它能够依据画面内容生成相匹配的环境音以及人物对白音轨,汽车漂移的时候会有轮胎摩擦地面那种刺耳的声音,下雨的场景能够听到雨滴打在挡风玻璃上的节奏。深圳有一位B站UP主在测评视频当中进行了演示,他输入“地铁站离别对话”,模型不光生成了男女主角对视、转身、列车驶过的画面,还自动配上了地铁报站声、脚步声以及模糊的对话气声。

传统视频后期,需去找音效库,要进行对口型操作,还要去调音量电平,而在2.0里,这些工序被压缩成了一个生成按钮,即梦APP后台数据所显示的,在内测用户当中,超过六成是第一次尝试去做短片,他们根本就没有专业音频处理能力,然而现在也能够产出音画同步的内容。

真人验证卡住出海路

临近 2.0 时,在梦和豆包 APP 的内测阶段设定了一项条件,即需要用户完成录音录像真人校验,才可以生成分身以及让其在 AI 短片里出镜。有一位身处北京的 AI 从业者进行了吐槽,称其为了尝试使用这个功能,对着手机念了三次验证词才得以通过。这样一套机制直接将大量海外测试账号过滤掉了,这也是致使海外创作者干着急的关键原因。字节内部文档把这一系列流程定义为“安全探索”,其目的在于防止深度伪造被滥用。

由实际呈现的状况而言,该设计切实阻挡了众多怀有尝新意愿之人。于推特之上,存在技术领域博主进行发帖表达不满,其设法借助中国友人帮忙录制验证层面的视频而历经两日波折,最终友人因嫌烦而不再予以协助。字节方面针对此情形未作公开回应,然而据知悉内情之人透露,合规所占据的优先等级已被提升至以前所未有的空前之程度。

漫画分镜变成动作电影

最令创作者兴奋不已的 2.0 能力,乃是能够识别漫画分镜格的叙事逻辑。广州美术学院有一位动画系学生 ,上传了自己所画的四格漫画 ,主角先是推开窗 ,接着探头看 ,然后跳下窗 ,最后落地跑远。模型将这四个静态格子 ,扩展成了包含推拉摇移运镜的 12 秒追逐戏 ,并且还加上了原著未曾有的航拍俯视镜头。这条视频在抖音收获了 87 万点赞 ,评论区里不少人询问这是哪部新电影的预告片。

由原画师逐帧创作,才得以成就传统动画制作里一秒钟24帧那般流畅的动作,然而当下,有个未曾接受过专业动画训练的学生,仅仅通过手机上传几张草图,便获取到了成片。字节内测文档中提及,2.0能够领会分镜间具备的逻辑留白,进而自动去填补角色动作的中间帧。

海外创作者连夜搬运

名额有限的字节2.0内测,然而,就现状而言,海外社交平台相关话题如今播放量已然突破三千万。纽约有一位视频播主,其将国内网友发布的测评视频剪辑到一起,进行逐帧分析模型运镜逻辑,如此这般的这条二次创作视频,单条播放量突破两百万。评论区里最高赞留言乃是“中国公司把好莱坞特效团队的工作流写进了一行行代码里”。

实际上,美国Runway以及Pika等类似产品,其付费用户已然开始于社交媒体发出抱怨了,抱怨自己所订阅的年费足矣购买一台PS5,然而产出的视频却依旧存在角色变脸的情况。字节2.0生成的日本武士挥刀片段被搬运至Reddit后,有外国网友留下询问信息,询问这个特效团队的联系方式,之后被告知这是由AI生成的,他回复了一串省略号。

零后期成片改变行业生态

在北京,有一家处于头部位置的MCN机构,其中有个制片人。他算了一笔账,在他们公司以往的时候,拍摄一条剧情类短视频。这其中包含脚本、堪景、拍摄、剪辑、调色以及配乐这六道工序。最少的情况下,需要花费五天时间,而且预算是三万元起步。后来用2.0进行了几条样片的尝试之后。他将流程压缩成为了编剧撰写文字脚本、模型生成成片、运营直接进行上传这三个环节。制作成本降低到了原来的二十分之一。

这并非单纯的效率得以提升,而是专业壁垒出现了坍塌情况。往昔唯有学习过剪辑、懂得视听语言的那些人方可担任视频导演,现在一名会讲故事的高中生便能达成同等质量的输出。字节2.0内测文档末尾写有一句话:“让叙事回归创意本身”。这句话被不少业内人士进行了截图转发之举,有人讲这是技术平权的宣言,也有人认为这是对传统影视工业的温柔警告。

当你处于体验这些AI视频工具的状态之中的时候情形之下,你会更加在意生成画面的质量这一方面情况状况,还是会担心在未来某一天时间日子自己所从事的创意工作也会被模型替代取代呢?在评论区交流讨论说出你的看法观点,要是觉得这篇文章具备有价值意义欢迎进行点赞转发。