视频大模型Vidu发布3个月后正式全球上线记者实测

发布时间：2024-08-01 13:45:46来源：nba小九直播浏览次数：1作者：nba小九直播高清

Vidu是文生视频大模型Sora爆火之后，国内最早号称要“对标Sora”的大模型。4月27日，在中关村论坛未来人工智能先锋论坛上，清华大学教授、生数科技首席科学家朱军发布了Vidu，引发业界轰动，但此后便从始至终保持低调。在此期间，快手的可灵、智谱AI的清影已经先后开放给用户使用，其中，可灵一上线就吸引了众多用户的关注，目前生成一次视频的排队时间甚至要等待几十小时。

作为第一个亮相，但上线略晚于同行的视频大模型，Vidu有何特别之处？新京报贝壳财经记者做了实测。

新京报贝壳财经记者看出，此次Vidu上线面向的是全球用户，通过网址（）用户都能够进入Vidu界面，此后可选择谷歌账户登录或者邮箱登录。登录后的创作界面，可选择上传图片或输入文字两种方式来进行AI视频生成，也能够使用图片与文字结合的方式。

记者首先以“一个带牛仔帽的身影背对镜头，看着对面的落日，天空中还有两颗行星的影子，金黄色的天空下，地面是被风吹过的草地和树影”为提示词进行了输入，Vidu生成的视频不仅满足了记者在提示词中的要求，天空中的云朵和星球的光影也显现出了跟随时间转换的效果，同时，视频中人物出现了一个“扶帽子”的动作，相比之下，记者数天前以同一提示词输入快手可灵和智谱清影时，人物并未出现非常明显的动作场景。

在生成时间上，生数科技方面表示，Vidu在推理速度上取得了突破，4秒视频片段的生成时间实测仅需30秒，比业内最快水平的Gen-3工具快一倍。

不过，记者在实测中发现，对于上述生成的视频，Vidu生成进度条加载完毕的时间在40秒至50秒，但当“生成中”的进度条读满，视频并未立即出现，记者此后又等待了一段时间才看到最终生成的视频。而当记者在今日中午12时49分测试图+文字生成视频时，等待超过2个小时也未能成功生成，最终截止至发稿，视频显示“生成失败，积分已退回，请稍后重试”。

生数科技方面表示，Vidu生成的视频分辨率最高达1080P，除了文生视频和图生视频两大基础功能外，Vidu上线动漫风格和角色一致性两大新功能。

其中，动漫风格选项不仅保持动漫风格的一致性，还提高了画面的稳定性，避免了其他视频生成工具“动漫化”时常见的画面跳变和风格突变等问题。而“图生视频”板块中，Vidu的角色一致性功能令用户可上传人像图或者自定义的角色图，然后通过文字描述指定该角色在任意场景中做出任意动作。

“目前业界对类Sora视频模型的评价主要围绕三大核心维度：语义理解准确性、画面美观性、主体动态的一致性，Vidu很好地平衡了三个方面的表现。在画面质感上，Vidu在构图、叙事和光影等方面，能达到接近电影级的画面标准，Vidu还能生成影视级特效画面，如烟雾、炫光效果、CG特效等。”生数科技方面表示。

贝壳财经记者看出，进入Vidu后，默认使用的为Vidu“免费版本”，但与可灵和清影的免费设置略有不同，使用Vidu生成一次视频是耗费积分的，记者使用文字生成一次视频耗费了4积分，如果想把该视频升级成超清模式，还会再消耗4积分。

根据Vidu免费版的设置，每月每人有80积分，可生成4秒视频，支持超清。此外，对于商用、去除水印（目前使用免费版Vidu生成的视频在右上角有Vidu的水印）等要求，Vidu还推出了包月和包年套餐，以包月套餐为例，有“标准”“高级”“尊享”三个版本，收费分别为9.99美元、29.99美元、99.99美元。

和其余许多视频大模型公司一样，Vidu也设置了测试计划，邀请一部分“Vidu艺术家”参与测试，提供积分与合作机会。

而对于B端用户，目前Vidu开放了API，不过需要填写申请问卷才能用。贝壳财经记者看出，问卷包括7个问题，填报问卷将有机会获得少数的免费API使用额度。不过，生数科技方面回复记者称，由于目前暂时还处在内测申请阶段，API的价格暂未确定。

“我们希望开发者们能够在Vidu的基础上开发各类应用，将多模态大模型带到更多场景中。目前，我们正在寻找第一批种子用户来测试我们API服务的稳定性，以便更快向全部开发者推出。”Vidu在官网表示。

上一篇：新技术赋能老电影修复：光影重生经典再现下一篇：【48812】AI让老电影勃发“重生”

视频大模型Vidu发布3个月后正式全球上线记者实测

联系

Contact

视频大模型Vidu发布3个月后正式全球上线 记者实测

联系

Contact

视频大模型Vidu发布3个月后正式全球上线记者实测