视频大模型Vidu发布3个月后正式全球上线 记者实测

发布时间:2024-08-01 13:45:46来源:nba小九直播浏览次数:1作者:nba小九直播高清

  Vidu是文生视频大模型Sora爆火之后,国内最早号称要“对标Sora”的大模型。4月27日,在中关村论坛未来人工智能先锋论坛上,清华大学教授、生数科技首席科学家朱军发布了Vidu,引发业界轰动,但此后便从始至终保持低调。在此期间,快手的可灵、智谱AI的清影已经先后开放给用户使用,其中,可灵一上线就吸引了众多用户的关注,目前生成一次视频的排队时间甚至要等待几十小时。

  作为第一个亮相,但上线略晚于同行的视频大模型,Vidu有何特别之处?新京报贝壳财经记者做了实测。

  新京报贝壳财经记者看出,此次Vidu上线面向的是全球用户,通过网址()用户都能够进入Vidu界面,此后可选择谷歌账户登录或者邮箱登录。登录后的创作界面,可选择上传图片或输入文字两种方式来进行AI视频生成,也能够使用图片与文字结合的方式。

  记者首先以“一个带牛仔帽的身影背对镜头,看着对面的落日,天空中还有两颗行星的影子,金黄色的天空下,地面是被风吹过的草地和树影”为提示词进行了输入,Vidu生成的视频不仅满足了记者在提示词中的要求,天空中的云朵和星球的光影也显现出了跟随时间转换的效果,同时,视频中人物出现了一个“扶帽子”的动作,相比之下,记者数天前以同一提示词输入快手可灵和智谱清影时,人物并未出现非常明显的动作场景。

  在生成时间上,生数科技方面表示,Vidu在推理速度上取得了突破,4秒视频片段的生成时间实测仅需30秒,比业内最快水平的Gen-3工具快一倍。

  不过,记者在实测中发现,对于上述生成的视频,Vidu生成进度条加载完毕的时间在40秒至50秒,但当“生成中”的进度条读满,视频并未立即出现,记者此后又等待了一段时间才看到最终生成的视频。而当记者在今日中午12时49分测试图+文字生成视频时,等待超过2个小时也未能成功生成,最终截止至发稿,视频显示“生成失败,积分已退回,请稍后重试”。

  生数科技方面表示,Vidu生成的视频分辨率最高达1080P,除了文生视频和图生视频两大基础功能外,Vidu上线动漫风格和角色一致性两大新功能。

  其中,动漫风格选项不仅保持动漫风格的一致性,还提高了画面的稳定性,避免了其他视频生成工具“动漫化”时常见的画面跳变和风格突变等问题。而“图生视频”板块中,Vidu的角色一致性功能令用户可上传人像图或者自定义的角色图,然后通过文字描述指定该角色在任意场景中做出任意动作。

  “目前业界对类Sora视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态的一致性,Vidu很好地平衡了三个方面的表现。 在画面质感上,Vidu在构图、叙事和光影等方面,能达到接近电影级的画面标准,Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG特效等。”生数科技方面表示。

  贝壳财经记者看出,进入Vidu后,默认使用的为Vidu“免费版本”,但与可灵和清影的免费设置略有不同,使用Vidu生成一次视频是耗费积分的,记者使用文字生成一次视频耗费了4积分,如果想把该视频升级成超清模式,还会再消耗4积分。

  根据Vidu免费版的设置,每月每人有80积分,可生成4秒视频,支持超清。此外,对于商用、去除水印(目前使用免费版Vidu生成的视频在右上角有Vidu的水印)等要求,Vidu还推出了包月和包年套餐,以包月套餐为例,有“标准”“高级”“尊享”三个版本,收费分别为9.99美元、29.99美元、99.99美元。

  和其余许多视频大模型公司一样,Vidu也设置了测试计划,邀请一部分“Vidu艺术家”参与测试,提供积分与合作机会。

  而对于B端用户,目前Vidu开放了API,不过需要填写申请问卷才能用。贝壳财经记者看出,问卷包括7个问题,填报问卷将有机会获得少数的免费API使用额度。不过,生数科技方面回复记者称,由于目前暂时还处在内测申请阶段,API的价格暂未确定。

  “我们希望开发者们能够在Vidu的基础上开发各类应用,将多模态大模型带到更多场景中。目前,我们正在寻找第一批种子用户来测试我们API服务的稳定性,以便更快向全部开发者推出。”Vidu在官网表示。

上一篇:新技术赋能老电影修复:光影重生 经典再现 下一篇:【48812】AI让老电影勃发“重生”