AI奇点网2024年3月20日报道丨AI资讯早报
当地时间3月19日报道,OpenAI CEO奥特曼本周作客科技博主Lex Fridman 的访谈中表示,一年前上线的GPT-4 其实“有点糟糕(kind sucks)”,阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。
当被问及 GPT-4 及其最令人印象深刻的能力时,他说道,“展望未来几年,我们应该意识到我们现在拥有的工具将来看来会非常落后,这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会,我既不想贬低 GPT-4 的成就,也不想夸大其词,”奥特曼说,“正因我们正处于指数级发展的曲线上,所以很快我们就会像现在看待 GPT-3 一样看待 GPT-4。”
奥特曼还认为,GPT-4的确存在“令人惊鸿一瞥的闪光点”,但他指出,ChatGPT 在处理复杂的多步骤问题时几乎没什么用处。令他感到”神奇“的情况少之又少。
知名开源大模型公司Stability AI又上新了!当地时间3月18日,该公司网站发布用于渲染3D视频的生成式AI视频工具Stable Video 3D(SV3D)。
据了解,Stability AI一直在开发其Stable Video技术的视频功能,使用户能够从图像或文本提示生成短视频。SV3D在Stability AI之前的Stable Video Diffusion模型的基础上进行了改进,适用于新视角合成任务(Novel View Synthesis) 和3D生成的任务。
通过SV3D,Stability AI通过能够根据单一输入图像创建和转换多视图3D网格,为其视频生成模型增加了新的深度。
在去年12月,Stability AI曾经推出Stable Zero123三维建模模型,该模型基于Stable Diffusion开发,并且一次输出一张图像。SV3D基于Stable Video Diffusion模型,并且同时输出多个新视角,而这也是SV3D的关键优势。根据Stability AI的说法,SV3D能够从任何给定角度提供连贯的视角。
SV3D现已可供商业使用,订阅Stability AI Professional的会员每月20美元(对于年收入不到100万美元的创作者和开发者)。该模型最低的显卡运行要求为英伟达GeForce RTX 4090及以上。
近日,谷歌在其 GitHub 页面发布博文介绍一款名为 VLOGGER AI 的新模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
项目主页:
https://enriccorona.github.io/vlogger/