AI实战乱弹

当时间线前进到2024年的第一季度,openai发布了sora视频生成模型。这一创举,颠覆了aigc行业。传统,一般是使用diffusion扩散模型。而sora运用到了基于llm的transformer大语言模型,使得生成的视频更真实。也有人说,sora是真正的世界模型。
在这之前,chatgpt被公开llm数据数量为7b(70亿),也就是连接了全球所有的人。而在sora之后,马斯克公布了grok语言模型,有314b(3140亿)可能融入了有很多时间线上的数据。而中国人工智能领域的布道者——李开复旗下的公司,也公开了他们的大模型,零一万物。
在openai公布sora后不久,又公开了他们的新产品,figure——一款结合ai的具身机器人,一款真正可以和人对话并行动的人形机器人。
据之前的线报,openai将于今年第二季度开放chatgpt4.5。而汽车领域,还在争到底是L4,还是L5,甚至可能L6。
坐山观虎斗的小米,则推出了SU7小米汽车,相信,系统一定也结合了小米ai。而另一方面国外的波士顿动力机器人和aloha炒菜机器人,项目也进行得如火如荼。甚至出现了美军用AI搞战斗机。
有人说,以后用sora生成影视,用genie(谷歌的互动生成框架)生成游戏。也许,不久的将来,真的可以实现全自动化。
而之前的runway,pika,dalle又被打脸。可能是因为生成的效果,没有被称为“世界模型”的sora真实。
相信,未来一定是扩散模型+大语言模型的天下,也期待sora和genie更精彩的表现。

Tags:,

Add a Comment