毫不夸张地说,Demo战神是AI世界中最不可或缺的存在。宣传视频时有出现,但实际上每一个都有其独特的魅力。但对于施乔来说,这是他第一次看到比推销员秀更震撼的世界模特。 。 。是的,我们正在谈论谷歌最新的Project Genie。 Project Genie 发布后几乎立即流行起来。谷歌 DeepMind 的官方推文在 12 小时内疯传,获得超过 4,000 条转发、近 20,000 条点赞和 10,000 条收藏。一位弟兄趁机提及摇滚明星。 Project Genie“将使我们能够在 GTA6 正式发布之前完成其开发。”更有一些自命不凡的兄弟直接将Project Genie和GPT-2进行了比较。我们都知道GPT-2对于AI行业意味着什么。事实上,Project Genie 的底层模型并不新鲜。该模型沿用了Google公布的全球模型“Genie 3”去年八月就曾举行过会议。但现在,Project Genie 将 Genie 3 和 Nano Banana Pro 结合在一起,带来了重大的游戏玩法升级。 Genie 3 官方样本 有些朋友可能对世界模型不太了解。这一点与视频模型不同。它的目标不是生成视频,而是构建一个可以无限生成、可以探索和交互的物理世界。你可以将其视为《我的世界》的无边界版本。据谷歌官方博客介绍,Project Genie的功能主要分为三个部分:世界草图、世界探索、世界再合成。简而言之,绘制世界包括输入场景的台词和人物的台词。 Nano Banana Pro 负责在屏幕上生成草图。首先,它会告诉您对视觉效果是否满意以及您是否想使用第一视角或第三视角。然后交给 Genie 3 并实时生成一个可探索的物理世界。我。这就是对世界的探索。最后,世界重新合成允许您根据现有关键字继续改变世界的外观。与过去只有几个演示案例不同,现在任何人都可以根据自己的需求进行定制。例如,在官方示例中,场景的起始词是“有很多珊瑚的海底世界”,角色描述是“金鱼”。结果如下:或者,如果你随意拍一张日常生活的照片,你可能会立即动起来。这样的效果是不是很像两个人的旅行呢?你也可以随时中断并退出原来的世界,只改变人物和背景。具有高稳定性和高操作自由度。至少从官方案例来看,不仅图像准确,而且世界模型场景、运行时崩溃、掉帧、卡顿等老问题都得到了解决。当然,有些警察会看官方的并问:“这就是全部内容了吗?”您是否觉得根本上什么都没有改变?或者你买WASD,研究这个有什么意义?如果呢? 。 。这是大家私下测试的结果。您是否注意到香烟盒、五彩纸屑等会相互碰撞?这个还在吗?或者是这样的吗? ? ?这和当年惨遭血洗的B站游乐区有什么区别? ?有网友表示,这是他创作的第一款人工智能电子游戏。这真的只是一个游戏。 。 。即便大家怀疑上述事件并非真实记录,只是一个玩笑,但依然有证据可以验证。相比之下,Vibe Coding 和 AI 可以帮助您编写游戏开发代码。世超宣布Project Genie是游戏行业的新高度。水迷肯定会玩得很开心,但不知道有多少游戏创作者会敲响谷歌的大门。 。 。但是伙计们,别看现在来看看 Project Genie 有多好。事实上,很多人早已对世界模型产生了深深的怀疑。它可以导致连大型模型都无法达到的AGI,更不用说是否能够真正穿透物理世界了。 。 。这对视觉数据的要求非常高,当与多个运动数据结合时,训练需要数倍于大型模型的计算能力。仅仅实施它是相当困难的。尽管经过多年的深入研究,结果仍然平庸。 。 。就像精灵3刚发布的时候,只能看不能玩,但世超也用了谷歌发布的几个demo来解决这个问题。总体来说还可以,但不算惊艳。就这样。我知道《精灵3》已经在业界处于全球模型领域的顶端,但这个庞然大物也仅此而已,看上去更像是一款场景渲染不佳的小游戏。同样,我们之前测试过李飞飞教授的Wo发布的Marble World模型rld Labs,但只能说其效果与Project Genie相差甚远。分辨率的刷新率相对较低,因此速度较慢。物质世界还没有被很好地理解,并且常常延伸到天上和地上。存在模型记忆有限、一转身时最初看到的人就消失等问题。这些问题并不是 Marble 所独有的,它们在世界各地不同团队开发的不同模型中已经存在多年,而且似乎很难使用。嗯?你用完它了吗?但现在有了天才计划,谁说世界模型没用了?这个世界模型很棒。目前还不能保证能够创造出一款复杂的游戏,而且与《头号玩家》这样的科幻电影相差甚远,但至少随着技术的成熟,用不了多久,它的潜在应用就会像大规模语言模型和视频生成模型一样广泛。例如,当人工智能用于广告时过去,视频生成的时间段是有限的。组装几十秒或一分钟的短片段需要花费很大的力气,并且必须非常小心以确保主体不倒塌。不可能前一秒是小米,后一秒是法拉利。此外,后期创建视频通常需要手动创建非常复杂的 3D 模型和场景,这可能非常耗时。将来,像 Project Genie 这样的世界模型还允许您只需单击一下即可将它们转换为 3D 对象或 3D 场景,只要您首先使用信号词甚至指定预先生成的图像即可。您想要什么类型的照片并不重要。有人说好,有人说不好。一些尝试过Project Genie的人表示,体验一般,不是很顺利,有时会停滞不前,而且有时间限制。谷歌官员还表示,Project Genie 仍有很大的改进空间。产生的结果可能与文字和图像不同消息中提供的内容可能与实际物理定律有所不同。你的性格可能会更难控制,或者你的行动可能会延迟更长时间。每一代仅需 60 秒。不管是什么,石乔都想亲自尝试一下。事实证明,Google 太糟糕了,Project Genie 目前仅适用于美国 Google Ultra 的帐户,并且需要 18 岁或以上的年龄验证。相信大家都知道我是怎么通过py获得Pro账号的,但是看来谷歌对Pro的限制很严格,而且它变得越来越难用了。但这不是什么大问题。毕竟,大家都很欣赏刚刚出现的新事物。但一旦第一个技术被创造出来,这项技术的普及只是时间问题。从自然语言建模研究到开发 GPT-2 花了几十年的时间。但从 GPT-2 到今天的语言模型大战,只用了两年多的时间。刚刚开始的全球模式充其量只是一个未来玩具。当然,与语言模型一样,我们可能正处于一个我们尚未意识到的起点。作者:莫莫莫天天 编辑:江江面 出品方:轩轩影业,数据来源:Project Genie 官方播客、World Labs 官网、Xhttps://gabetherielist.artstation.com/projects/e0Dw0b
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。