《The Information》今天独家报道了 Altman 上个月向 OpenAI 内部发送的一份备忘录,其中他表示谷歌最近在人工智能领域的进展可能会给该公司带来暂时的财务障碍。现在,他们似乎已经感受到了压力,而不是抵抗。在互联网时代,谷歌是老大哥。很明显,他们想要拿下OpenAI,保持AI时代第一的地位。 Gemini 3.0 Pro的热度不减,全宇宙最强影像型号Nano Banana Pro现已上市。距离第一个让所有人惊讶的版本发布已经过去了不到三个月的时间。此次更新提供了更大的一致性,并且还与Gemini 3.0 Pro同步了全局知识,大大提升了多模态理解和推理能力。以前的桌面人物变成了“照片和音乐”。现在,Nano Banana Pro的地址更新更加清晰,更接近成为效率工具。网友们用它来创建和编辑各种复杂的视觉效果,生成内容精确、布局优雅的信息图形。为了充分利用 Nano Banana Pro 的所有功能,我们研究了几款流行的在线游戏和 Google 的官方使用指南。将文章变成风格化的信息图表 由于改进了长文本渲染功能,互联网上最流行的测验现在可以生成信息图表,从知识的密集解释到黑板和墙壁上的经典诗歌以及数学问题的答案。例如,以下测试将您逐字输入的文本转换为杂志内容。 ▲ 图片来源:评论区有人问插画时代是否即将结束。 ▲图片来源:X@tobi|关键词:Nano Banana Pro 来了,让我们把这份降价成绩单变成一张信息图。现在我们可以使用Google搜索,我们的推理和理解能力有了很大的提高,所以当涉及到生成使用信息图表时,我们不必那么严格。如果您没有主题,您可以告诉他们您想要创建什么类型的信息图,并且您不必太担心消息的文字结构。 ▲消息:生成2026年中国度假计划的信息图,全部为中文,4K画质,16:9。例如,当我们要求您创建有关明年假期的信息时,我在 Gemini 中看到了返回的答案。通过Google搜索得到了明确的信息结果:多个官方公告的网页链接。还有一系列非常吸引人的信息图测试,网友的指示也比较简单,就是:“帮我生成xx信息图”。一个有趣的繁华城市信息图,展示了在繁华城市工作的动物,并解释了它们的不同工作。 ▲ 图片来源: ▲ 图片来源: 将复杂的文档转变为清晰、可扫描的白板式信息图表。 ▲ 图片来源:Nano Banana Pro is perf等用于创建漫画、具有大量文本的信息图表,现在可以在单个请求中生成多张照片。有网友简单上传了一张照片,并输入了“根据这张照片创作并绘制多版漫画”的信息。他获得了几部自己写剧情的漫画,之后不断更新。 ▲ 图片来源:Nano Banana Pro 可以启用网络搜索,检索此人的信息,找到帐户 X,并根据帐户 X 发布的内容信息生成漫画。 ▲ 图片来源:Hice NanoBanana Pro 漫画版马斯克和奥特曼的生活。双子座的网络版本一次显示三张照片。从漫画的内容就可以看出他拥有世界知识。 ▲ 提示:生成一些展示 Elon Musk 和 Sam Altman 生活的现场卡通图像,全部为中文。与上一代 Nano Banana 的一致性类似,当前的 Pro 版本也表现良好。例如,模特和衣服。它类似于给模特穿上不同的衣服。 Nano Banana Pro 在各种外围设备上放置一些徽标或替换现有产品图像上的一些小元素时也非常有效。官方 Google AI Studio 示例包括多个信息图表生成和漫画制作的示例。他们使用 Nano Banana Pro 模型构建了多个项目。 ▲测试地址:https://aistudio.google.com/apps?source=showcaseshowcaseTag=nano-banana其中之一是,只需上传你的文章链接,就可以生成4种不同风格的信息图,包括有趣、简洁、黑科技风格和现代编辑风格。只需给它一个模糊的概念或主题,您就会生成完全不同风格的信息地图。 ▲ Google AI Studio 提供 Demo 4K 壁纸生成、逼真的街机游戏体验以及供品牌使用的各种徽标映射设备。 ▲雪景金门大桥4K壁纸我们用我们的小项目“无限英雄”来生成马斯克和奥特曼的漫画。在预览漫画时,您还可以选择情节的方向并决定下一部漫画的内容。 ▲生成的漫画下载后会转换为PDF文件。不过,目前Nano Banana Pro型号的API并不是免费的,所以AI Studio中的这六个项目必须链接到一个支付方式才可以使用。但是,所有这些项目都提供您可以进行更改的源代码。如果你看后面的代码,你还可以看到后面的关键字。我们提取了该项目的关键字“入站链接”,以生成四种信息图表样式。首先,使用关键字总结网页链接的内容,并将 ${url} 替换为您需要解析的实际文章的链接。可以直接将${语言}替换为中文,即可显示中文。您是一名专业的信息设计师。其目标是从网页中提取重要结构,以创建清晰且具有教育意义的内容信息图表。解析此 URL 的内容:${url} 目标语言:${ language}。提供专为 ${language} 视觉表示而设计的结构化细分。 1. 信息性标题:中心主题(${language}),最多 5 个单词。 2. 要点: 3 至 5 点最重要的单个步骤、步骤或事实(以 ${ language} 表示)。这些将是图像的主要部分。 3. 支持数据:具体数字、百分比或增加可信度的非常简短的引用。 4. 视觉隐喻想法:提出一个最适合此内容的简单视觉概念(例如“具有里程碑的路线图”、“漏斗”、“三个对比支柱”、“圆形流程图”)。保持结果简洁,仅关注您希望信息图显示的内容。确保所有内容均采用 ${language}。一旦您了解了本文的这一部分,您就可以开始生成图像了。严格根据此结构化内容计划创建专业、高质量的教育信息图表:${structuralsummary} 视觉设计规则: – ${styleguidelines} – 语言:信息图表中的文本必须以 ${ language} 编写。 – 设计:如果上述计划有“隐喻想法”,则应遵循。 – 版式:干净、易于阅读的无衬线字体。 “信息图标题”应出现在顶部的显着位置。 – 内容:使用真实的文本来表达图像的“关键点”。占位符文本(例如 Lorem Ipsum)请勿使用删除线。 – 目标:图像应该作为独立的图形提供丰富的信息并且易于阅读。图片生成的关键词相对简单。将 ${structuralsummary} 替换为上一篇文章中的链接分析结果。 ${styleguideline} 选择允许您选择官方项目中提到的四种样式之一。有趣又有趣:风格指南 = 风格:有趣、有趣、充满活力的 2D 矢量插图(最多使用明亮的颜色、圆形和友好的色调。最多使用强调色)。非常精致且通风。技术要点深色模式的auty:风格指南=风格:深色模式的技术之美。深/黑色板岩背景,数据点采用明亮的强调色(青色、柠檬绿)。现代编辑:风格指南=风格:现代平面矢量插画风格。干净、专业且经过编辑(就像高端技术杂志一样)。具有凝聚力和成熟的调色板。按照这个方法,我在 Gemini 上发表了 Nano Banana Pro 发表的文章,并得到了以下信息图:官方生成照片的 7 个技巧。除了使用这个预先写好的关键字之外,Google 还尽力提供了使用 Nano Banana Pro 的详细建议。另一方面,我担心不知道如何操作,对模型有误解。另一方面,谷歌确实希望 Nano Banana Pro 不仅仅用于娱乐。我们非常高兴尝试原始图形模型并看看它如何提高我们的生产力。立即生效的话的重要性。对于需要精确控制的内容,模型本身除了物理能力之外,这是剩下的决定因素。谷歌重申,好的信息应该包括明确的主题、组织、行动、布局、风格和编辑方向。用几句话描述照片的主要主题。例如,指定照片中的人物或内容。您想告诉模特这张照片的构图是如何组合在一起的吗?特写、广角镜头、低角度镜头、人像镜头等。 ▲范例:一只戴着小巫师帽的毛茸茸的三色猫在黄昏阳光普照的草地上施展魔法,低角度镜头,照片写实。以下是对该动作的解释,但是照片的主题发生了什么?请描述具体的场景和发生的地点。最后,决定摄影风格,从各种一般审美风格中进行选择,包括 3D 动画、黑色电影、水彩、照片写实主义和 90 年代产品照片嘿。谷歌还表示,如果你追求更可控的图像效果,你可以进一步细化相机、灯光、格式等细节,并细化关键词内容。例如,当前的 Nano Banana Pro 支持自定义设置和宽高比。你可以选择9:16的竖版海报、21:9电影的广角镜头等。此外,在摄影和灯光细节方面,谷歌提供的实用提示将引导你像电影制片人一样进行拍摄,并用具体的词语帮助你尽可能专业,例如“低角度拍摄、浅景深(f/1.8)、黄金时段逆光、创造长阴影、电影级调色板和柔和的蓝绿色调的使用”。即兴的话,比如。 ▲例:黄昏时分,一只戴着小巫师帽的毛茸茸的三色猫在阳光照耀的草地上表演魔术。电影般的调色板,具有低角度拍摄、浅景深 (f/1.8)、黄金时段背光,可产生长阴影和柔和的青色色调。真实照片米。电影般的平移镜头 21:9。标题“Cats Cast Spells”将以漂亮的彩虹色字体出现在顶部。在处理管理任务时,有必要清楚地表明文本是什么、它出现在哪里,以及与该文本相对应的字体。对于图形和信息图表,提示语言必须向模型清楚地传达准确性要求,并确保输入正确。向模型询问每个图像的功能以及需要编辑的具体区域。掌握关键词公式只是基础。以下是Nano Banana Pro官方推荐的一些具体应用场景。 1.不要画幽灵角色,而是让AI真正“写”它们。此前,AI绘图最害怕的就是文字,出现的就是乱码文字。新模型显着改进了文本表示。您可以直接要求我们生成海报标题、复杂的图表或详细的模型描述。 ▲ 柯ywords:创建和使用信息图。本文将教您如何做老北京豆汤。 2.了解物理和历史。基于Gemini 3的推理能力,该模型拥有更丰富的世界知识,能够生成逻辑严密、符合历史事实的图像和场景。 3.最多支持14张!超融合法。这可能是新型号最强大的功能之一。您可以输入 6 到 14 张(具体数量取决于平台)完全不相关的照片,然后让 AI 将它们合并在一起以创建全新的照片。借助多图像输入功能,您可以在不同场景中保持同一人物的相同面孔和特征一致,甚至在集体肖像中也可以保持相似性。这非常适合创建漫画和故事板。 ▲提示:将这些图像组合成16:9格式的正确定位的电影图像,并用图像中的衣服替换模特的衣服。 4.调整大小准确。尝试使用不同的纵横比,在各种产品上生成 1K、2K 或 4K 分辨率的清晰图像。 5. 准确修饰照片中您所指的位置。谷歌使用这个以获得更专业的结果。这称为工作室级控制编辑。 6.品牌设计神器:自动测绘。对于设计师来说,保持一致性的能力比原来的 Nanobanana 有所提高。品牌可以使用人工智能在 3D 对象上打印徽标、图案和相应的艺术品。同时,粘贴的徽标将自动调整到原始图像的自然光、阴影和纹理。 7.完善的跨语言翻译。它不仅是一个图像生成工具,还允许您直接“翻译”图像中的文本。 ▲ 提示词:将三个黄蓝罐上的英文全部翻译成韩文,其余内容不变。 Nano Banana Pro虽然很强大,但官方文档也公开描述了它目前的限制,应谨慎使用。主要原因是渲染具有复杂拼写的非常小的文本仍然会导致错误。此外,当您使用它生成数据图表和信息图表时,它会提醒您手动查看数据。人工智能是有逻辑的,但有时也会说一些严重的废话。毕竟,我们都已经看到人工智能的一厢情愿有多么糟糕。最后,非常复杂的光照变化或图像融合可能会导致最终照片中出现不自然的伪影。该模型目前在 Gemini 应用程序和 Gemin 网页版中可用,但必须使用付费 API 才能在 AI Studio 和 Vertex 平台上体验。我们还收集了一些您可以立即使用的平台,无需付费订阅或复杂的网络设置。海螺AI(国内版hailuoai.com、国际版hailuai.video) Flowith(flowith.io、flowtith.net) PixVerse(国内版pai.video、国际版pixver)se.ai)youmind.com(限时,免费1周,注册即可使用)lovart.aibanana.listenhub.aihiggsfield.ai/image/nano_banana_2(免费用户每月有10积分,在Nano Banana Pro上每张照片花费2积分)有兴趣的朋友可以尝试上面的公式。想要享受新奇有趣的玩法,欢迎在留言区评论。最后,一个小复活节彩蛋:这张经典披头士专辑的封面照片。奥特曼、面具、老范、小扎来到我们未来经纪公司同款“拍戏”。您会参加本周末的 APPSO AIDONE 活动吗?
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由仅提供信息存储服务的社交媒体平台网易号用户上传并发布。