谷歌放大招了!全新升级的多模态能力,强到离谱

1 分钟
AI

大家好,我是 luckySnail,就在昨天谷歌的 Gemini 2.0 Flash Experimental 原生多模态生图功能正式发布,玩了几个小时候,我真的迫不及待的想分享一下,太强大了!先看看它能做的事情:

  • 图片生成
  • 图片编辑
  • 创建图片故事
  • 设计生日贺卡

我们先看一下效果,最后再讲如何体验,如果你想直接体验,可以直接下滑到「使用教程」

图片生成

下面 Gemini 一次生成的我最喜欢的海绵宝宝和派大星,直接就可以使用了! 那我们就可以发挥想象力,生成猫和老鼠握手言和的图了!

图片编辑

上面猫和老鼠的文字显示位置可能不太好,我们可以通过对话进行调整: 我们还可以基于网图二创:

创建图片故事

这是最有前景的功能,我们使用它来生成一个外卖员从取餐到把外卖送到顾客手中的故事:

下面是让它从 0 到 1 生成游戏人物的示例: 绝了!

设计生日贺卡

我觉得这个是非常实用的功能,我目前想到使用它来设计婚礼请帖,大家觉得生成效果怎么样?

设计一张具有中国文化的喜帖卡片。应该使用中国红作为主题色,文字应较大,并写着:“小张 ❤️ 小王的婚礼邀请”

使用教程

目前官方还是免费,不限制,不愧是宇宙大厂 Google,良心! 首先游览器打开 : https://aistudio.google.com/ (需要魔法) 你会看到如下:

刚进入我建议可以先体验一下官方三个示例卡片,了解使用规则,然后就可以尽情发挥想象力了!这时候真的羡慕那些天马行空的人了!

总结

目前几个小时使用感觉生成能力已经很强,但是有时候也会直接返回 ⚠️,在图片微调方面感觉已经到达了生产力的水平了! 目前看起来图片故事生成能力是最让人期待的,它能够一次生成具有上下文的图片,我们可以直接使用它进行内容创作了 如果你觉得文字干巴巴的,不妨试试,真的好用!

我最近做了自己的产品:https://www.svgshow.cn 。一个能帮你快速将内容转为美观图片的网站,还能在线编辑,我的封面就是使用它生成的


此文自动发布于:github issues