首页>>互联网 >>内容

这些是谷歌Gemini最好的新功能

发布时间:2024-08-16 16:57:17编辑:可爱的眼神来源:

除非你打断它,否则 Gemini Live 不会关闭,但谷歌的一些新 Gemini AI 功能看起来确实很有用。

这些是谷歌Gemini最好的新功能

谷歌最近在Made by Google 活动上向我们展示了其新的 Pixel 系列,比往常早了两个月,令人惊讶的是,整个故事都与人工智能有关。有新的、过于健谈的 Gemini Live 语音助手、一堆蹩脚的照片增强工具,以及强制性的版权保护图像生成功能。让我们来看看谷歌最新 AI 玩具中最好的和最差的。

“谷歌的 Gemini 是嵌入在 Android 15 中的一项令人难以置信的技术。它有一些非常令人兴奋的功能,比如 Pixel Screenshots,它可以搜索你的截图以获取信息。这是一个既实用又有远见的省时工具。还有 Gemini Live 语音聊天,它可以通过在对话中添加人工智能来改变实时通信,”英国翻新手机零售商The Big Phone Store的创始人兼董事总经理Steven Athwal通过电子邮件告诉 Lifewire。“但 Gemini 的人工智能图像生成让我摸不着头脑。作为一个在商业中始终把道德放在首位的人,我不禁想知道这个功能的版权影响。这是一个很棒的工具,但其影响可能是深远的,而且不一定是积极的。”

更健谈的 GPT

当然,人工智能的前景是,你可以和它交谈的智能助手,就像科幻乌托邦里的计算机一样。正如我们所见,仅仅在名称中加入“智能”一词并不能真正让它变得智能,但这些 LLM(大型语言模型)比以前的成果更善于理解我们所说的话。据The Verge 的Alex Cranz 称,谷歌的Gemini Live 实际上非常擅长帮你找出问题。当她测试新助手时,它设法在几秒钟内为她解答了一个问题,而她和朋友花了五分钟才解答完这个问题。

这可能部分是对谷歌常规搜索的控诉,但它相当不错。然而,问题与任何人工智能聊天机器人一样:你永远不知道是否应该相信它。在谷歌自己的披萨胶水惨败之后,我们为什么要相信这个版本?

此外,Cranz 表示,Gemini Live 不会闭嘴。就像家庭聚餐时那个烦人的叔叔一样,Gemini 会一直喋喋不休,直到你打断它。

谷歌还展示了几款图像工具。Pixel Studio 应用程序可以根据文本提示生成图像,结果具有我们所期望的超真实 AI 外观。更有趣的是 Magic Editor,它允许您输入提示来更改自己的照片。

例如,你可以用手指画出天空,然后告诉它用其他东西替换天空。在演示视频中,谷歌在田野上添加了鲜花和气球。

更花哨但也更巧妙的是一个名为“添加我”的功能。通过此功能,您可以拍摄朋友的照片,然后换位。AR 叠加层会显示您站在哪里,然后 AI 将照片拼接成一张合成图。

然后我们来看看可能是整个演示中最好的“AI”功能。它被称为Pixel Screenshots,它让你最终可以利用你拍摄的所有屏幕截图来记住事情。

截图并不是存档网页、聊天或照片的最佳方式,但它使用起来很简单,而且大多数设备上都配有内置按钮组合。近年来,我们的照片应用已经使用机器学习(又称 OG AI)工具使截图中的文本可搜索,但 Pixel Screenshots 做得更好。

它本质上是深入研究你的截图,并让你对其进行搜索。谷歌的例子是,你正在为一个喜欢松鼠的朋友寻找礼物(!),你花了一些时间截取你找到的最好的截图。后来,你问 Pixel Screenshots 那份礼物是什么,它会告诉你。

它很像微软破坏隐私的 Recall功能,它会截取你在电脑上所做的一切截图,以供日后搜索。但由于 Pixel Screenshots 只使用你自己保存的截图,因此许多隐私问题就消失了。

总而言之,谷歌的 AI 公告大同小异。虽然其中有一些不错的小功能,但我们很难摆脱这样一种感觉:没有它们我们也会过得一样好。这仍然是一项迫切需要实际应用的技术,但对于消费级产品来说,可能永远不会实现。

iHost Property Management 的高管兼营销分析师 Gary Gilkison 通过电子邮件告诉 Lifewire:“人工智能的前景在于企业、医疗和工业应用,而不是炒作驱动的消费技术。负责任、以问题为中心的发展是关键。避免夸大其词,将人工智能的重点放在实际问题上,将创造更美好的未来。谷歌和苹果将从务实主义而非炒作中受益。 ”