Google开发者大会後记:「Google」的意义,或许已不再只是搜寻了

文:Sisley

Google这家公司让「Google」成为了一种动词,但到了AI时代,Google一词可能已经不再是单纯的搜寻网路资讯了。有了Gemini,「Google」这个词语已经又更上一层楼,「搜寻」以及随之而来的「答案」不仅存在於网路(Web),它还可以存在於手机中的照片、影片、文件、一场会议,甚至是一通电话之中,未来更可能存在於「现实世界」里。

「Google一下」

今日登场的Google I/O中,Google展示了当强大的AI进入到各种场域(例如:单纯的网页搜寻、在Email中搜寻、在Google Photos中搜寻)等等,AI甚至可以在分析「即时」资讯之後,为你的问题提供客制化的答案。

当AI进入到搜寻页面,AI会组织搜寻结果页面(AI Overview),例如:你可以询问:「我想买一件不错的瑜伽裤」,AI就会帮你自动找到在Google Maps上可能评价超过4颗星的瑜伽裤店铺,并且自动筛选距离近,且正在营业的选项。

而当AI进入到Google Photos中,该应用程式将会再更进一步进化,你甚至可以问:「我车子的车牌号码是什麽?」AI就能从众多照片(Google Photos)中,为你找到「你的车牌号码」,而不是其他车牌的号码。甚至,你也可以问:我女儿的游泳有进步吗?该功能也会自动给出她一天天进步的照片纪录,并呈现给你。

从前,我们所说的「Google一下」,你所想像出来的场景可能是:输入几个关键字(关键字与关键字中有空格),接着会得到数十页的结果(当中还会参杂一些广告或是业配文章),有时必须花上数小时来爬梳这些结果。

但如今「Google」一词或许已经不能单指「搜寻(Search)>研究(Research)>得到答案(Answer)」这个过程了,它甚至可以简单地翻译成「询问,并得到答案」,因为AI拿掉了中间的研究部分。

原本可能有些许技术性的「搜寻」动作,也变得可以用最自然的语言直接询问就好,自数位时代开始以来,人们获取资讯与答案的门槛,又再度大幅下降了。

今日Google也在现场播出了「一镜到底未经剪辑」(学习了去年的教训,今年特别强调了这点)的demo影片,影片中,我们看到Google所谓的Project Astra,它所呈现的,就是在Google眼中,人们将可以如何使用所谓的「AI Agent」(AI超级助理),让AI在现实世界中帮你找到答案。

例如:你可以透过手机的镜头(Google Lens),让AI即时了解这个世界,透过镜头,在环视了一周办公室後,这个可以与你即时对话的AI,甚至可以帮你找到你忘了放在何处的某样东西。

当然,它也可以帮忙检查同事电脑萤幕上的程式码。

今日的Google I/O大会上,Google DeepMind的CEO Demis Hassabis和Google CEO Sundar Pichai都在强调,所有的这一切,都还只是AI所能带来的可能性的「开头」而已。

手机中的AI

那麽回到现在,手机中的AI已经可以做到什麽事情了?

Google今天也宣布了一个台湾人可能会最爱的AI功能:「打诈」,这项AI功能可以在手机装置端分析一通陌生来电,从对方的话语中判断这通电话是不是诈骗,并且即时提出示警,让接听者选择立即挂断,并且这些AI运算和分析都只在装置端上,也就是依靠Gemini AI Nano。

又例如,当你搜寻某个城市的餐厅时,这个页面可能就会列出哪些适合约会,哪些适合商务会议等等,Google正在透过Gemini AI来搞清楚使用者的真正意图,也就是说,未来搜寻会变得更加自然、流畅以及简便,在使用者需要花上大量时间来研究的情况下,AI将大幅发挥功效。

最後但最重要的,当AI进入到WorkSpace,则可以帮助使用者在来回多次的email中,直接询问AI问题来得到答案,不用再搜寻、爬梳每一封email。

「智慧回覆」也将再进化,不再只有制式的yes/no回覆,而是可以依据这些来来回回的email对话列出选项,例如A选项是答应对方某件事、B是拒绝、C则是其他想法,在使用者选择好选项後,AI便能直接写好一封「完整」的email,以便使用者一键回覆给对方。

说到这,不知各位读者有没有发现,当生成式AI工具来到WorkSpace这样的商务场合中,以往被大众所警惕的AI幻觉(hallucination)问题又该怎麽被解决?使用者们得到AI给的答案之後,如果害怕幻觉,是否又要一封封地检查事实是否正确呢?

Google …

Google I/O 倒数中!一文了解哪些产品有机会拥抱 AI 升级

Google I/O 将於周四(11 日)凌晨登场,除了摺叠手机 Pixel Fold 备受瞩目之外,外界推测 AI 必定将成为大会活动的主轴之一,外媒也透过取得的 Google 内部资料,推测将有哪些 AI 发展和产品会亮相。

新大型语言模型

根据《CNBC》报导,Google 将推出名为 PaLM 2 的新通用大型语言模型,此计画在公司内部的代号为「统一的语言模型」。PaLM 2 涵盖超过 100 种语言,可进行程式码和数学测试,同时也具备创意写作和分析等能力。

Google 在 2022 年 4 月首次推出 PaLM 语言模型,在今年 3 月进一步开放 PaLM 的 API。另外,Google 名为「Med-PaLM 2」的医疗大型语言模型之前就据说能以「专业医生水平」完成医学测验,准确率达到 85%。

Bard …