搜索引擎,可能真的要变天了!
Google 终于要迎来它 25 年来最大的改变,谷歌宣布了开始内测开放【生成式搜索平台(Search Generative Experience,SGE)】,并逐步舍弃那些甚至是臭名昭著的十条蓝色链接(10 Blue Links)。
1998 年,拉里·佩奇与谢尔盖·布林凭借 PageRank 算法,上线了 Google 在线搜索引擎,最初的它是长下面这个样子:
而 Google,也是我们现在所熟悉与理解的几乎所有的搜索引擎,输入问题后它会通过 PageRank 或者其他更加复杂的搜索推荐算法,为我们排序出与我们的问题最相关的网页作为答案,以这些“蓝色链接”的形式罗列如下,我们阅读这些网页的标题,浏览下方的摘要,动脑筋判断点进某条蓝色链接会不会出现我们期望中的答案
25 年,这样子的搜索引擎塑造甚至定义了我们的网络生活,25 年,我们也几乎无数次的与这个小小的搜索框与那些或真或假的蓝色链接打交道,点进、退出、点进、停留、鼠标滑动、定位到关键信息,或摘录或收藏,搜索引擎作为一种别样的媒介,极大的延申了我们认知世界的边界,25 年让我们对搜索引擎的熟悉彷佛自己的身体,心里有种确信输入某串字符后眼前会出现这些排列整齐的链接
因此,在去年 12 月, ChatGPT 刚亮相不久时,我们在文章中提到 ChatGPT 有可能会颠覆所有传统的搜索引擎时,我们还认为这些大模型革传统搜索引擎的命还只是一个夸张的修辞手法,评论区里大家也都认为在那时谈“革命”,谈“替代”,甚至谈“威胁”都只是一个天方夜谭的说法,虽然没有人否认这项技术带给我们对“搜索本质”这个问题的思考以及思考背后几乎无限的想象力,它迫使我们开始逐渐意识到这样一个问题“搜索的答案,其实不一定只能是那十条蓝色的链接”
如果让时间快进,这短短半年我们与各位一道经历了一场基于大规模语言模型(LLMs)的狂飙突进运动,新技术、新应用、新问题、新实验如雨后春笋,也是在去年我们以一个技术人的视角报道【张俊林:ChatGPT会成为下一代搜索引擎吗】时,我们认为新一代的搜索引擎会以“用户智能助手”的形式出现,而这种智能助手不可能通过传统搜索引擎实现,它的内核必然是基于以 ChatGPT 为代表的大模型,尽管我们认为那时 ChatGPT 距离真正的搜索引擎还有三个没有解决的问题,分别是机器幻觉导致的真实性问题、模型的知识更新问题以及成本问题。
穿过这六个多月的技术井喷,而现在,在当下,Google 终于要迎来它 25 年来最大的改变,谷歌宣布了开始内测开放【生成式搜索平台(Search Generative Experience,SGE)】,并逐步舍弃那些甚至是臭名昭著的十条蓝色链接(10 Blue Links),传统上,陪伴了我们 25 年的我们熟悉的一整套搜索流程将会被革新,在未来当我们输入了问题,比如如果我问“如果我家有三个小孩并且带着一条宠物狗,布赖斯峡谷与拱门国家公园公园哪个更适合我们进行家庭旅行?”,答案将不再是一条语焉不详的“比较布赖斯峡谷与拱门国家公园公园”的旅游笔记链接,而是直接告诉我们“虽然这两个公园都禁止宠物狗在未铺设好的小径上活动,但布莱斯峡谷有两条铺设好的小径,允许宠物狗进入。”
与此同时,SGE 改变的不仅仅只是单纯的搜索、依托于搜索的电商、广告等等都将迎来一场革命,如下图展示的,在搜索产品时,我们不再需要面对那些“xx折叠自行车xx英寸非变速男女式成人学生儿童城市通勤单车白红”的符号堆砌,而是可以直接获得产品图片、产品说明、最新评论、评级、价格以及其他相关商品的对比。
毫不夸张的说,SGE 完全可以改变过去搜索引擎的信息整合方式,不仅仅在于一个显示界面的重新排列组合,而是整个“搜索”的关键流程发生了变化,答案将是以更加直接的方式呈现在用户面前,我们不再需要货比三家般的在多个链接间来回跳转,也不用花心力判断那个链接背后预设的网址的真伪,更不用在面对一些个性化问题时在不同页面间组合信息完成小心翼翼的推断,搜索将真正变成一问一答的过程,答案将直接化的呈现在我们的面前。
但是回到我们在去年 12 月的报道中提到的三个问题,机器幻觉导致的真实性问题、模型的知识更新问题以及成本问题,抛开成本问题不谈,显然 SGE 的未来还面临着“这种 AI 生成的摘要如何保证真实性”以及“模型更新”的问题,在模型更新方面,我们也报道过关于“ChatGPT 联网”与“封印解除”的文章,譬如在中我们报道了 Google 的 Bard 几乎有着近乎实时的时效性。同时,学术界也有对模型更新问题进行的研讨,比如【大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑】,浙大提出了模型编辑的方法有可能成为未来的解决方案之一。
而对于机器幻觉所有可能导致的大模型错误回答的问题,可能是更加关键的一个问题,一直有用户反应,比如问大模型“新塞尔达什么时候发布?”,得到的答案却是 2017 年 3 月,即荒野之息的发布时间而非 2023年 5 月 12 日王国之泪的发布时间。对于这个问题,我们曾经构想了大模型搜索引擎化的两步走,即从传统搜索引擎为主大模型为辅到大模型为主传统搜索引擎为辅,无疑,当谷歌的 SGE 正式向大众开放时,大模型搜索引擎化也就真正到了大模型为主传统搜索引擎为辅的新阶段,即使用大模型作为搜索答案的主要提供者,而使用传统搜索引擎作为验证答案真实性与否的辅助工具,在 SGE 中,可以看到一组卡片在大模型提供的回答的右侧,这些卡片对应链接作为大模型答案的证据。
回到我们的开头,搜索引擎变天了,是的,如果去年 12 月的我们还无法相信陪伴了我们 25 年的搜索范式将被大模型以直接问答的形式取代,那么在今天伴随着 SGE 的出现,我们已经无法否认搜索引擎的新时代已经悄悄的突然到来,从蓝色链接到现在的私人助手式的回答,这些大公司大模型的军备竞赛也是催生了这 25 年以来 AI 应用的一个巨大高潮,可以看到旧的问题还没有被完全解决,新的问题还在不断提出,SGE 能否在搜索真实性、隐私保护、模型更新等等方面适应那些被 1998 年 Google 搜索的蓝色链接培养出来的挑剔用户的需求,SGE 又能否真正完美的代替传统搜索引擎成为真正理想中的私人智能助手,且让我们拭目以待,未来马上就来!
SGE 体验
目前,SGE 功能需要先申请加入Search Labs 的 Waitlist,在排队获得资格后才可以尝试与体验 SGE 的功能,并且目前 SGE 功能尚不支持中文,只能使用英文进行体验。
申请地址:
https://labs.google.com/search/login