Google I/O与即将到来的人工智能大战

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:迄今为止,人工智能领域的竞争似乎被局限在 OpenAI 以及几大科技巨头之间。但如果我们把视角放得更远一些的话,也许会发现一个迥然不同、更加壮阔的竞争格局。印刷机导致了三个不同的宗教团体的诞生,在人工智能的背景下,科技巨头、民族国家以及开源社区也许将展开地盘争夺战,最后究竟鹿死谁手呢?文章来自编译。

Google I/O与即将到来的人工智能大战

科技领域有些事情令人震惊,但也在情理之中——比方说一家陷入困境的公司的首席执行官失去了工作。当然,这个消息出乎意料,但仔细想想也是说得过去的。不过,其他一些消息却既令人震惊又令人惊讶,谷歌今年 2 月份在巴黎进行的主题演讲——这似乎是对微软将 GPT 植入到 Bing 的公告做出的恐慌回应。

令人震惊的地方在于演示文稿之糟糕:新内容几乎没有,幻灯片和演讲者不同步,当其中一位演示者开始做演示时才意识到手头没有用于演示的手机,则是糟糕到极致的表现。

令人惊讶的地方在于,谷歌在人工智能方面居然会遭遇那么大的困境,这不仅仅是因为 AI 似乎是谷歌的甜点:事实上,谷歌多年来一直在谷歌 I/O 上大谈特谈人工智能,而且我发现该公司对自身工作搭建的描述框架一直都非常令人印象深刻。回到 2016 年那时候,我摘录了谷歌 CEO Sundar Pichai 关于如何在自家产品使用机器学习的长篇大论,并写道:

请留意其特殊性——对于主题演讲来说这似乎讲得太多了,但这绝对不是废话。毫不奇怪:Pichai 所说的一切正是创建谷歌的目的。这与鲍尔默高呼自己是多么的热爱 Windows 没有什么不同:Windows是微软使命的产品代表,这也许给这位因为未能带领微软继续前进而被废黜的CEO带来了一丝宽慰。

接下来的 30 分钟非常棒:Google Now,尤其是 Now on Tap,给人留下了非常深刻的印象,Google Photos 看起来也很棒。而且,我可能要补充说一句,它有一个杀手级的口号:Gmail for Photos。当你正在做你注定要做的事情,也是你也是全世界最擅长做这件事情的人时,表达自我就是这么的简单明了。

两年后,我对 Google I/O 的评价是很无聊,但那是恭维的意思:

所以我才认为Pichai“无聊”的开场白其实很棒。现在已经没了早期Google I/O的那种好斗,坚持说 Android 将会取代 iPhone。现在它也没有上周 Nadella 描绘的宏伟愿景,或者苹果产品发布时的那种兴奋。这里有的是一种确定感,而且几乎是舒适感:谷歌就是要组织全世界的信息,鉴于 Pichai 认为未来属于人工智能,尤其是运行于数据之上的机器学习派生,那么这也就意味着谷歌只需要做自己就可以在这个新世界里取得成功了。无论是对个人还是对公司而言,这都是最好的去处。

那一年,谷歌发明了 transformer,这项关键发明为给 ChatGPT 提供动力的大型语言模型奠定了基础,而 ChatGPT 在过去六个月的时间里似乎让谷歌十分地心烦意乱。今年的 Google  I/O 令人印象深刻的地方在于,它成功地将谷歌最近几次 I/O 的引人注目之处——其明确的 AI 能力以及体现这些能力的产品——与你的紧迫感和进取心结合了起来。而后面这两种情绪,是你希望从一家多年来第一次感受到了威胁的公司身上能看到的东西。

谷歌人工智能的进化

我在上面提到过,谷歌介绍 Google Photos 的时候称之为 Gmail for photos;Pichai 的开场白里面有两张幻灯片我最喜欢,上面展示了这两款产品如何可以成为谷歌不断发展的人工智能能力的证据。Gmail 从“Smart Reply”(智能回复)演变到“Smart Compose”(智能撰写)再到“Help Me Write”(帮我写):

Google I/O与即将到来的人工智能大战

Google Photos 从“Find Photos”(查找照片)演变到“Magic Eraser”(魔术橡皮擦)再到“Magic Editor”(魔术编辑器):

Google I/O与即将到来的人工智能大战

这种展示方式非常聪明,强化了谷歌在人工智能领域浸淫的时间不短了,这是真的!这也提醒我们,谷歌的一大优势与微软相似:该公司拥有一系列面向用户的产品,而且是在以真正有用的方式展现其人工智能功能。Pichai 指出,谷歌有 15 款产品的用户超过了 5 亿:

Google I/O与即将到来的人工智能大战

有 6 款产品用户达 20 亿:

Google I/O与即将到来的人工智能大战

不过,也许主题演讲里面最引人注目的地方是 Pichai 的开场白:

作为一家人工智能优先的公司,我们的这条道路已经走过七年了,我们正处在一个激动人心的转折点上,有机会让 AI 对人类、企业、社区和每个人都变得更有帮助。一段时间以来,我们一直在应用人工智能来让我们的产品变得更有帮助。借助生成式 AI,我们正在迈出下一步。凭借着大胆和负责任的做法,我们正在对所有的核心产品进行重新构想,其中也包括搜索。

值得注意的是,“大胆”放在了“负责任”的前面;Google I/O 发出的最重要的讯息是,谷歌要参与这场游戏,而且要赢,正如 Pichai 所指出的那样,这也包括了搜索。

生成式人工智能与搜索

在Google I/O 2019(我发现这一场开发者大会也十分令人印象深刻)之后,我提出了谷歌的长期商业模式问题:

更重要的是,虽然 Google Assistant 继续给人留下了深刻印象——将所有内容都放在设备上有望在速度上取得重大突破,而速度是现在 Assistants 的主要限制因素——但谷歌的商业模式是什么尚不清楚。很难想象有什么东西能像搜索广告那么赚钱,它不仅受益于精确定向——用户明确地说出了自己想要什么!—— 而且它们还有一种拍卖形式,利用用户来选出获胜者,并激励这些获胜者为与该用户建立持续关系的机会多付钱。

正如我所预料的那样,谷歌采用了混合的做法:大多数搜索都不是商业搜索,因此谷歌将把生成的文本放在顶部:

Google I/O与即将到来的人工智能大战

对于确实具有商业可能性的搜索,广告仍将获得头牌地位:

Google I/O与即将到来的人工智能大战

这似乎是一种合理的做法,因为非商业搜索不管怎么说都更有可能从人工智能中受益;与微软将 Bing Chat 嫁接到传统搜索的做法相比,这也是一种看起来更吸引人,而且是的,也是更大胆的做法。

当然,微软其实已经推出了新的搜索体验,而 Satya Nadella 对蚕食谷歌市场份额和利润率的渴望仍然是个威胁:生成这些答案需要花钱,而且谷歌的模型在同等条件下进行比较的话,可能还是要落后于 GPT-4 的。尽管如此,今年的 Google I/O,尤其是这个演示,是对 Sam Altman 在 Bing 发布后告诉我的这番话非常强烈的回应:

我认为这对我们双方来说都很棒。我觉得,这对我们双方都有很大的好处。我们将会发现这些新模型可以做什么,但如果坐在搜索的垄断位置上不思进取,现在被迫思考如何应对一个世界,一个对搜索以及新的广告单位的货币化方式构成真正挑战,甚至可能还会暂时面临下行压力的世界的话,对此我的感觉是不会好的。

这些挑战依然存在,但至少“昏昏欲睡的搜索垄断”已经苏醒。

持续性创新与颠覆性创新

如果有什么是每个人都可以确定的话,那就是人工智能具有非常大的颠覆性;不过,在今年 1 月的《人工智能与五巨头》中,我注意到人工智能似乎更有可能是一项持续性创新:

2022 年的故事是人工智能的涌现,首先是图像生成模型,包括 DALL-E、MidJourney 以及开源的 Stable Diffusion,然后是 ChatGPT,第一个取得重大突破的文本生成模型。在我看来,这是技术进入了新纪元。

不过,要确定那个新纪元可能会如何演进,做一件事情会很有用,那就是回顾一下 26 年前有史以来最著名的战略书籍之一:克莱顿·克里斯滕森(Clayton Christensen)的《创新者的困境》(The Innovator\’s Dilemma),尤其是关于不同类型创新的这段话:

大多数新技术都会推动产品性能的改善,我将这些技术称为“延续性技术”。一些延续性技术可能不具有连续性,或者在本质上具有突破性,而其他一些则在本质上属于渐进性技术。所有的延续性技术所具有的共同点就是,它们都是根据主要市场的主流消费者一直以来所看重的性能层面来提高成熟产品的性能。特定行业的大多数技术进步从本质上说都具有延续性……

颠覆性技术给市场带了与以往截然不同的价值主张。一般来说,颠覆性技术产品的性能要低于主流市场的成熟产品,但它们拥有一些边缘消费者(通常也是新消费者)所看重的其他特性。基于颠覆性技术的产品通常价格更低、性能更简单、体积更小,而且通常更方便消费者使用。

回过头看,通过观察既有公司在创新进入市场后的表现,似乎很容易就能确定创新属于延续性的还是颠覆性的:如果创新是延续性的的话,那么既有公司会变得更强大;如果属于颠覆性,那大概是初创公司收割掉大部分价值。

我在那篇文章得出的结论是,对于苹果、亚马逊、Meta 和微软来说,人工智能将是一项持续性创新;最大的问题是谷歌和搜索:

那篇文章假设 Google Assistant 会作为独家提供产品,用来给谷歌手机提供差异化优势;结果表明这个假设是错误的,但分析的基础仍然有效。在过去七年的时间里,谷歌的主要商业模式创新一直是将更多的广告塞到搜索里,这种策略在移动设备上特别有效。而且,说句公道话,谷歌最赚钱的搜索类型,比如旅游、保险等,无论如何也许都不太适合聊天界面。

不过,这只会让谷歌管理层更加担心,即在特定的搜索环境下,生成式人工智能可能代表一种颠覆性创新,而不是延续性创新。颠覆性创新比不上现有的,至少在开始时是这样的;这就是为什么它很容易被管理者忽视的原因,只要告诉自己,他们当前的产品更好(这个倒没错),就可以避免思考商业模式的挑战。当然,问题是颠覆性产品会变得更好,而另一边现有产品却变得越来越臃肿,越来越难用——这听起来很像谷歌搜索当前的发展轨迹。

我不是说谷歌巅峰已过。我之前曾经下过这样的结论,但错得离谱。不过,犯错的往往是时间问题:是,谷歌是拥有自己的云服务,而 YouTube 的主导地位似乎有增无减,但即便多年来搜索一直在制造现金和利润,它的巅峰轨迹似乎已经很清晰了。

也许未必。我倾向于认为,颠覆性创新其实是很少见的,但当出现颠覆性创新时,既有公司基本上不可能做出回应:他们的商业模式、股东以及最重要的客户让管理层无法做出回应。不过,如果确实做出了回应的话,那么既有者的回应实际上证明了该创新实际上不是颠覆性的,而是持续性的。

为此,我会把这次的Google I/O 大会作为证据,证明人工智能实际上对于包括谷歌在内的所有大型科技公司来说属于一项可持续技术。此外,如果真是这样的话,那么这就是对搜索公司不用那么悲观的原因,因为预期他们拥有领导地位的所有理由——从能力到数据到基础设施再到多到过剩的消费者接触点——依旧。尽管如此,目前形式的搜索,尤其是它的广告模式所面临的挑战仍然存在。

革命或对齐

另一个我一直感到困惑的问题是,人工智能是否属于 Carlota Perez 在《技术革命与金融资本》(Technological Revolutions and Financial Capital)一书中所记载的那种技术革命。

再一次,传统观点认为人工智能代表了一种全新的范式。关于这一点,没有人能比比尔·盖茨发出的声音更有力了:

人工智能的发展与微处理器、个人电脑、互联网以及手机的发明一样重要。它将改变人们工作、学习、旅行、获得医疗保健与相互沟通的方式。整个行业都将围绕着它重新调整。企业要靠运用人工智能的能力来实现差异化……

我有幸参与了个人电脑革命和互联网革命。我对此时此刻同样感到兴奋。这项新技术可以帮助世界各地的人们改善生活。与此同时,世界需要确立规则,好让人工智能的任何不利因素都远远小于带来的好处,并让人人都能享受到这些好处,不管他们住在哪里,或有多少钱都能享受。人工智能时代充满了机遇与责任。

盖茨暗示个人电脑革命、互联网革命和人工智能革命是离散事件,但它们也可以被视为数字化的决定性经济特征——零边际成本——对信息的三种应用:

PC 使得信息复制的边际成本为零;这就是文字处理器、电子表格以及比尔·盖茨专门研究的其他一些生产力应用等突破的基础。

互联网使得信息分发的边际成本为零。这带来了一个以充裕而非稀缺为基础的市场,从而诞生了像谷歌这样的聚合者。

人工智能使得信息生成的边际成本为零(好吧,相对于人类而言几乎为零)。正如我去年所写那样,生成模型将创意创造与创意实现分开,然后再可以以零边际成本复制和分发。

此外,这三场革命必须按顺序进行:如果没有各异的计算机,如果这些人工智能模型不是在互联网训练的,互联网的概念本身就没有意义。

我还要指出,这样的发展与我在 2020 年的那篇《开始的终结》里面提出的观点是一致的:我在那篇文章中的论点是,各种技术革命都是朝着无处不在的连续计算趋势的体现;我在那篇文章里面没有提到人工智能,但人工智能似乎是一种持续性创新的事实支持了这样一种观点,即科技开始阶段的大赢家将成为未来科技发展的基础。

就Perez而言,她认为当前的革命仍处在安装阶段;在她看来,现在还少了一个要素:与政府的协调以及由政府主导的协调。

Bard与欧盟

谷歌在这次 I/O 大会上还发布了一个东西,那就是现在 ChatGPT 的竞争对手 Bard ,现在已经面向广泛受众开放了。而更有趣的消息是它还没开放的地方;来自 Android Authority:

谷歌在其 I/O 开发者大会上宣布,其 Bard 聊天机器人将面向 180 个市场开放。这标志着这个平台的一次重大扩张,因为一开始发布的时候它的适用范围非常有限。不过,加拿大和欧洲不并在受支持市场的名单之中。现在,谷歌在对 Android Authority 问询电子邮件的回复中暗示了那两个市场未被纳入进来的可能原因。一位谷歌发言人指出:

Bard 很快就能支持 40 种流行语言,虽然我们还没有最终确定拓展计划的时间表,但我们会逐步地、负责任地推出,在驾驭这些新技术的时候,会继续成为对监管机构有帮助作用、积极参与的合作伙伴。

该公司断言自己是“对监管机构有帮助作用、会积极参与的合作伙伴”,这表明出于监管方面的考虑,Bard 目前绕开了欧盟和加拿大市场。

一个传统观点又一次出现:“哈哈,愚蠢的欧洲,愚蠢的欧盟监管政策,这意味着他们将错过人工智能”,而且,就目前而言,这种说法显然是对的。不过,要是说谷歌、微软、Meta 等科技巨头出于自己的最终利益,确实将成为“对监管机构有帮助作用、会积极参与的合作伙伴” 似乎挺有把握的。毕竟,思考一下这些监管举措可能是什么样子就知道了。从加拿大开始,来自同一篇文章的这一段:

加拿大立法者最近出台了旨在规范人工智能的法规。人工智能与数据法案 (Artificial Intelligence and Data Act ,AIDA) 要求对人工智能系统进行评估、风险管理、监控、数据匿名化、透明度和记录保存等操作。 对于违规者,AIDA 还将处以最高占公司全球收入 3% 或 1000 万美元的罚款。

大量的繁琐程序肯定会让谷歌等人难以应付,但考虑到它们的规模和资源,其实应付不难;不过欧盟拟议的人工智能法规会带来更大的监管负担。

值得注意的是,我前面跟踪的技术这条发展弧线正朝着强化政府控制的方向倾斜:个人电脑赋予个人难以置信的自由和能力,但互联网向聚合者中介网络的转变赋予了政府一个明显的堵点,让政府可以在这些堵点上推动对分发进行控制(各国政府或明或暗都在这么做)。与此同时,人工智能被主要参与者掌握意味着对实际信息的生成有直接的控制点。

这证实了 Perez 的论点,也就是这场 IT 革命尚未实现与政府的对齐:这在之前从结构上来说是不可能的。上述对齐是否真的像 Perez 预测的那样意味着“黄金时代”即将到来还有待观察。值得注意的是,这种对齐的具体化非常符合谷歌的利益:阻止真正颠覆性技术的最佳手段是对它们进行监管。

人工智能的激进改革(Radical Reformation)

欧盟监管政策的另一个方面似乎更加险恶。来自 Technomancers.ai:

一个大胆的举措是,欧盟修订的人工智能法案禁止美国公司如OpenAI、亚马逊、谷歌和IBM等提供对生成式 AI 模型的 API 访问。周四由委员会投票的这项修订案规定,如果向欧洲提供未经许可的生成式模型的话,将处罚美国的开源开发者及软件分销商(如GitHub)。虽然这项法案给传统机器学习模型开了开源的例外,但明确禁止了生成式系统的开源安全港条款。

任何模型,如果未事先取得广泛且昂贵的许可就面向欧洲提供的话,将导致公司面临高达 2 千万欧元或全球营收 4% 的巨额罚款。开源开发者和托管服务(如GitHub)作为进口商将对提供未经许可的模型负责。从本质上来说,欧盟是在命令美国科技巨头让美国中小企业不要做了——并威胁对美国技术生态体系的重要组成部分施加制裁。

如果该法案颁布的话,执法权将不在欧盟成员国掌控之中。根据此项人工智能法案,第三方可以起诉国家政府要求处罚。该法案具有域外管辖权。欧洲政府可能会被第三方强迫与美国开发者和企业发生冲突。

这是一项极易引发争议的指控,但作者 Delos Prime 援引了拟议的法律来支持这种说法,我认为这个解释是合理的。像这样的提议一样,没有明确的语言,比如禁止 API 访问;相反,Prime 的结论是,这是有效的结果,例如,API 提供商对其 API 的所有使用负责,就像开源作者和分发者将对其模型的所有使用负责一样。一如以往,类似提案通常没有明确的语言,比方说禁止 API 访问;相反,Prime 得出的结论是,比方说,API 提供商将对其 API 的一切使用负责,就像开源作者和分发商将为其模型的一切使用负责一样,这样的实际效果跟禁止 API 访问一样。

美国将如何回应这样一项法律显然是一个非常重要的问题:有理由认为,让美国公司对根本就是开源的模型负责是对主权的公然侵犯;我敢肯定,欧盟会辩解称,美国互联网公司在输出美国价值观(如言论自由)其实是一回事。

这就是回顾历史的有趣之处,尤其是我一直认为与互联网最类似的一项发明:印刷机。我在《互联网与平民阶级》中写道:

中世纪的时候欧洲的主要组织实体是天主教。相应地,天主教会事实上也垄断了信息的传播:大多数书籍都是拉丁文的,是由修道士辛苦地手工抄写出来的。在他们的土地上,贵族与平民的不同成员之间有着一定程度的种族类似性,但在天主教会的庇护下,那主要是独立的城邦国家。

印刷机改变了这一切。突然之间,对天主教的批评跟百年前扬·胡斯(Jan Hus)的批评极为类似的马丁·路德,不再受限于只能将他的信仰传播到当地了(Hus的影响范围是布拉格),相反他的那些理念可以传播到整个欧洲;贵族抓住了这个机会,用复合其本地利益的方式去解释圣 经,从而逐渐摆脱了天主教会的控制。

同时,印刷书籍的经济学与手工复制的经济学有着根本的不同。后者纯粹是一项运营费用:产出完全取决于劳动力的投入。不过,前者主要是一项资本支出:首先,建造印刷机属于资本支出,其次,要给一本书排字。支付这些巨额的前期费用的最佳方式是一本能卖出去的书要尽可能多地印。

那么,如何才能最大限度地提高销量呢?答案是用一种特定语言中使用最广泛的方言进行印刷,这反过来又会激励人们采用这种方言,从而令整个欧洲的语言标准化。推而广之,这加深了具有共同语言的城邦之间的亲和力,尤其是在几十年的时间里,随着书籍和后来的报纸形成了一种共同的文化之后就更是如此。这种合并的速度各不相同——英国和法国的融合比德国和意大利早几百年——但几乎在每一种情况下,第一等级都不是天主教会的神职人员,而是国家君主,即便君主将权力让给了一种新的,以柏克(Burke)为代表的贤能贵族。

这场巨变的高潮是威斯特伐利亚和约(Peace of Westphalia,威斯特伐利亚体系就是因此得名的);引自维基百科:

威斯特伐利亚主权体系(Westphalian sovereignty),是国际法的建立基础,即:

– 每个主权国家对其领土和国内事务拥有主权,排除所有外部势力侵扰;

– 各国互相承认主权并互不干涉他国内政;

– 每个国家(无论大小,或强或弱)的主权平等。

该学说以 1648 年签署的《威斯特伐利亚和约》命名(该和约的签署象征着三十年战争和八十年战争的结束)。其基础是让博丹的国家理论和雨果格劳秀斯的自然法学说。它是现代主权国家国际体系的基础,并载入《联合国宪章》,其中规定“本宪章不得认为授权联合国干涉在本质上属于任何国家国内管辖之事件。”

从全球化到人道主义干预再到互联网,威斯特伐利亚体系面临着诸多挑战。欧盟监管人工智能的尝试就是一个很好的例子:鉴于互联网没有边界(除了个别),欧盟似乎准备让美国公司对在美国服务器上发布的模型负责;就谷歌而言,目前它发现单方面把欧盟排除在服务范围之外是明智选择,否则的话就会面临与 OpenAI 同样的挑战。

从某种意义上说,这场斗争可以类比为欧洲的新教与天主教之战;在这种情况下,美国科技公司是通用互联网,而欧洲则寻求保护自己的主权。或者,也许你更喜欢一个相反的类比,即欧洲正在寻求将其信仰出口到世界其他地区,并且鉴于让一款产品遍布各处的经济激励之大,欧洲很可能会成功。

不过,开源部分却截然不同:在本地运行的开源模型对苹果来说可能是一大福音,但对于谷歌和 OpenAI 等中心化的公司来说,这才是真正的颠覆性威胁。换句话说,开源是不同于监管机构以及中心化运营商的第三方力量;它们是激进改革。

在看到 Owen Cyclops 关于美国宗教的主题帖子时,我萌生了这个想法。Owen Cyclops 的观点是,印刷机导致了三个不同的宗教团体的诞生:天主教徒、新教徒,然后是一大群受到前两者迫害的边缘团体,而后者在美国历史上发挥了重要作用。

美国似乎不是一个新教国家。美国是一个激进改革国家。 

—— owen cyclops (@owenbroadcast) 2023 年 4 月 23 日

按照这种观点,印刷机的应用对现代欧洲形成的影响是不完整的;你还得考虑边缘地区,也就是美国。

而且,推而广之,如果从个人电脑到互联网再到人工智能的数字化转型可产生堪比印刷机的影响的话,那么眼前的问题不仅仅是民族国家的性质会如何演变,还有边缘地方的潜力如何。

诚然,这篇文章推测的成分颇多,有点牵强附会,尤其是考虑到我是从讨论 Google I/O 开始的。不过,我认为重要的是,谷歌已明确表示把人工智能看作一项持续性创新,并打算在自家的业务(包括搜索在内)中全面实施生成式人工智能。当然,这意味着在这种情况下必然要有仗要打:经历了过去十年的停滞不前之后,我们从这些大型科技公司身上看到的进取心和好胜心是令人耳目一新的变化。

与此同时,所有科技巨头都参与其中,并且鉴于其超国家的性质,它们将不可避免被激励成为“对监管机构有帮助作用、会积极参与的合作伙伴”,这表明真正的战斗会发生在中心化模型与开源模型之间:普世的天主教会与国家性的新教徒之间有冲突,但二者对再洗礼派等持一致的鄙视态度。

从这个角度来看,这些拟议中的欧盟法规只是数字时代这场决定性战争的第一轮集中攻击:究竟是中心化(因此可控)的实体会取胜,还是处在边缘的,真正探索人工智能潜能(不管好坏)的开放模型最后能开花结果?

译者:boxi。

本文地址:https://www.cknow.cn/archives/24198

以上内容源自互联网,由百科助手整理汇总,其目的在于收集传播生活技巧,行业技能,本网站不对其真实性、可靠性承担任何法律责任。特此声明!

如发现本站文章存在版权问题,烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com,我们将及时沟通与处理。