万字详解生成式 AI 与 Web
发布时间: 2023-07-11

图片来源@视觉中国

文|巴比特资讯

文|巴比特资讯

自 2022 年末 OpenAI 面向公众推出 ChatGPT 以来,人工智能(AI)的热度一直居高不下。圣诞老人来得很早,他给人类带来了一台能回答大多数问题的机器! ChatGPT 是增长到一亿用户用时最快的应用,就像许多由 VC 投资的初创公司一样,它每天都在燃烧数百万美元。

当然,这不再是引起关注的原因,因为微软刚刚决定向 OpenAI 投资 100 亿美元。结合 Azure 和 Bing ,ChatGPT 的受欢迎程度已经跨越了成见鸿沟。

不过,参与竞争的不仅仅是微软。谷歌母公司 alphabet 在其生成型 AI 产品的 demo 搞砸之后,其股票市值损失了 1000 亿美元。此外,阿里巴巴和亚马逊各自宣布加入,旨在和 ChatGPT 争夺 AI 主导地位,而苹果公司很可能会利用 Siri 作为将其 AI 产品推向市场的前沿阵地。

AI 工具的爆炸性增长之所以出现,是因为人们现在可以实际使用 AI 。当 crypto 、无人机或自动驾驶汽车等趋势进入市场时,它们面临着很高的进入壁垒。而你现在可以立即使用 AI 在家庭作业上作弊。今天,ChatGPT 甚至可以让你在 Bumble 上看起来很有吸引力。相比之下,在 crypto 领域,你只能购买 token,并假装它是你个性的全部。

亚瑟·克拉克(Arthur C. Clarke)曾经说过:“任何足够先进的技术,似乎都无法与魔法区分开来。”

AI 已经转变为让足够大的社会群体相信它是魔法。仅在 2022 年第二季度,就有约 170 亿美元的资金被投入到与 AI 相关的公司中。FAANG、VC 以及散户投资者的兴趣结合在一起,这项技术似乎已经准备好吸引大众的关注。

在过去的几周中,我们一直在努力了解该行业正在发生什么,以及未来十年该行业的影响有多大。这篇文章总结了我们对该行业的(有限的)理解,以及为什么我们认为,区块链和 AI 将在未来十年混合在一起。但在我们开始之前,让我们重温一下经济学的一些基础知识。

展开全文

注:我在整篇文章中在说 AI 模型和模型之间切换。为了便于阅读,文中提到的任何“模型”一词,都是指生成型 AI 模型。

坍塌的稀缺性

我们作为一个物种的故事,是由我们与稀缺的斗争所定义的。据信,人类在数万年前就开始迁徙,以寻找更绿色的牧场。一旦人类学会了利用火和农业的力量,我们的祖先就繁荣了,整个文明就出现了。人类走了很远,开始跨海进行贸易,以确保社会拥有我们需要的资源。

一旦一个文明不再需要担心食物或保护自己免受自然因素的影响,人们就会专注于争夺地位。中国的长城、埃及的金字塔、印度的泰姬陵以及欧洲复兴时期的大教堂,在各自的权利中都是地位象征,这在他们那个时代的社会经济结构中发挥了作用。人类可以进行这些需要数万人和数十年工作的努力,因为我们不再担心本周是否能吃得饱。

当我们过渡到追求地位的社会时,技能和服务变得稀缺。在政治之外,到了14世纪,我们不再为战争英雄喝彩,而是开始更多地崇拜艺人、艺术家和发明家。

想想莎士比亚、米开朗基罗或班克西的作品。这些艺术家有独特的解读世界的方式,需要数十年的文化体验。如果没有足够长的时间深入其中,你就无法创造文化。

稀缺性不再是我们用来维持体力的商品,而是激发我们精神状态的东西。一位“一代中出现一次”的艺术家,需要数十年的时间才能出现,因为产生他们的环境很难模仿。即使上世纪 90 年代,数百人在纽约布朗克斯区也有过同样的生活经历,但只有一个人成为了身价数十亿美元的说唱大亨 Jay-Z。而且很少有人知道这些异常值在哪里或如何出现。

在一个技能稀缺的社会里,杰出的人才会得到高额的报酬。我们经常听到有关在文艺复兴时期从事大教堂工作的艺术家,一次被委任多年。但在过去几个世纪的大部分时间里,经济产出与进入其中的能源是成线性关系的。我们要么燃烧能量(为工厂),要么让人类花费能量来进行生产。

财富的生产,主要取决于你能接触到的人(或资源)的数量。这就是为什么我们在历史上会出现奴隶制等痛苦事件。财富通常依赖征服的线性轨迹上增长。

而代码和服务器改变了 20 世纪的这条道路。突然间,你不再需要入侵遥远的土地,或让人们屈服于你的折磨。正如 Naval 所说,代码和媒体是新的杠杆。编写代码可以让你的机器人大军为你服务,想想 Instagram 或 Tiktok 的例子:

这些平台雇佣的人数往往与用户数量不成正比。你可以通过添加更多硬件来扩展,以支持更多用户。

20 世纪 90 年代初,互联网的出现可能标志着这个富足的时代。例如,垃圾邮件是由于沟通成本崩溃而产生的。Limewire 和 Napster 是数字存储和带宽崩溃的代表。游戏和社交网络是数百万人聚集的数字乡镇,但我们不再关心容纳这些人的“空间”的稀缺性。

只要以数字方式提供服务,满足更多人需求的边际成本就大幅下降。互联网的大部分都可以“自由”访问,这象征着随着我们的世界变得数字化,稀缺作为一个概念是如何逐渐崩溃的。Naval 在下面的视频中解释了这种新发现的“富足”(abundance)。

开发者与文艺复兴时期的熟练工匠相似。他们拥有获得杠杆作用的力量,并为他们的时间构建工具创造巨大的倍数。但这种情况正在慢慢改变。在同一周,微软同时解雇了 10000 名员工,并向 ChatGPT 背后的 OpenAI 投资了 100 亿美元,但很少有人能捕捉到这种鲜明的对比。

我并不是要煽动恐惧,并暗示开发人员很快就会被解雇。不是那样的。但我们将看到一个其他形式的工作被 AI 赋予权力的时代。这就是当今在生成型 AI 领域所发生的事情。

产生富足

在数字消费方面,我们生活在一个丰富的时期,因为分发手段的成本不高。当我写这些话时,我知道将其分配给 1,000 或 100,000 个读者会花费我同样的费用。Substack 不根据观点收费,因为为分发提供动力的基础设施可以快速扩展。因此,尽管我们有渠道将内容分发给更多的人,但由于人类注意力的限制,规模的两端都是稀缺的。

作为一名作者,我受到在一段时间内可以创造多少有意义的输出的限制。而作为一名读者,你只想从我这里读到这么多。

我们看到了诸如 ChatGPT 和生成型 AI 之类的概念的爆炸,因为围绕生产和消费的单位经济正在被破坏。我们上一次有如此深刻的东西,很可能是在印刷机出现的时候。书籍降低了人类思想的存储和传播成本。花了四个世纪后,英国的识字率从 5 %上升到 50 %,而现在人们每天阅读约 2 小时。

智力行为的这种变化直接为启蒙时代提供了动力,这是一个以科学和哲学的快速发展为标志的时期,康德、伏尔泰、勒内·笛卡尔以及亚当·斯密等人永远改变了我们的世界观。每次我们想好如何存储、共享和迭代想法时,我们都会做一些非常酷的事情。无论是洞穴绘画还是谷歌文档。

让我们从理解生成型 AI 今天可以做什么开始,看看它是如何降低生产和消费成本的。当前,诸如 ChatGPT 和 Midjourney 之类的应用可实现一个目的:它们根据已被喂养的数据创建令人信服的输出。而数据通常来自公开中已经可用的内容。

OpenAI 的 ChatGPT 使用来自书籍、维基百科和期刊的数据来创建文本响应。Stable Diffusion 是一种生成型艺术的服务,最初依赖于库存图像。Github 的 Copilot 使用平台上数十亿行代码来帮助开发人员。

本质上,生成型 AI 获取公开可用的信息,对其进行合成,并根据用户上下文对其进行处理。这里的上下文可能是“explain Bitcoin like I am five”,也可以是 “cryptocurrencies raining over Dubai”。 这些 prompt 提示词反过来又在几分钟内创建机器生成的响应。

通常情况下,输出不够令人信服,但经过充分的调整,你最终会得到一些可以用于生产的东西。只要主题是通用的,并且你不期望有个性的元素。

来自红杉资本的生成型 AI 文章

那我们走了多远?红杉博客上面的全景图对时事有很好的展望。AI 模型现在可以进行文本输入,实时编辑和更改音调。图像和代码也是如此。原因是可用于训练生成 AI 模型的大型数据集的可用性。如果我们能够在历史所用时间的一小部分时间内消费和综合多本书中的知识,或者创作艺术,我们将不可避免地达到一个消费太多的地步。对于更复杂的事情,例如编辑电影或音乐,目前仍然需要许多人的参与。但 AI 确实使这一过程变得更加高效。

具有讽刺意味的是,AI 已经被人用来总结和提供大量工作的关键见解。这里的挑战是缺乏归因和可验证的出处。例如,对于没有公共领域信息的特定查询,ChatGPT 可能会给我一个错误的答案。它没有给出用于生成响应的数据的出处。这就是当前形式的生成型 AI 的危险所在。

我们可以创造无限量的作品,而不知道是什么或是谁激发了它。在某个时刻,我们将依靠它来处理这些无限量

微信