Laogege's Journal

Anthropic\nAI大逃亡

Anthropic

AI大逃亡

历史的车轮滚滚向前,但它投下的阴影,往往比车轮本身更耐人寻味。在这些阴影之中,隐藏着我们时代最深刻的抉择与裂痕。今天,我将带你走进一片刚刚形成的阴影里,一个诞生于我们这个人工智能元年的巨大谜团。

如果时间可以倒流,回到2020年那个寒冷的冬天,你漫步在旧金山的街头,空气中弥漫的不是节日的喜悦,而是一种高科技圣殿内部无声的崩裂感。在那个被誉为“人工智能的梵蒂冈”——OpenAI的总部里,一种看不见的张力正在将一群世界上最聪明的大脑推向决裂的边缘。

从外部看,OpenAI正处于其权力的巅峰。他们刚刚发布的GPT-3模型,像一位从未来降临的神祇,用它那惊世骇俗的语言能力,向全世界宣告了一个新时代的来临。媒体的闪光灯、资本的追捧、全世界的目光,都聚焦在这个看似无所不能的实验室。

然而,在这片耀眼的光环之下,迷雾正在悄然升起。一群最核心的成员,那些亲手缔造了GPT-2和GPT-3、并负责为这头“巨兽”戴上缰绳的安全与研究领导者们,他们的脸上却看不到胜利的喜悦。

在会议室里,在走廊的尽头,在深夜的邮件中,一些词语开始被反复提及:“方向”、“信任”、“初心”、“压力”。他们是这场革命的功勋将领,却感受到了某种令人不安的背离。

他们看着自己亲手孕育的技术,正被一股巨大的商业洪流裹挟着,冲向一个他们无法预测,也越发恐惧的未来。价值十亿美元的巨额投资,像一剂强效的兴奋剂,注入了实验室的血管,也同时带来了一种不容置疑的命令:加速,再加速。

产品要光鲜,市场要占领,回报要兑现。而那些关于安全、关于对齐、关于人类长远未来的深沉思考,那些曾经被刻在实验室创始章程里的神圣信条,似乎正从优先事项清单上,被悄无声息地一行行划掉。

这片迷雾的核心,是一种深刻的撕裂感。它不是技术路线的分歧,而是灵魂深处的拷问:当我们创造一种可能超越人类智慧的存在时,我们究竟应该以什么样的速度、什么样的姿态,以及什么样的责任感,去推开那扇通往未来的大门。

历史记住了结果——一次惊动了整个硅谷的集体出走。但它常常忘记那个过程,忘记了在做出那个天崩地裂的决定之前,那段漫长、压抑、充满着理想主义者挣扎的沉默。

那片浓得化不开的迷雾,笼罩着一群站在人类科技最前沿的先知,也笼罩着我们所有人的未来。这片迷雾,最终汇聚成一个尖锐得令人无法回避的谜题。

这个谜题并非“谁对谁错”,也不是简单的“商业与理想之争”。它要深刻得多。谜题是:为什么? 为什么一群掌握着全世界最前沿AI技术、身处行业之巅、前途一片光明的天才,会选择在胜利的前夜,毅然决然地放弃这一切?

他们放弃了唾手可得的财富、无与伦比的声望和改变世界的最强平台。他们选择了一条从零开始、充满未知和荆棘的道路。这不符合任何商业逻辑,甚至不符合人性的基本驱动力。

所以,真正的谜题是:究竟是什么样的原则,什么样的恐惧,或者说,什么样的信念,其分量足以压过人类所追求的一切世俗成功。这不仅仅是一次离职,这是一场“出埃及记”。他们不是为了更高的薪水或更好的职位而出走,他们是为了捍卫某种东西而流亡。

要理解我们这个时代最重要的一场技术竞赛,要理解OpenAI与它最强大的对手Anthropic之间的对抗,我们就必须解开这个谜题。因为这场对抗的本质,不是代码与算力的较量,而是一场关于“如何塑造未来”的意识形态战争。

这场战争的起点,就源于那个看似不合常理的决定。所以,今天,我们不只是一名旁观者。我们将成为一名调查员,一名思想的考古学家。我们将一起,拨开那层层的迷雾,深入到这场分裂的核心,去寻找那个驱动了这一切的、最根本的答案。

我们将要探寻的,不仅仅是一个公司的诞生故事,更是一次关乎人类未来的、深思熟虑的反向宣言。要解开这个谜题,我们需要像侦探一样,搜集和审视那些散落在历史尘埃中的线索。我们的调查将分为三个部分:缔造者们的灵魂、他们构建的蓝图,以及来自未来的一个诡异回响。

第一条线索:缔造者的群像——当物理学家遇见文学硕士。一个组织的基因,往往就刻在它的创始人身上。Anthropic的创始团队,不是一群乌合之众,而是一支精心挑选、堪称“复仇者联盟”级别的队伍。他们几乎带走了一个理想化的AI实验室所需要的所有核心大脑。

而领导这个“流亡政府”的,是一对风格迥异的兄妹——达里奥·阿莫迪(Dario Amodei)和丹妮拉·阿莫迪(Daniela Amodei)。让我们先看哥哥,达里奥。他是一位典型的天才科学家,物理学博士,在普林斯顿大学研究计算神经科学。

他的履历金光闪闪:谷歌大脑、百度,然后是OpenAI的研究副总裁。他是GPT-2和GPT-3开发的核心人物,是“强化学习来自人类反馈”这项关键技术的共同发明人之一。更重要的是,他是一位“规模定律”的坚定信徒。

他通过海量实验发现了一个如同物理定律般简洁的真理:只要你有更多的算力、更多的数据、更大的模型,AI的性能就会以一种可预测的方式指数级提升。这个发现,让他兴奋,也让他恐惧。他看到了通往通用人工智能(AGI)的清晰路径,但也看到了这条路上失控的巨大风险。

他的人生中有一段深刻的烙印:他的父亲因一种罕见的疾病去世,而就在几年后,这种疾病变得可以治愈。这件事在他心中注入了一种强烈的紧迫感和责任感——科学的进步必须与审慎的控制相伴而行,时机和方向,有时候比速度更重要。

再来看妹妹,丹妮拉。她的道路则完全不同,也正因如此,她才成为了这个故事里不可或缺的另一半。丹妮拉是英国文学学士,她的职业生涯始于政界,在一个截然不同的世界里,她学会了与人打交道,理解复杂的社会规则和人性的幽微。

之后,她投身科技行业,在OpenAI,她担任安全与政策副总裁,是连接深奥技术与现实世界的桥梁。她是运营官,是招聘负责人,更是整个团队的道德罗盘。如果说达里奥代表了Anthropic的“硬科学”大脑,那丹妮拉就代表了它“以人为本”的心脏。

她带来了一种至关重要的外部视角,她坚持认为,AI安全不仅是道德上的必需品,更是一门好生意。因为最终,客户需要的不是最聪明的AI,而是最值得信赖、最可靠的AI。这对兄妹的组合,本身就是一种宣言。它宣告了Anthropic的理念:构建安全的AGI,不仅需要最顶尖的科学和工程,同样需要最深刻的人文关怀和道德准绳。

而围绕在他们身边的,是星光熠熠的创始团队:杰瑞德·卡普兰(Jared Kaplan),首席科学家,正是他与达里奥共同书写了那篇关于“规模定律”的奠基性论文。萨姆·麦坎德利什(Sam McCandlish),首席技术官,负责构建训练尖端模型所需的庞大计算集群。杰克·克拉克(Jack Clark),联合创始人,是Anthropic的“公共喉舌”和政策战略家。

克里斯·奥拉(Chris Olah),联合创始人,AI安全社区备受尊敬的研究员,他专注于“可解释性”研究,也就是像解剖大脑一样,去理解AI的“黑箱”内部到底在想什么。这是Anthropic声称能构建“可控”AI的长期科学赌注。

你看,这支团队的构成,就像一个精密的建筑设计。他们离开OpenAI时,不是带走了一块砖,而是带走了一整套完整的蓝图和施工队。从核心科学理论,到大规模工程实现,再到产品化、公共政策和运营管理。这是一个完整的、自给自足的“理想国”。

这条线索告诉我们,这次出走,是一次有预谋、有组织、有清晰愿景的集体行动。

第二条线索:新世界的律法——当AI拥有“宪法”。如果说创始人是新世界的缔造者,那么他们为这个新世界所制定的律法,则更能揭示他们内心的真实想法。

Anthropic并非仅仅满足于口头上的“安全第一”,他们将这一理念,物化为了三个环环相扣的、令人惊叹的制度设计。第一根支柱,叫做“宪法AI”(Constitutional AI)。这是一个天才般的构想。

想象这样一个场景:你给AI一个有害的指令。AI首先会生成一个回答。但紧接着,它会被迫进入一个“自我反思”的环节。系统会给它展示一条来自“宪法”的原则,然后,AI被要求根据这条宪法原则,批判自己刚刚生成的回答,并指出其有害之处。最后,它必须根据自己的批判,重写一个无害的、有益的回答。

更关键的是,在训练的第二阶段,这个过程甚至不再需要人类。AI会自己生成两个回答,然后由另一个AI,根据“宪法”来判断哪个更好。这创造了一个巨大的、由AI自己生成的“道德偏好”数据集。Anthropic正在尝试的,是给AI植入一个内在的“道德罗盘”,是教会机器如何进行“苏格拉底式的自我诘问”。

第二根支柱,是一份全新的“公司契约”——公益公司与长期利益信托。创始人们清醒地认识到,技术上的安全措施是脆弱的。如果创造技术的公司本身,其法律和财务结构就是一台无情的“利润最大化机器”,那么任何技术护栏都可能被绕过或拆除。

因此,他们做出了一个在硅谷看来极为异类的决定。Anthropic注册为一家“公益公司”(Public Benefit Corporation, PBC)。这意味着,公司的董事会在做决策时,法律允许他们,甚至要求他们,平衡股东的财务利益和其明确的公共利益。利润,不再是唯一且至高无上的目标。

但他们走得更远。他们设立了一个叫做“长期利益信托”的独特机构。这是一个由五名独立受托人组成的、与公司没有财务利益关系的机构。这个信托,持有公司一种特殊的股份,但这些股份赋予了它一项至高无上的权力:选举公司董事会中越来越多的成员,并最终达到多数席位。

这是一个“安全阀”,一个深思熟虑的制衡机制。它的存在,就是为了确保在未来的某个极端时刻,有一个独立的、只对公共利益负责的声音,能够站出来说“不”。他们试图用法律的枷锁,去锁住那头可能吞噬一切的商业猛兽。

第三根支柱,是“负责任的扩展政策”。创始人们也明白,在一个丛林法则盛行的世界里,仅仅自己做个好人是不够的。于是,他们选择了一种非常聪明的策略:公开透明。他们发布了一份详细的“负责任的扩展政策”,像一份军备控制条约一样。

它定义了不同级别的AI安全水平,并公开承诺,在没有达到相应的、可验证的安全和安保措施之前,绝不训练或部署更高级别的模型。这不仅仅是一份内部准则,这是一封公开的挑战书。通过将自己的安全承诺公之于众,Anthropic向所有竞争对手施加了巨大的道德压力。

这三根支柱——宪法AI、公益公司、扩展政策——并非孤立的。它们是一个层层递进、环环相扣的“深度防御系统”。从模型层面、到公司层面,再到行业层面,他们试图为AI的风险,构建一个全栈式的解决方案。这条线索告诉我们,他们的出走,不仅仅是为了逃离什么,更是为了构建一个全新的范式。

第三条线索:来自未来的回响——2023年的那场宫斗。时间快进到2023年11月。一场震惊全球科技界的“宫斗大戏”在OpenAI上演。其CEO山姆·奥特曼被非营利董事会突然罢免,理由是董事会对他“不再有信心”。

然而,几天之内,在主要投资者和大量员工以集体辞职相威胁的巨大压力下,奥特曼戏剧性地回归,而那个试图坚守“安全使命”的董事会则被改组、削弱。这个事件,对于远观的我们来说是一场精彩的商业剧。但对于两年前就离开的Anthropic创始人们来说,这无异于一声来自未来的、震耳欲聋的回响。

它以一种残酷而公开的方式,验证了他们当年最深刻的担忧。他们当年担心的,不就是商业压力会侵蚀实验室的安全使命吗?2023年的这场风波,活生生地证明了,当巨额资本的利益受到威胁时,那个最初用来保障“使命至上”的非营利董事会结构,是多么的不堪一击。这让Anthropic在2021年的那场“出埃及记”,在事后看来,不再是一次冲动或偏执,而是一次极具先见之明的预判。

现在,所有的线索都已呈现在我们面前:一群怀揣着深刻责任感的缔造者,一套旨在将伦理注入代码、用法律锁住贪婪的制度设计,以及一段被历史亲口证实的预言。我们终于可以拨开最后的迷雾,触及那个核心的本质了。

Anthropic的诞生,其最深刻的逻辑,并非技术之争,而是权力与控制之争。它源于一个根本性的问题:在面对一种可能定义人类未来的、拥有神一般潜力的技术时,最终的控制权应该掌握在谁的手中?

OpenAI最初的答案是:一个无私的非营利董事会。但历史证明,这个答案在现实的商业引力面前,过于脆弱。而Anthropic给出了一个全新的、更为激进的答案。他们认为,仅仅依靠人的善意是靠不住的。控制权,必须被分散、被制衡,被写入机器的灵魂,被刻入公司的法律DNA。

这就是那场分裂的本质。一方认为,为了推动人类进步,可以接受一定程度的风险,速度和能力是第一位的,安全可以在发展中逐步完善。权力的最终仲裁者,是市场和用户。

而另一方,也就是Anthropic的创始人们,则认为,对于AGI这种级别的技术,风险是无限的,任何一个微小的失误都可能造成无法挽回的灾难。因此,安全必须是前提,而不是补充。控制权必须先于能力,原则必须高于利润。

他们出走,放弃一切,不是因为他们不相信AI的力量,恰恰是因为他们太相信了。他们相信AI的力量如此巨大,以至于人类现有的任何公司结构、任何激励机制,都不足以安全地驾驭它。所以,他们必须从零开始,建造一艘全新的方舟。

“安全即护城河”——这句看似商业口号的话,在Anthropic这里,有着更深的含义。它不仅仅是一种商业策略,它是一种生存哲学。他们正在进行一场豪赌,赌的是在通往AGI的漫长旅程中,最终胜出的,不是最快的,也不是最强的,而是最值得信任的。

这个关于出走、分裂与重建的故事,已经超越了一家科技公司的范畴。它像一面棱镜,折射出我们这个时代最核心的焦虑与希望。它为我们,为所有生活在这个AI时代的人,提供了一个深刻的洞见。

这个洞见是:我们创造工具,工具也反过来塑造我们。当我们开始创造一种可能超越我们自身的“工具”时,我们面临的终极挑战,不再是技术问题,而是“我们想成为什么样的创造者”的哲学问题。

Anthropic的故事,就是一次对这个问题的严肃回答。它告诉我们,在追逐星辰大海的征途中,仅仅仰望星空是不够的,我们还必须时刻审视我们脚下的这艘船,它的结构是否坚固,它的罗盘是否可靠,它的船长是否清醒。

这不再是硅谷象牙塔里的辩论。从我们每天使用的聊天机器人,到决定我们贷款审批的算法,再到未来可能管理城市、发现新药的人工智能,这场关于“速度与安全”、“利润与原则”的战争,其结果将深刻地影响我们每一个人的生活。

Anthropic的创始人们,用他们的行动,向世界提出了一个警示:技术的发展,尤其是指数级发展的技术,本身并不天然地导向一个更美好的未来。它需要被引导,被塑造,被注入我们最珍视的价值观。这个过程,不能仅仅依赖工程师的善意,更需要制度的设计、法律的保障和全社会的共同监督。

所以,下一次,当我们惊叹于某项新AI技术的神奇能力时,或许我们可以多问一个问题:创造它的,是一个什么样的组织?它遵循着什么样的原则?它将把我们带向何方?因为Anthropic的故事最终教会我们,在通往未来的无数条岔路口,真正决定我们命运的,往往不是我们走了多快,而是我们选择了哪条路。

而这个选择,关乎我们所有人。这是一个在人工智能黎明时刻,由一群清醒的“叛逆者”为我们点亮的、关于责任与希望的灯塔。它的光芒,或许才刚刚开始照亮前方的路。

🎥 Watch the Animated Story

📺 Visit Sumatman to create your own animated story!

Author image
About Laogege
Menlo Park Website
Angel Investor, Creator, Speaker, Coder & Lifelong Learner
You've successfully subscribed to Laogege's Journal
Great! Next, complete checkout for full access to Laogege's Journal
Welcome back! You've successfully signed in.
Unable to sign you in. Please try again.
Success! Your account is fully activated, you now have access to all content.
Error! Stripe checkout failed.
Success! Your billing info is updated.
Error! Billing info update failed.