OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

小编 26 0

henry 发自 凹非寺

量子位 | 公众号 QbitAI

引领大模型"下半场"发展的姚顺雨,正迎来个人人工智能事业的全新阶段。

近期,这位备受关注的OpenAI华人科学家动态引发AI行业广泛热议。

此前有消息称其进入Meta创始人扎克伯格的重点招揽名单,近期更有传闻指其可能加盟中国科技巨头,相关"薪酬方案"引发业界惊叹。同时也有消息显示,姚顺雨正考虑独立创业路径……

姚顺雨的下一站去向尚未明确。

但多方信源已证实姚顺雨已从OpenAI离职,目前仅待本人正式公布。

这位29岁的青年科学家,似乎正准备开启个人AI事业的全新征程。

这位年仅29岁的科技新锐,毕业于合肥一中、曾获NOI奥赛银牌、以704分的高考成绩成为安徽理科探花进入清华姚班,最终在普林斯顿大学获得计算机博士学位(研究方向为自然语言处理与强化学习),毕业后即加入OpenAI……

早在学生时期,姚顺雨已产出多项具有行业影响力的科研成果,包括:

思维树(Tree of Thoughts):大幅提升大语言模型推理能力的多路径思考框架

SWE-bench:针对软件工程师能力的AI评估基准数据集

SWE-agent:开源的人工智能程序员系统

ReAct框架 …

其撰写的《AI下半场》博文更以超越年龄的行业洞见,在全球AI领域引发强烈共鸣。

这位科技新星究竟有着怎样的成长轨迹?

2024年初加入OpenAI后不久,姚顺雨在一次访谈中推荐了人工智能领域经典著作《哥德尔、艾舍尔、巴赫:集异璧之大成》。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

这部由认知科学大师侯世达创作的跨学科巨著,将数学不完备定理、视觉艺术错觉与古典音乐结构精妙融合,揭示了不同领域知识如何在计算机递归系统中形成共鸣,书中那句"觅之,便有所获"更成为其科研哲学的生动注脚。

受这部著作启发,跨学科思维与开放认知态度贯穿姚顺雨的学术生涯,逐渐塑造出其独特的研究风格。

与众多顶尖学子相似,姚顺雨初中就读于合肥知名学府——合肥市第四十五中学(2009—2012),初中毕业后升入合肥市第一中学

2014年,他在全国信息学奥林匹克竞赛(NOI)中以495分的成绩荣获银牌;2015年高考中,他以704分的优异成绩位列安徽省理科第三名,成功进入清华大学交叉信息研究院姚班,主修计算机科学专业。

在看似标准的"学霸"成长路径背后,姚顺雨实则展现出与众不同的跨界特质与探索精神。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

△来自清小华

姚顺雨在访谈中透露,相较于其他姚班同学专注单一领域深耕的特点,他更热衷于广泛涉猎数学、历史等多学科知识,保持开放的知识获取态度。

他对嘻哈音乐的热爱也早已为人熟知。

艾米纳姆、蛋堡、热狗、Jcole等说唱歌手的作品伴随其成长,在清华大学期间,他还联合创办了清华大学学生说唱社。

值得关注的是,在2019年清华大学自主选拔复试开营仪式上,姚顺雨曾以一段即兴风格的发言解释选择清华的原因,给未来学弟学妹留下深刻印象:

但是对于我来说,选择清华、北大并不是问题,因为北大没有我姓氏命名的班级。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

除担任说唱社联合创始人外,姚顺雨还曾担任清华大学招生志愿者及姚班联席会主席。在谈及姚班学习经历对其影响时,他表示:

姚班特别注重理论基础课程教学,像操作系统、电路设计等看似与前沿科研无关的课程,现在看来都带来了重要帮助。这些学习经历让我对计算机科学的整体架构有了系统认知。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

△(姚班合影,清华招生公众号)

这种兼容并蓄、跨学科探索的学术气质在姚顺雨身上表现尤为突出。用哲学家以赛亚·伯林的分类,他更像是一只"狐狸"而非"刺猬",这种特质也深刻影响了其后续的研究方向。

(注:伯林提出"刺猬"象征专注于单一核心理论的研究者,倾向于将所有经验纳入统一框架;"狐狸"则代表涉猎广泛、灵活应对复杂问题的思考者,擅长运用多元视角解决问题)

令人意外的是,直到大三下学期,姚顺雨既未接触过人工智能领域,也未参与过科研项目。

一次赴麻省理工学院(MIT)的交换经历,成为其学术生涯的重要转折点,此后他开始跟随吴佳俊教授从事计算机视觉与认知科学交叉领域的研究。

姚顺雨表示,在跟随吴佳俊教授及学长Jun-Yan Zhu学习期间,不仅掌握了实验设计、学术汇报等科研基础能力,更受到深刻的思想启发,认识到心理学与人工智能交叉研究的价值,学会从系统框架和更高维度思考科学问题。

2019年,在姚班完成四年学业后,他前往普林斯顿大学攻读博士学位,再次展现跨学科探索精神。

本科阶段主要研究计算机视觉的他,在博士阶段虽被计算机视觉方向录取,却因研究兴趣转变,主动联系自然语言处理(NLP)领域导师。最终,通过学术机缘加入Karthik Narasimhan教授团队,专注于自然语言处理与强化学习交叉研究。

这种从视觉到语言的研究转向,恰恰印证了"觅之,便有所获"的学术理念。姚顺雨回顾称,这次跨界成为其学术生涯的重要机遇,恰逢GPT-2模型兴起,因此在博士一年级时便开始探索语言模型向智能体(Agent)转化的可能性。

对通用智能体(General Agent)的研究兴趣,自此贯穿其学术生涯。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

姚顺雨博士期间的首个研究成果CALM(2020),探索了语言模型作为智能体玩语言游戏的可能性。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

在CALM框架中,语言扮演媒介角色:将人类经验与语义模式转化为可执行的动作选项,同时承载上下文信息,使智能体在复杂动作空间中实现高效决策。

姚顺雨表示,尽管这项研究不如SWE-bench、ReAct或思维树知名,但对其学术发展具有奠基意义。

在与张小珺的访谈中,我们发现姚顺雨对语言本质的关注早在这项五年前的研究中已初现端倪。

具体而言,通过语言进行游戏具有无限可能性,智能体可凭借语言进行推理组合,在不同场景中生成适应性动作,从而实现能力泛化。

换言之,智能体同样需要具备"跨界"能力,而语言正是实现这种能力的理想媒介。

然而,姚顺雨也意识到,缺乏有价值的任务环境,即使游戏得分再高也无实际意义。

基于这一思考,他的第二项重要研究WebShop构建了大规模模拟电商平台环境,使智能体通过理解复杂文本指令在网页中完成导航操作,推动语言理解与决策能力在真实世界任务中的验证与应用。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

同样,后续的经典研究SWE-BenchSWE-agent也聚焦于具有实际意义的任务场景(现实编程任务),验证智能体的真实能力。

2022年,GPT-3.5的出现彻底改变了AI研究格局。

众所周知,让空白模型通过反复试错学习效率极低,而传统强化学习中这种低效探索普遍存在:智能体往往局限于单一任务(如下围棋),或在庞大动作空间中盲目搜索。

GPT-3.5的成功证明了先验知识的关键价值:通过强大的语言预训练将常识与语言知识融入模型,再通过微调即可打造具备跨界能力和泛化性能的智能体。

正如姚顺雨所言:如果预训练阶段已融入全面知识,那么强化学习只是激发这些能力的技能训练过程。

受GPT-3.5启发,姚顺雨团队开发了ReAct框架(ReAct: Synergizing Reasoning and Acting in Language Models),使大语言模型在与外部环境交互时能同时进行"推理"与"行动"。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

姚顺雨后来将其称为自己最满意的研究成果(目前也是其被引次数最高的论文)。基于此项研究,他的研究方向逐渐聚焦两个核心:一是构建有价值的现实世界任务环境;二是开发简洁通用的方法论。

他认为,实现通用智能与泛化能力的关键在于推理能力。语言模型恰好提供了强大的先验知识基础,这种先验使推理成为可能,而推理能力又支撑智能体在不同环境间实现泛化。

因此,在GPT和思维链(Chain of Thought)等研究基础上,思维树(Tree of Thoughts, ToT)框架让语言模型通过多路径探索与自我评估,实现比传统线性推理更高效的复杂问题解决能力。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

纵观姚顺雨的学术历程,无论是对通用智能体的探索,还是对语言作为认知决策媒介的研究,都体现了他对跨界思维与泛化能力的持续追求。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

28岁的事业转折点

相较于说唱歌手热狗歌中"23岁的九局下半",28岁博士毕业加入OpenAI的姚顺雨,正迎来自己职业生涯的关键转折期。

2024年8月1日,姚顺雨宣布加盟OpenAI,当时即引发全球科技界高度关注。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

值得一提的是,姚顺雨与OpenAI的学术渊源颇深——其博士导师Karthik Narasimhan正是GPT-1论文的第二作者。

OpenAI华人科学家姚顺雨离职 或将开启AI创业新篇章

在OpenAI工作的一年多时间里,姚顺雨今年4月发表的博文《The Second Half》引发广泛讨论,文中宣告人工智能发展主线已进入"下半场"阶段。

(是的,人工智能也迎来了自己的发展转折点)

姚顺雨指出:AI发展可分为两个阶段。上半场以模型与方法为核心,重点构建了基础模型架构与训练方法;随着技术成熟,下半场将聚焦于定义具有现实意义的任务场景,以及建立有效的AI系统评估体系。

新的评估体系应贴近真实世界任务需求,通过优化模型解决方案形成新的技术迭代循环。

从中可以清晰看到姚顺雨的角色转变:从专注技术突破的科研人员,逐渐成长为具备需求洞察能力的战略思考者。

在近期曝光的与张小珺访谈中,姚顺