即刻App年轻人的同好社区
下载
App内打开
新皮层NewNewThing
8月前
【Lilian Weng离开OpenAI后公开露面,说研究工作也需要创造「现实扭曲力场」】10月18日,OpenAI前研究与安全负责人、现Thinking Machines Lab联合创始人翁荔(Lilian Weng)在硅谷HYSTA年会上公开亮相。她回顾了在OpenAI的工作成果,并谈到离开OpenAI后的研究方向与创业路径。同日,她创立的Thinking Machines近期对外发布的「Tinker」API亦成为会场焦点。

年会上,她提到了在OpenAI时期团队研究工作中形成的「现实扭曲力场」。「现实扭曲力场」(Reality Distortion Field, RDF)源自对史蒂夫·乔布斯的描述:当一个人(或团队)对方向有足够的信念并密集试错时,表面「不可能」的目标可以被不断重写边界、最终落地。翁荔把这一心态迁移到科研语境:每个研究者都有属于其个人的小型RDF——在强信念与系统化探索的共同作用下,把难题一步步「扭」进可实现的解空间。

2017至2024年在OpenAI任职期间,翁荔早期曾在机器人团队主导「机械手解魔方」等项目,她和团队通过「自动领域随机化(ADR)」等Sim2Real技术,将纯仿真训练的策略迁移到现实世界,最终实现「机械手解魔方」等里程碑。翁荔称,这个过程中,她产生过「如果你相信某个方向,即使它看起来不可能,但只要足够努力、足够聪明地尝试,就能找到成功的方法」的「现实扭曲力场」体验。

2024年离开OpenAI后,翁荔参与创办了Thinking Machines Lab,目标是把前沿多模态模型与高可靠训练基础设施做成「人人可用、可定制」的能力平台。

今年10月1日,Thinking Machines发布「Tinker」训练API。Tinker被定义为面向研究者与开发者推出的「托管式微调」(LLM fine-tuning)API:把它想象成「大模型训练的一站式接口」——你只需指定要用的基础模型和训练数据,Tinker就自动处理多机多卡分布式训练、容错与检查点、监控与扩缩容等工程细节,让团队像调用普通API一样快捷地完成微调与实验。Tinker支持LoRA以降低成本,并能够实现从小模型到大型 MoE(如Qwen-235B-A22B)之间一行代码切换。

Thinking Machines称,这些做法能够帮研究者在保留算法与数据主导权的同时,将分布式多GPU训练、容错与资源编排外包给平台。

目前,Tinker已覆盖Llama与Qwen等开源权重模型,并支持将训练后的权重下载到外部环境使用。产品已进入私测阶段,被普林斯顿、斯坦福、伯克利与红杉的研究团队用于真实项目场景。计划先免费开放,后续按用量计费。
00

来自圈子

圈子图片

AI探索站

114519人已经加入