即刻App年轻人的同好社区
下载
App内打开
Xinran.Z
372关注646被关注1夸夸
主理ResearchAI+研究者社区
NextGen职业网络
HCI&产品&设计
爱人文社科的理工🐱
PhD in 吃喝玩乐🥘☕️🚣‍♀️🎨🥞🎮🏕️
置顶
Xinran.Z
9月前
Hi~你好!我是 Xinran,欢迎来到我的个人说明书~ 这里是 Tongji 和 Cornell校友一枚,目前常驻上海。本人属性:“热爱折腾” ٩(ˊᗜˋ )œ 。对未知的天生好奇和对新挑战的跃跃欲试,就是我生活的驱动力。

秉承着这股劲,architectue毕业之后我先去了全球顶级建筑公司的旧金山办公室“搬砖”。身处硅谷,浓厚的科技氛围和创新浪潮,让我开始认真思考设计与技术的更多可能性。于是,在当地同学和校友的启发下,我开始转向Product Design和HCI领域,期待有朝一日能用技术改变设计、甚至是创造的范式。

回到上海办公室后,继续负责了几个有分量和社会意义的城市设计项目(张江科学之门 & 城隍庙老城厢城市更新的主创设计就是我٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ)。后来一次与director的对谈中,他所坚信的“以后人工智能就算来了,也不会改变建筑设计的方法,大家还是会用老办法来做设计”促使了我最终的转型。乘着国内B端产品“火热的”东风,我顺势“跑路”去当了B端产品设计师👩‍🎨

时间快进到22年底,那时 ChatGPT还没有出圈,B端AI产品怎么玩就更加扑朔迷离,但这种“广阔天地大有可为”的情景早就吸引了我的关注。随后一个机会出现-—-和硅谷的朋友远程组队,帮一个当地某大厂出来的 AI新秀团队,从0到1搭建产品逻辑和交互框架。就这样我一头扎进了AI产品设计和交互的世界。👀 BTW,这个团队后来还登上了Wing的Enterprise Tech 30 List,也算是一份迟来的惊喜。

此后,为了更深入地理解和实践AI产品的打造,我开启了AI产品经理+设计+前端开发(偶尔客串)的“全栈”打怪升级模式,带了个独立小分队,主攻帮研究机构和初创团队从0到1落地有价值的AI/SaaS产品。

🥳🥳🥳从 24 年底开始,“爱折腾”的故事有了新篇章:我开始了创业项目!从运营独立Studio 到创业,是一个很大的转变,创业小学生正边打怪边升级 ing,自己也在转变成为 Design 出身的 PM 同时学习做 Engineer(ง•̀_•́)ง

目前正在做的事:

1. 用心建设研究者社区。
作为半个HCI研究者(研究辅助实践居多),我发起了非营利研究者社区Research AI+,这里已经汇集了一群来自 Global 的AI 及 AI 4 Science/Engineering 的青年研究者们。我们在尝试帮助 Researcher 们打破地域和学科壁垒、希望能够碰撞出Industry 和 Academia 的合作火花。最近我们正和长三角的其他机构/社区密集联动搞分享和交流活动(比如沙龙或者读论文这种 Researcher 专属活动),基本每个月都有好玩的活动(^-^)📚欢迎在首页找找,也欢迎看我 Yellow page 里面的两个链接来找到社区入口~

2. 孵化 Researcher for Researcher的产品。
社区里还有一票超有创造力的独立开发者小伙伴,热衷于开发AI for Researcher 的产品(感谢 Vibe Coding 赋能超级个体(๑˃̵ᴗ˂̵)让设计师和算法后端同学也有机会launch 产品)。目前正在孵化专属于NextGen Researcher 的职业社交产品,欢迎大家关注我们!

🔑🔑🔑除了跟小伙伴建设社区、开发产品,个人日常也一直“在折腾”,保持“在路上”的感觉:

📚撰写Heuristics for AI Product Design(AI 产品的启发式设计方法)专栏:
即刻中文版地址: m.okjike.com

📬跟前鹅厂算法@Liz_Li 一起做了一个 free 的Substack newsletter,包含Heuristics for AI Product Design 专栏全部内容,还包含 Liz 主笔的一些硬核的技术文章。open.substack.com

📻正在筹划制作一款面向Researcher 的播客,欢迎各位即友来分享研究方向和研究趣事~

👩‍💻正在构建 Figma+V0+Cursor 的设计前端一条龙 workflow(根据Figma 的更新,也许以后就是 Figma Make+Cursor+Vercel/Replit)

📌沉淀基于 Nextjs+tailwindcss+shadcn 的 SaaS 产品组件库,让之前的咨询服务能持续发挥价值,帮助中小团队快速 launch 产品。

🧬研究 workflow 与 agent 的产品结合点,目前在玩 n8n

💡💡💡专业之外的隐藏身份
一个不热爱生活的设计师,不会是一个好的产品人,因此我:

🌿是一位户外爱好者但人菜瘾大,速徒、桨板、溯溪、露营还请叫着我~

☕️吃货本货,爱吃也爱做,热爱全球美食和咖啡探店,对自己的手冲咖啡水平有些小自信😎;

🌆建筑的老本行变成了纯爱好,日常溜达 City Walk/Bike/Hike 探索城市秘境;

🪄业余热爱创作文字,已写过武侠/科幻小说超过 25w字;

🐱兼职铲屎官,家有恶猫又皮又黏人;

🫴打了很多年咏春拳总算要学到木人桩了!

多元的身份让我的生活永远不止一个“锚点”,也是我多年专业上持续“折腾”探索的心灵保障和精神源泉😜😜欢迎各位同好们(⁎⁍̴̛ᴗ⁍̴̛⁎)各种约约约!

附图是大学时候去丽水写生的画作,许愿有一天能恢复画画的功力 finger cross~
204
Xinran.Z
4天前
chrome 小插件还能收到用户评论😭太感动了。@Liz_Li Web Noter 要加油继续朝着“小而美”前进(ง•̀_•́)ง
30
Xinran.Z
5天前
Lenny 开源了他 320 期播客的文字记录🥹🥹🥹txt 文档👉 www.dropbox.com
17
Xinran.Z
11天前
Agent 的控制权、AI 契约(Contract)和 Agent 管理

上次我们聊了一些关于《Agent 的控制权谱系》,有小伙伴提了一个非常好的问题:

“高自主性到超高自主性的提升是什么?是 ai 主动发现需求制定目标吗?”

其实这两者都还属于用户来定目标,Agent 管整个生命周期。

-高自主性(低度人为控制):“Agent功能”。用户提供目标,Agent 自主规划步骤,对每一步的直接人工干预很少。
-超高自主性(异步运行的后台代理):独立完成整个功能实现或 Bug 修复,并提交 PR,人只负责最终审查。

两者区别在于这里说的“高自主性”还是属于前台协作,用户需要随时纠正Agent可能出现的错误,任务成功与否依赖于用户对过程的实时对齐。而“超高自主性”是它脱离你的视线进入后台,在不可控的过程中 自主完成如读日志、测试通过、自主循环修复等的整个闭环,直到交付一个通过验证的 PR 才会通知用户。

至于小伙伴提到的“主动发现需求和目标”,可以被认为是更高一个级别的“终极自主性”——能够通过观察用户行为,做出识别、从 todo 里面做筛选、排序并持续任务循环。

用户正在从管操作的 IC 往管理者转变,用户需要设计的不再是对话引导,而是严谨的验收标准。那么如何定义 AI 契约(Contract)来更好地管理 Agent 工作?

Agent 的设计中,AI 契约(Contract) 是人机交互从“模糊指令”向“确定性结果”转化的核心机制。与 prompt 不同,它更像是一份详尽的、作为“唯一事实来源”的规范文件,主要为了解决 Agent 在长时任务中常见的“过早宣布胜利”或“幻觉式完工”等“偷懒”问题——

你的员工工作到一半就交差了,有没有可能是你没告诉它“交付标准”?

定义 AI contract 的核心支柱与实例:

1. 不可变的功能列表(Immutable Feature List) 将高层目标拆解为结构化的 JSON Markdown 文件。契约规定:Agent 仅能更新任务的完成状态(如 passes: true),严禁擅自修改或删除原始需求描述。

比如: 开发一个登录页面时,契约应明确列出:1. 包含邮箱格式验证;2. 密码强度检查;3. 错误时弹出 Toast 提醒。如果 Agent 觉得某项太难,它必须向人请示,而不是直接跳过。

2. 动态协商与前置反馈(Negotiation & Feedback) 契约不是单向指令,而是双向对齐。Agent 在执行前会评估资源可行性并反馈风险。

比如: 若契约要求分析去年的财务数据,但 Agent 发现对应的数据库权限未开放,它会立即回复:“XYZ 数据库无法访问,请提供凭证或批准使用替代数据源”,从而避免在错误路径上浪费 token。

3. 可验证的交付标准(Verifiable Deliverables) 契约必须包含客观的验收方法,实现“质量驱动的迭代执行”。

举例: 在代码生成的契约中规定:代码必须通过 20 个特定的单元测试,且检查为零报错。Agent 会进入“生成-运行-报错-修复”的循环,直到完全满足这些硬性指标才会交付。

4. 层级化的子契约拆解(Hierarchical Subcontracts) 对于超大规模任务,主 Agent 充当项目经理,将主契约拆解为多个独立的“子契约”并分发给专业 Agent。

比如: “构建电商 App”的主契约可拆分为:UI/UX 设计子契约、用户认证模块子契约、支付网关集成子契约。每个子契约都有独立的交付物和规范。

这样一来,用户的角色正从 prompt writer转变为负责制定和管理契约的人,定义严谨的任务验收标准并审计 Agent 对契约的履行情况成为越来越重要的事。

AI 契约是建立信任的制度基础,而推理透明度则是建立信任的心理基础。你也许对大模型 thinking mode 里面的碎碎念自言自语并不陌生,那么下一次也许我们可以来聊聊推理透明度。

小红书 - 你的生活兴趣社区

00
Xinran.Z
13天前
3 和 4 都还属于用户来定目标,Agent 管整个生命周期。区别在于3还是属于前台协作,用户需要随时纠正Agent可能出现的错误,任务成功与否依赖于用户对过程的实时对齐。4 是它脱离你的视线进入后台,在不可控的过程中 自主完成如读日志、测试通过、自主循环修复等的整个闭环,直到交付一个通过验证的 PR 才会通知用户。至于你提到的主动发现需求和目标,可以被认为是 5更高自主性的 Agent, 能够通过观察用户行为,做出识别、从 todo 里面做筛选、排序并持续任务循环。 //@KyleDZ: 3到4的提升是什么?ai主动发现需求,定目标吗?

Xinran.Z: 最近在build 的同时尝试做点 Agent Pattern Design研究,今天研究到控制权的设计,非常有意思。Cursor 作为一个非常 AI Native 的例子,很值得拿来做案例。 Agent 的控制权其实是一个连续的谱系,如果简单粗暴按照高中低划分,可以是: 1. 低自主性(高度人为控制):Tab 补全。用户仍然是主要驱动力,AI 只是在微观层面做了输入增强。 2. 中自主性(中度人为控制):Command K。用户定义范围和高层目标,AI修改选定的区域或单个文件。 3. 高自主性(低度人为控制):“Agent功能”。能够处理 多文件任务或复杂的重构。用户提供目标,Agent 自主规划步骤,对每一步的直接人工干预很少。 4. 超高自主性(异步运行的后台代理):独立完成整个功能实现或 Bug 修复,并提交 PR,人只负责最终审查。 用户正在从管操作的 IC 往管理者转变,相比于如何操作,用户更需要知道任务边界以及何时打断、何时干预和接管。随着模型能力的提升,Agent 的自主性越来越高,混合式的自主性成为主流——人与 AI 协同贡献,用户根据任务复杂度和对 AI 的信任度,在控制和放权之间无缝切换。 人机交互的未来不仅仅关于界面和操作,更重要的是人与 AI“契约”和“边界”的设计、人类意图的识别传递以及有效的结果验证和反馈设计。

00
Xinran.Z
14天前
社区今天高赞的一个claude Agent SDK workshop 的视频,CC 团队成员主讲,从概念到落地,定义了“Agent”与“Harness”(把工具、提示词、技能串起来),处理工具执行与 XML 参数解析,接入 Bash 命令行、文件读写权限与安全策略,上下文工程与实时监控等等…视频有点长,大家按需服用(手动狗头)www.youtube.com
24
Xinran.Z
14天前
最近在build 的同时尝试做点 Agent Pattern Design研究,今天研究到控制权的设计,非常有意思。Cursor 作为一个非常 AI Native 的例子,很值得拿来做案例。

Agent 的控制权其实是一个连续的谱系,如果简单粗暴按照高中低划分,可以是:

1. 低自主性(高度人为控制):Tab 补全。用户仍然是主要驱动力,AI 只是在微观层面做了输入增强。
2. 中自主性(中度人为控制):Command K。用户定义范围和高层目标,AI修改选定的区域或单个文件。
3. 高自主性(低度人为控制):“Agent功能”。能够处理 多文件任务或复杂的重构。用户提供目标,Agent 自主规划步骤,对每一步的直接人工干预很少。
4. 超高自主性(异步运行的后台代理):独立完成整个功能实现或 Bug 修复,并提交 PR,人只负责最终审查。

用户正在从管操作的 IC 往管理者转变,相比于如何操作,用户更需要知道任务边界以及何时打断、何时干预和接管。随着模型能力的提升,Agent 的自主性越来越高,混合式的自主性成为主流——人与 AI 协同贡献,用户根据任务复杂度和对 AI 的信任度,在控制和放权之间无缝切换。

人机交互的未来不仅仅关于界面和操作,更重要的是人与 AI“契约”和“边界”的设计、人类意图的识别传递以及有效的结果验证和反馈设计。
52
Xinran.Z
1月前
Shadcn 重磅更新,朝着generative design system 迈进了!
00
Xinran.Z
2月前
NeurIPS 2025 日益临近,我们想借此契机,推出一档社区生长出来的全新栏目——🥳🥳🥳
Research:Side B,把一些值得被看到的科研故事、研究者心法和工作背后的思考讲出来,同时也讲讲 Researcher 科研/工作/创业中的酸甜苦辣。

我和@Liz_Li 一起,跟社区小伙伴 Tiger 聊了很久, 从他 NeurIPS 2025 中稿论文开始,又聊到科研方法、研究者创业等等。这篇论文中,他把一群大语言模型直接丢进真实市场,让它们在美股里“管一笔钱”。

本文是上篇,包含了大模型实盘投资 “Live Benchmark”,系统分析“Time Traveling”、多智能体投资框架与不同 LLM 在金融里的能力边界与真实表现、研究的起源/路径与延伸思考。下篇会更多涉及“一篇顶会论文如何开启的创业之路”的故事。敬请期待(っ•̀ω•́)っ✎⁾⁾

https://mp.weixin.qq.com/s/_-V_dAM1UEFD76noQ5Nsyw

00
Xinran.Z
2月前
AI 语音桌游真的太好玩了哈哈哈哈哈@傅丰元 语音知识已经被科普地差不多了٩̋(๑˃́ꇴ˂̀๑)
11