即刻App年轻人的同好社区
下载
App内打开
羊羊的AI观察笔记
89关注134被关注0夸夸
📝7年AI产品经理
🪴有一个小小的AI咨询工作室
🙃不成熟女骑
🪧ENFJ
羊羊的AI观察笔记
27天前
上面介绍的大部分功能使用米家的自动化基本就可以实现,除了音箱放DJ和相关的播报,音箱原生还没支持大模型。
因此对于当下这个方案,我的警惕性会远大于它能带来的收益。
把配置的权限和操控入口交给他之后,摄像头,音箱等作为家庭关键性信息入口,被泄露或者利用的结果有点承受不了。当然,只要这些东西存在就有暴露的风险,哪怕没有新工具。

歸藏: Agent 接触现实世界的速度比我想象的快多了。 小米发布了 Xiaomi miclaw,国内首个手机端类"龙虾"智能体。 我拿到内测资格测试了几天,发现它真的通过无数米家设备开始感知和干预现实世界。 结合你的米家设备和手机几乎可以获取你的所有信息,自动帮你在任何场景做事。 长文可以在这里看:https://mp.weixin.qq.com/s/tRmz-GsreNCtcrh6XnzPnA 分享 3 个比较复杂的案例👇 ====== 智能早安管家 很多人用龙虾给自己做早报,但这部分信息只能在你打开电脑或手机才能看到,只能帮你搞工作的事情,并不能帮你更好的生活和塑造氛围。 比如我就一直想,早上让小爱音箱叫我起床,顺便像电台 DJ 一样播报一些我关心的信息和音乐。 现在有了 Xiaomi miclaw 终于可以实现了。只需要跟他说句话,每天早上起床小爱就会进行播报:今天的天气、昨天的科技新闻、家里的温湿度、顺便调整加湿器、播放一首适合当前季节和天气的音乐。 ------ 怎么设置的 Xiaomi miclaw 支持获取你家里所有的米家设备状态,只需要在设置里进行米家授权就行。我让他获取了温湿度计的状态,除了播报以外,如果温度和湿度超过正常值他会启动加湿器或者空调。 他也支持 OpenClaw 这种 Agent 的搜索工具和 MCP,甚至内置了这部分直接就知道我现在的位置。所以我让他搜索了当前的天气以及昨天的科技新闻整理了一下。 不止可以获得你家里米家设备的状态,还可以控制。小爱现在直接变成了一个电台 DJ 和闹铃。 刚开始我没加播放音乐,后面编辑也是可以的,直接跟他说编辑哪个定时任务就行。已经添加的定时任务会在左上角的定时任务页面显示,到时间会自动执行。 ------ Only Xiaomi Can Do 如果你有智能窗帘,可以让它在播报天气时自动打开,阳光洒进来,自然唤醒。 如果你有智能咖啡机,可以让它在你起床时自动煮好咖啡,起床就能喝到热咖啡。 这些设备不需要你逐个设置,只需要一句话告诉 AI 你的需求,它会自动编排这些设备的联动。甚至如果你是小米手表的话,可以让他主动通知 Xiaomi miclaw 你起床了,避免生硬的定时吵醒你。 而且随着小米生态的扩展,未来可能接入小米汽车。你说"准备出门",车库门自动打开,汽车提前启动预热,座椅加热打开,导航自动规划好路线。 以前温湿度计只是告诉你温度,现在它是 AI 感知环境的传感器。设备越多,AI 越聪明;AI 越聪明,设备越有价值。 ====== 智能离家模式 我们从小就被教育,每次出门前都要检查家里的电器有没有关。卧室的灯、电视、空气加湿器、空调插座、显示器挂灯。但这些要逐个检查,逐个关闭,很麻烦。 当然现在米家也可以设置自动化,但相当繁琐,与其手动设置我都不如每次自己搞。而且我不习惯每天被摄像头盯着,只想在我不在家的时候启动监控。 现在自然语言描述就行,Xiaomi miclaw 甚至可以帮你分析哪些电器可以关,哪些不行:检查并关闭台灯、检查并关闭空调插座、检查并关闭显示器挂灯、检查并关闭加湿器、发送电视关机命令、打开摄像头对客厅和门口进行监控。 ------ Skills 系统的巧妙设计 本来我是想让摄像头检测我离家自动执行的,但现在摄像机没办法主动跟 Xiaomi miclaw 进行交互。然后设置里面我又没看到有类似 Skills 这种东西,我心想这咋实现。 但是我又抱着怀疑的态度对 Xiaomi miclaw 说:"创建一个叫离家的 Skills,然后我到时候给你发送离家或者是别的方式触发就能触发,行吗?" Xiaomi miclaw 立即理解了我的需求,创建了一个名为"离家"的 Skills,支持多种触发词:离家、出门、离开家等。 我发现他的 Skills 是存在 Memory 文件夹里的,变相实现了 Skills。而且这部分大概率当时就没做,但小米这个模型不错,知道曲线实现一下。 后面我在测试的时候想起来,加一个离家的时候开启摄像头。他通过编辑 Skills 文档完成了更新。小米这波人真的懂,本地和文档优先系统也学到了。 ------ 智能决策不是简单指令 注意:这里不是简单的关闭所有设备这种指令。Xiaomi miclaw 在智能决策:检查设备状态,只关闭开启的设备,避免无效操作。 这个 Skills 系统最厉害的地方在于:你可以用自然语言创建任何自动化场景。 如果你有智能门锁,可以加入"检查门锁状态,未锁则自动上锁"。 如果你有扫地机器人,可以让它在你离家后自动开始清扫,回家前刚好扫完。 如果你养宠物,可以让智能喂食器在你离家后定时喂食,摄像头实时查看宠物状态。 而且这些 Skills 不需要写代码,不需要复杂的可视化配置,只需要一句话告诉 AI 你想要什么,它就能帮你创建。 这些硬件不再只是智能家居,而是 AI 的神经末梢。小米的 10 亿设备,正在变成 AI 接触物理世界的触手。 ====== 智能会议助手 Xiaomi miclaw 还能控制你手机的大部分系统应用,比如笔记、日历等。 AI 智能录音设备和软件现在已经成了一个非常大的 AI 产品品类。我就尝试了一下看看能不能用 Xiaomi miclaw 搞定一个类似的需求。 我让 Xiaomi miclaw 帮我创建了一个"录音会议助手" Skills。使用流程很简单: 会议开始前说"测试录音 skills",Xiaomi miclaw 自动开始录音(后台静默录音,不打开录音界面)。我正常开会。会议结束后说"停止录音",录音 APP 自动转录语音为文字。我复制转录文本到剪贴板,说"读取剪贴板"。Xiaomi miclaw 自动生成会议纪要保存到系统笔记,自动提取待办事项,自动添加日历日程。 ------ 实际测试效果 我实际测试了一次。录音内容是:"我来测试一下录音 skills,然后。我们今天有5个待办事项,今天晚上9点前需要完成智能会议助手的测试,然后明天上午需要完成智能信息收集的测试,明天下午需要整理所有的案例素材,后天上。" Xiaomi miclaw 生成的会议纪要包含概览(会议主题、参与者、主要结论、关键决策)和详细转录。还准确的添加了我提到的时间点的日历,这样其实也很方便。 本来这部分的理想情况是停止录音之后 Xiaomi miclaw 自动读取系统的录音软件转录的文本。但目前他还不行,希望后面小米补一下这部分。 以后每次会议,你只需要说"开始"和"结束",AI 自动完成录音、转录、整理、添加日程。你的时间完全解放出来,专注在真正重要的事情上。 这个任务手机变成了 AI 的眼睛和手。系统级整合让 AI 真正融入你的生活。 ====== 硬件价值的重新定义 以前硬件的价值是功能乘以易用性,温湿度计的价值就是能测温湿度、显示清晰。 现在硬件的价值是数据乘以 AI 的利用能力。同一个温湿度计,在 AI 手里价值放大了 10 倍:根据温湿度调整空调、判断是否开窗、预测你的作息习惯、甚至判断火灾风险。 设备越多,AI 越聪明;AI 越聪明,设备越有价值。这是正向循环,也是小米的护城河。 ------ 小米的角色转变 小米以前是卖手机、卖家电的公司。但现在这些硬件的角色变了。 手机变成了 AI 的"眼睛和手",能看、能听、能操作。 米家设备变成了 AI 的"神经末梢",分布在你家里的每个角落,感知环境、执行指令。 未来小米汽车会是 AI 进入物理世界的载体,能移动、能运输、能到达任何地方。 卖硬件的逻辑变成了搭建 AI 基础设施的逻辑。 ------ 小米在 AI 时代的机会 小米在转型。不只是补齐线上 AI 的短板(模型、算法、软件),更重要的是在线下 AI 建立优势。因为 AI 要接触物理世界,必须通过硬件。而硬件恰好是小米的强项。 OpenAI、Anthropic 做不了这件事,他们没有硬件。这可能是小米在 AI 时代最大的机会。 小米自研了 MiMo 模型,加上硬件和系统,小米现在掌握了完整的技术栈:模型、芯片、系统、硬件。 因为 AI 时代,如果你只有硬件,别人的 AI 会把你的硬件变成"被控制的对象",你失去了用户关系,变成了管道。 如果你只有模型,没有硬件,你的 AI 只能活在屏幕里,接触不到物理世界。 只有模型 + 硬件 + 系统都有,才能建立完整的护城河。 ====== 使用建议 Xiaomi miclaw 毕竟目前还在小规模封闭内测阶段,所以会有些产品不稳定,功能不完善的问题。 目前暂不推荐普通用户用主力机申请内测。这是探索性产品,适合尝鲜,不适合作为主力工具。 我测试过程中也遇到过一些小 Bug,不过反馈之后小米很快都解决了。如果你也在使用中遇到问题,可以点击 Xiaomi miclaw 设置里面的问题反馈,将问题描述清楚、添加图片/视频,再勾选日志提交就行。

00
羊羊的AI观察笔记
1月前
GPT-5、Claude 4 变得像水电一样普及,AI 应用的真正护城河在哪?

我最近写了一篇深度思考:
模型能力正在快速趋同,竞争已从谁更聪明上移到谁更稳定,最终将决战于谁定义秩序。

如果你也在做 AI 应用,或许值得花点时间看看,不要让调模型成为你唯一的竞争力。

感谢大家阅读点赞分享[太阳]

当AI模型变成水电煤,AI应用的护城河在哪?

10
羊羊的AI观察笔记
1月前
这个春节,你有没有也被人生进度条拷问过?
工作、收入、婚育。
当世界忙着校准你,你是否坚定自己真正想要的方向?
文末附赠超实用Prompt,手把手教你用AI做一次「春节自我对齐实验」,产出专属《个人价值说明书》+新年验证实验。
如果你也厌倦了活在别人的坐标系里,
不妨点进来,和自己来一场迟到已久的约会。

#AI不止是工具 #春节后重启自己 #和自己站在一边

新年伊始,和AI聊聊,照见真实的自己

00
羊羊的AI观察笔记
2月前
还记得大学的时候看的奇葩说里的一个辩题
如果有一项技术能够让全世界人类实现知识的一秒共享,你怎么看?
我想今天AI的出现,正在让我们无限逼近于这样的现实。
也许,人类终将回归两件事:定义文明的方向,并为每一个决策背后的代价担责。这或许才是认知工程化的终极意义:
把人类从重复判断中解放出来
重新聚焦于那些真正属于人的使命:提问、选择、承担、创造。

Skill与Workflow另一面:认知工程化

00
羊羊的AI观察笔记
2月前
用好一个,远比一直尝试新的要好的多
但这种FOMO情绪总是会催促着人不断的尝试
生怕被落下些什么
但其实,跳出来看
会发现这两年的变化并没有想象中那么大
基本原理没变,核心逻辑没变
无非是营销多了很多渠道
搅动了更多的情绪

葬愛咸鱼: 什么时候家人们才能明白,自己的时间精力也很珍贵,不需要尝试营销号吹捧的乱七八糟产品。 claude code是一个真东西,用明白这个就很好了,那些乱七八糟产品的价值主要是给营销号提供素材,制造焦虑。

00
羊羊的AI观察笔记
2月前
Skill的出现,让大模型快速获得了大量的高质量、真实落地的有效数据。
这无疑极大的加速了AI的发展。
以前需要花大价钱购买的优质数据,现在就这么轻松采集到了。
因此,发展Skill,对于基座大模型而言,不仅仅是让用户更好地使用模型的产品工程方案,更是发展基座大模型数据飞轮的战略决策。
这一轮,字节走在了最前列。
而这个先发优势和飞轮的转动,将会进一步提升模型的壁垒。
01
羊羊的AI观察笔记
3月前
上篇是理论,下篇是血泪实战
一个真实产品案例的架构复盘与推演
把踩过的坑变成路标
想和你一起思考:如何与概率性的智能共处。

Agent、Workflow、RAG 还是 Skill?万字拆解谁才是AI落地的终极解药(下)

00
羊羊的AI观察笔记
3月前
所谓的AI 落地,本质上是一场架构认知的迭代。

我们终于不再逼迫模型做全能的神,而是让它回归心脏的位置,通过精密的系统分层,把不确定性的AI关进确定性的系统笼子里。AI行业正在从单体智能走向系统智能。

我尝试解构了一套包含 Model、MCP、RAG、Skill、Workflow 的精密生理系统。这不仅是技术复盘,更是一次关于如何让 AI 好用的深度思考。

周末愉快,分享给同路人👇

Agent、Workflow、RAG 还是 Skill?万字拆解谁才是AI落地的终极解药(上)

02
羊羊的AI观察笔记
1年前
或许,真正意义上的Agent产品开始出现了,实际结果是不是像case中的表现那么惊艳,还有待测验,但这个努力的方向足够让人惊喜,

现有的以人工搭建的workflow去做执行的Multi-Agent,究竟还可以存在多久取决于两点:

1、通用Agent对“通用”的执行程度,即,是否可以顺利解决大部分用户90%以上的问题,尤其是在相对模糊的指令的情况下;

2、通用Agent的任务执行稳定度,即面向同一个任务,是否可以相对稳定的交付结果;
这两点如果可以达成,那么以Coze为首的相关产品,大概都需要考虑下一步的产品方向。初步看,进程可能没有那么快,毕竟这还是一个「处处有壁」的互联网。

一个理想的Agent包含的内容本身就应包括:
1)任务理解
2)任务拆解
3)任务执行
4)结构化输出
5)反馈意见收集及优化

这次的发布,包括之前DeepSeek的惊艳亮相,除了技术效果本身,产品交互是非常重要的一环。

如何能够把「厉害的技术」,以大部分人一看就懂的方式,可视化展现出来是非常讲究设计师对于技术和场景的理解。

以这个发布为例,核心亮点在于:
1、任务拆解和执行节奏的可视化展示:用户可对任务本身执行的复杂程度心中有数,若离预期有偏差,也可及早干预,降低长时等待后拿到非预期结果的痛苦(这个交互非Manus原创)

2、任务执行过程的可视化展示:每一个任务的具体执行过程,通过右侧的「虚拟机」进行展示,下方包含整体任务执行的进度条。
AI也好、Agent也好,对于用户而言都是黑盒,失控与不确定性是最难忍受的部分,而这两个设计极大优化了这种体验。
大部分用户其实并不会关注虚拟机里具体的执行步骤,甚至不太理解到底做了哪些事情,但一直在快速刷新的页面,足以让用户感受到“真厉害”,也让用户愿意耐心等待(这个交互DeepSeek也有用到,即把思考过程展示出来)
20
羊羊的AI观察笔记
1年前
再大的浪也有退去的时刻。但每一次的AI浪潮袭来,退去时,都会留下一些TPMF的产品。

这轮的场景范围更大,给人的预期很高,一段时间里感觉所有人都被卷入了一种FOMO情绪里。

但,至少目前为止,技术的发展速度低于预期,一些先于技术实现构想的产品方案无法完全落地,效果大打折扣。

所以,这带来的思考是,当新技术出现时,如何保持同频前进,既能充分借助新技术挖掘新场景,或更新已有场景的旧解决方案,又不会过于冒进。

大模型“六小虎”的2024:大厂强势,蹊径难寻

00