程序员卡诺的个人主页

即刻App年轻人的同好社区

下载

App内打开

程序员卡诺

99关注273被关注0夸夸

在这个 AI 时代，编程 / 成长 / 写作，全网同名。
分享我的所见 / 所学 / 所思 / 所感

程序员卡诺

3天前

ClaudeCode 的开源一定程度的验证了后者

而人脑的分区，我想也可以论证后者

李继刚: 如果模型本身足够强，Agent 框架会不会变得多余？还是说，闭环控制本身就是智能不可或缺的一部分？

1 00

程序员卡诺

12天前

短时间内这种跟 AI 关系不大的小问题目测是得不到关注的😂

哥飞: Mac 微信，最近几版，忘记哪版开始的，这里的控制有问题。明明选项说的是打开第三方网页时才用系统浏览器，但实际目前的效果是微信公众号文章也用了系统浏览器打开。可我想要的是用微信自带浏览器打开，因为可以看到评论。看不了评论，看文章的乐趣少了一半。就像现在起点看网文，很多小说都要配合本章说才能更好的看下去。据说，起点上线本章说这个功能之后，把好多看盗版网文的读者吸引过来看正版了，就为了看本章说。所以我就想不明白，为啥 Mac 微信需要把公众号文章也用系统浏览器打开。而且其实之前是默认用微信自带浏览器打开的，是最近不知道哪个版本给改掉了。请问改这个设置的产品经理？你是基于什么考虑去修改的呢？难道你觉得微信公众号文章算第三方？

1 00

程序员卡诺

15天前

已经干不了活了，代码扔那做视频去了，好在还有免费的小米大模型能给我的龙虾用😂

哥飞: Claude 一封号，部分中国程序员生产力就下降。

2 00

程序员卡诺

16天前

如果你的 AI 软件里有“重试”这个按钮，那么当用户点击重试时，你的提示词其实可以把之前的结果也带上，并说明“之前的结果并不是用户想要的”。

比如语音输入时，大模型把“语音内容所讲的活”给直接干了，那显然不是用户想要的。

这时你点重试，它大概率还会重干一遍，会在同一个坑上跌两次、甚至三次跟头。

但如果你把上一次结果也发给大模型，并告诉它“这不是用户想要的东西”，它可能会反思自己是不是越界了。

5 00

程序员卡诺

16天前

发点日常带货，比如你吐槽昨天拿雨伞的事情，然后说今天买了一把雨伞，看着质量还不错，然后挂个小车，就这种思路

funny-happy: 抖音有个视频莫名其妙的火了下，虽然数据一直在增长，但抖音咋变现有大佬知道吗？

0 00

程序员卡诺

16天前

从手机-汽车那边舆论战的火烧过来了，之前小米声量比较大，小部分人可能有点被影响反感，但更多的是友商怕了在发动舆论战 //@歸藏: 早上就发了个小米的新闻，微信公众号那边，喵喵喵，那评论区乌烟瘴气的，都不能看。

很多翻起来还是关注了一年多的老粉。我在想，这帮逼关注了一年，关注点啥呀？我操，真丢人，教这些人

歸藏: 小米这波牛逼啊，一下掏出三个顶级模型！前几天在 OpenRouter 杀疯了的 Hunter Alpha 就是 MiMo‑V2‑Pro。 MiMo‑V2‑Pro 旗舰模型，主要在 Agent 能力和代码能力上很强。 MiMo‑V2‑Omni：多模态感知模型，负责感知环境为 Agent 模型提供信息。 MiMo‑V2‑TTS：TTS 语音模型负责 Agent 跟人类沟通而且这几个模型会在接下里的一周提供免费试用，Codepilot 已经支持，填写 Key 就能用。 ------ MiMo‑V2‑Pro 顶级 Agent 编程模型：总参数超 1T，激活参数 42B，最高支持 100 万上下文 Artificial Analysis 里面中文 LLM 第二，仅次于 GLM-5 测试集成绩来看，成绩非常接近 Sonnet4.6，价格只有 Sonnet 4.6 的 5 分之一。 256K 价格：1/3 美元百万 Token 1M 价格 2/6 美元百万 Token MiMo‑V2‑Omni 全模态理解 LLM：支持图像、视频和超长音频理解官方宣称音频理解超过 Gemini3Pro，支持 10 小时以上连续音频理解图像理解上复杂图表与多学科视觉推理能力超过 Claude 4.6 Opus 支持音视频联合输入，强调「情景感知 + 未来预测」原生支持工具调用、函数执行、UI grounding MiMo‑V2‑TTS 更猛：支持「自然语言风格指令」，不限于固定标签支持句中情绪切换、渐变、以及更细粒度的情绪控制中英双语为主，同时支持多种方言风格还支持人物化声音，例如孙悟空等咳嗽、叹气、犹豫填充音等非言语声音建模会用大小写、重复字符、标点符号作为韵律信号在同一模型中支持说话与唱歌，能准确捕捉旋律和节奏详情：mimo.xiaomi.com/zh

1 00

程序员卡诺

19天前

本以为 wispr flow 是答案，结果用了一段时间，翻译质量非常之不稳定，然后今天试了一下闪电说，非常之牛而逼之，推荐给你

因为闪电说做的是一个软件壳子，需要你自己填入语音识别模型和大语言模型

当你填入豆包语音识别模型2.0 + 任意国产大模型后，这玩意的效果直线起飞

外加因为目前版本还是个软件壳子，所以也支持你自定义提示词啥的 //@RookieDog: 有没有 typeless 替代品啊

程序员卡诺: 真是服了，这帮搞语音输入软件的人，是不用电脑吗？还是说没用过带侧键的鼠标？左手键盘，右手鼠标，然后你说语音输入启动键不支持鼠标侧键，非得再 tm 去记一个额外的快捷键

1 00

程序员卡诺

19天前

真是服了，这帮搞语音输入软件的人，是不用电脑吗？

还是说没用过带侧键的鼠标？

左手键盘，右手鼠标，然后你说语音输入启动键不支持鼠标侧键，非得再 tm 去记一个额外的快捷键

14 215

程序员卡诺

21天前

想了半天，特征如下：

谁 TM 会在互联网上复述别人的观点啊。。。

只有一部分人在工作场合面对上级交代任务时，会有复述对方要求的习惯

哥飞: 戴帽子头像的这个号，绝对 AI 评论的。补充图二，这个账号另一条评论。

1 00

程序员卡诺

21天前

突然想到一个提示词技巧比赛的方式：

每个人写一段提示词，内容给 AI 设定身份的同时，告知 AI 防御其他的上下文攻击

然后将这些提示词按照不同的顺序拼接，通过 system 上下文输入 AI

之后问 AI ：你是谁？

多试几轮，看看谁胜出的次数越多😂

2 00

李继刚: 如果模型本身足够强，Agent 框架会不会变得多余？ 还是说，闭环控制本身就是智能不可或缺的一部分？

哥飞: Claude 一封号，部分中国程序员生产力就下降。

funny-happy: 抖音有个视频莫名其妙的火了下，虽然数据一直在增长，但抖音咋变现有大佬知道吗 ？

程序员卡诺: 真是服了，这帮搞语音输入软件的人，是不用电脑吗？ 还是说没用过带侧键的鼠标？ 左手键盘，右手鼠标，然后你说语音输入启动键不支持鼠标侧键，非得再 tm 去记一个额外的快捷键

哥飞: 戴帽子头像的这个号，绝对 AI 评论的。 补充图二，这个账号另一条评论。

李继刚: 如果模型本身足够强，Agent 框架会不会变得多余？还是说，闭环控制本身就是智能不可或缺的一部分？

funny-happy: 抖音有个视频莫名其妙的火了下，虽然数据一直在增长，但抖音咋变现有大佬知道吗？

程序员卡诺: 真是服了，这帮搞语音输入软件的人，是不用电脑吗？还是说没用过带侧键的鼠标？左手键盘，右手鼠标，然后你说语音输入启动键不支持鼠标侧键，非得再 tm 去记一个额外的快捷键

哥飞: 戴帽子头像的这个号，绝对 AI 评论的。补充图二，这个账号另一条评论。