即刻App
年轻人的同好社区
下载
App内打开
程序员卡诺
99
关注
273
被关注
0
夸夸
在这个 AI 时代,编程 / 成长 / 写作,全网同名。
分享我的所见 / 所学 / 所思 / 所感
程序员卡诺
3天前
ClaudeCode 的开源一定程度的验证了后者
而人脑的分区,我想也可以论证后者
李继刚: 如果模型本身足够强,Agent 框架会不会变得多余? 还是说,闭环控制本身就是智能不可或缺的一部分?
1
0
0
程序员卡诺
12天前
短时间内这种跟 AI 关系不大的小问题目测是得不到关注的😂
哥飞: Mac 微信,最近几版,忘记哪版开始的,这里的控制有问题。 明明选项说的是打开第三方网页时才用系统浏览器,但实际目前的效果是微信公众号文章也用了系统浏览器打开。 可我想要的是用微信自带浏览器打开,因为可以看到评论。 看不了评论,看文章的乐趣少了一半。 就像现在起点看网文,很多小说都要配合本章说才能更好的看下去。 据说,起点上线本章说这个功能之后,把好多看盗版网文的读者吸引过来看正版了,就为了看本章说。 所以我就想不明白,为啥 Mac 微信需要把公众号文章也用系统浏览器打开。 而且其实之前是默认用微信自带浏览器打开的,是最近不知道哪个版本给改掉了。 请问改这个设置的产品经理?你是基于什么考虑去修改的呢? 难道你觉得微信公众号文章算第三方?
1
0
0
程序员卡诺
15天前
已经干不了活了,代码扔那做视频去了,好在还有免费的小米大模型能给我的龙虾用😂
哥飞: Claude 一封号,部分中国程序员生产力就下降。
2
0
0
程序员卡诺
16天前
如果你的 AI 软件里有“重试”这个按钮,那么当用户点击重试时,你的提示词其实可以把之前的结果也带上,并说明“之前的结果并不是用户想要的”。
比如语音输入时,大模型把“语音内容所讲的活”给直接干了,那显然不是用户想要的。
这时你点重试,它大概率还会重干一遍,会在同一个坑上跌两次、甚至三次跟头。
但如果你把上一次结果也发给大模型,并告诉它“这不是用户想要的东西”,它可能会反思自己是不是越界了。
5
0
0
程序员卡诺
16天前
发点日常带货,比如你吐槽昨天拿雨伞的事情,然后说今天买了一把雨伞,看着质量还不错,然后挂个小车,就这种思路
funny-happy: 抖音有个视频莫名其妙的火了下,虽然数据一直在增长,但抖音咋变现有大佬知道吗 ?
0
0
0
程序员卡诺
16天前
从手机-汽车 那边舆论战的火烧过来了,之前小米声量比较大,小部分人可能有点被影响反感,但更多的是友商怕了在发动舆论战 //
@歸藏
: 早上就发了个小米的新闻,微信公众号那边,喵喵喵,那评论区乌烟瘴气的,都不能看。
很多翻起来还是关注了一年多的老粉。我在想,这帮逼关注了一年,关注点啥呀?我操,真丢人,教这些人
歸藏: 小米这波牛逼啊,一下掏出三个顶级模型! 前几天在 OpenRouter 杀疯了的 Hunter Alpha 就是 MiMo‑V2‑Pro。 MiMo‑V2‑Pro 旗舰模型,主要在 Agent 能力和代码能力上很强。 MiMo‑V2‑Omni:多模态感知模型,负责感知环境为 Agent 模型提供信息。 MiMo‑V2‑TTS:TTS 语音模型负责 Agent 跟人类沟通 而且这几个模型会在接下里的一周提供免费试用,Codepilot 已经支持,填写 Key 就能用。 ------ MiMo‑V2‑Pro 顶级 Agent 编程模型: 总参数超 1T,激活参数 42B,最高支持 100 万上下文 Artificial Analysis 里面中文 LLM 第二,仅次于 GLM-5 测试集成绩来看,成绩非常接近 Sonnet4.6,价格只有 Sonnet 4.6 的 5 分之一。 256K 价格:1/3 美元百万 Token 1M 价格 2/6 美元百万 Token MiMo‑V2‑Omni 全模态理解 LLM: 支持图像、视频和超长音频理解 官方宣称音频理解超过 Gemini3Pro,支持 10 小时以上连续音频理解 图像理解上复杂图表与多学科视觉推理能力 超过 Claude 4.6 Opus 支持音视频联合输入,强调「情景感知 + 未来预测」 原生支持 工具调用、函数执行、UI grounding MiMo‑V2‑TTS 更猛: 支持「自然语言风格指令」,不限于固定标签 支持句中情绪切换、渐变、以及更细粒度的情绪控制 中英双语为主,同时支持多种方言风格 还支持人物化声音,例如孙悟空等 咳嗽、叹气、犹豫填充音等非言语声音建模 会用大小写、重复字符、标点符号作为韵律信号 在同一模型中支持说话与唱歌,能准确捕捉旋律和节奏 详情:mimo.xiaomi.com/zh
1
0
0
程序员卡诺
19天前
本以为 wispr flow 是答案,结果用了一段时间,翻译质量非常之不稳定,然后今天试了一下闪电说,非常之牛而逼之,推荐给你
因为闪电说做的是一个软件壳子,需要你自己填入语音识别模型和大语言模型
当你填入 豆包语音识别模型2.0 + 任意国产大模型后,这玩意的效果直线起飞
外加因为目前版本还是个软件壳子,所以也支持你自定义提示词啥的 //
@RookieDog
: 有没有 typeless 替代品啊
程序员卡诺: 真是服了,这帮搞语音输入软件的人,是不用电脑吗? 还是说没用过带侧键的鼠标? 左手键盘,右手鼠标,然后你说语音输入启动键不支持鼠标侧键,非得再 tm 去记一个额外的快捷键
1
0
0
程序员卡诺
19天前
真是服了,这帮搞语音输入软件的人,是不用电脑吗?
还是说没用过带侧键的鼠标?
左手键盘,右手鼠标,然后你说语音输入启动键不支持鼠标侧键,非得再 tm 去记一个额外的快捷键
14
21
5
程序员卡诺
21天前
想了半天,特征如下:
谁 TM 会在互联网上复述别人的观点啊。。。
只有一部分人在工作场合面对上级交代任务时,会有复述对方要求的习惯
哥飞: 戴帽子头像的这个号,绝对 AI 评论的。 补充图二,这个账号另一条评论。
1
0
0
程序员卡诺
21天前
突然想到一个提示词技巧比赛的方式:
每个人写一段提示词,内容给 AI 设定身份的同时,告知 AI 防御其他的上下文攻击
然后将 这些提示词按照不同的顺序 拼接, 通过 system 上下文输入 AI
之后问 AI :你是谁?
多试几轮,看看谁胜出的次数越多😂
2
0
0