即刻App
年轻人的同好社区
下载
App内打开
有天清晨
42
关注
143
被关注
0
夸夸
人如其名。
有天清晨
1天前
歸藏: Claude Chrome 插件现在向所有的 Cluade 付费用户开放了 侧边栏常驻、支持多标签与现有登录书签协作,帮你操作浏览器中的网页执行任务 而且支持 Claude Code 调用,在浏览器内直接运行与测试代码、读取控制台日志与客户端错误。 这里必须要有 Claude 付费,不能用 API 了
0
0
0
有天清晨
1月前
歸藏: 昨晚 Kimi K2 的训练团队在 Reddit LocalLLaMA 频道做了一次 AMA 看了一下海外用户对于 K2-Thinking 的评价和国内在我评论区的评价还是挺不一样的。 海外用户对价格相对没那么敏感,当然也提到了按调用次数而不是按 Token 这样有些问题,总体来说还是跟关注技术和质量,当然也跟 LocalLLaMA 这个频道的属性有关系。 他们昨晚也在 AMA 里面回答了很多问题,我整理了一些有信息量的: ---------------------------- KDA 会用在下一代旗舰模型 Kimi 吗?它的优势是什么? KDA 混合结构(KDA hybrids with NoPE MLA)比传统的 MLA + RoPE 表现更好。 它在预训练和 RL 阶段都更快、更经济、更高效。 可以更快预训练、更快上线,也能服务更多用户。 可能会用在 K3 的训练里面。 K2 会有视觉语言(VL)版本吗? 有的,正在做。 K2 明显不像其他模型那样讨好用户(不拍马屁),是刻意设计的吗?这是后训练的结果吗? K2 的非迎合式人格 是通过精心数据挑选设计出来的。 预训练和后训练都对这种风格有贡献。预训练编码了相关的先验,而后训练则为其增添了一些风味。 当前 Kimi for Coding 的计费方式按 API 请求数计算,极不透明,一次 prompt 可能多次请求,是否能改成按 token 或 prompt? 当前按请求数计费是因为:对用户可见;更符合他们的成本结构。但确实理解用户困惑,会考虑改进。 请问你认为 fp4 相比 int4 真的是一个很重要的改进吗?还是说 int4 已经足够好的编码了? 选择 int4 是为了对非 Blackwell GPU 更友好,同时利用现有的 int4 推理 marlin 内核。 K2 Thinking 模型比 GPT-5 Thinking 更强,但输出速度慢很多,是否刻意让它“思考更久”? 承认 K2-Thinking 在推理阶段更细致、更耗时,但优化正在进行。 专注于纯文本代理是为了在短期内以牺牲换取达到 SOTA 吗,还是一项长期押注? 要把视觉语言模型(VL)的数据和训练做对需要时间,因此我们选择先发布文本模型。 那个 460 万美元的 K2 Thinking 训练费用是真的吗? 不是官方数字。很难量化训练成本,因为很大一部分属于研究和实验。 在制作 K2 thinking 的过程中,你们遇到的最大挑战是什么?谢谢! 一个挑战是支持交错的“思考 - 工具 - 思考 - 工具”模式。这在 LLMs 中是相对新颖的行为,实现起来需要大量工作才能正确运行。 K2 thinking 在几个月来经过许多评测后,已经能抓到 Sonnet 4.5 和 Opus 4.1 漏掉的问题。说实话,感觉 K2 thinking 只差一点系统提示(system prompt)调整就能达到同等水平。这全都要归功于你们的新架构吗?还是你们的训练数据质量也有提升? 我认为拥有合适的评估方法和数据对性能至关重要。架构和优化器提高了样本效率。 你们训练堆栈的硬件是什么样的?想了解你们的基础设施如何与那些美国大型公司使用的堆栈相比? 使用带有 Infiniband 的 H800 GPU;它们不如美国的高端 GPU,而且数量也不占优势,但我们把每一张卡都充分利用起来
0
0
0
有天清晨
2月前
歸藏: 藏师傅复刻了爆火的社交媒体卡片提示词,大幅增加表现力与中文适应性! 还增加了这种霓虹灯管手写体名字,通过用即梦&豆包修复了中文显示问题 主题色和提示词会根据不同平台适配,目前支持即刻、推特、微博、小红书。 提示词:在后面图片里 适配模型:豆包或者即梦,GPT 也可以,中文可能会有问题 使用方法:选择合适的平台提示词,修改引号中的名字,上传社交媒体主页截图,内容较多的话简易遮挡一些无关的,比如 IP 属地等,可以防止文字崩坏
0
0
0
有天清晨
2月前
Niko_: 一直好奇——那些月入过万的 AI 工具站,到底做对了什么? 于是我用一个小工具 Easy Scraper(网页数据抓取插件) 可视化选择、批量抓取、几分钟搞定。 我直接把 Toolify 收入榜前 500 个站点 全抓下来做了个分析,结果非常有意思 赚钱的 AI 项目有一个共同点:他们不卷功能,只卷转化。 他们知道用户点进来想要什么,用户路径做的极好。 下一步我打算复盘其中 10 个最赚钱的网站,看看他们的产品结构、定价和引流路径。
0
0
0
有天清晨
2月前
陈沫_Ted: YouTube 上的头部播客已瞄准了中文听众。 利用 Test / Compare 的能力把封图都汉化了。
0
0
0
有天清晨
2月前
厉害
你们的潇潇姐: 构建一个社群最好的办法是用熟人包围新朋友,尽快变熟。
0
0
0
有天清晨
2月前
任何一种不能生财的食伤都是偏印导致的。所以就很好区分了。
0
0
0
有天清晨
4月前
还是得写日记和拍照,但是不回看。
禁止自己写完日记回看。每十年回看一次比较好。
1
0
0
有天清晨
6月前
歸藏: 给 Claude Code 用的开源 GUI 真的越来越多 CCSeva 一款 macOS 菜单栏应用,可以实时追踪 Claude Code 的使用情况。 每 30 秒自动更新,支持自动识别不同订阅计划,提供 7 天用量分析、模型分布、趋势图表、费用估算和智能通知等功能 详细信息:https://github.com/Iamshankhadeep/ccseva
0
0
0
有天清晨
8月前
感觉无论住在哪里,都会有一个时间节点对家周边的咖啡店很厌倦不想去,哪怕外人看来环境很好
0
0
0