有天清晨的个人主页 - 即刻App

即刻App年轻人的同好社区

下载

有天清晨

42关注143被关注0夸夸

人如其名。

有天清晨

1天前

歸藏: Claude Chrome 插件现在向所有的 Cluade 付费用户开放了侧边栏常驻、支持多标签与现有登录书签协作，帮你操作浏览器中的网页执行任务而且支持 Claude Code 调用，在浏览器内直接运行与测试代码、读取控制台日志与客户端错误。这里必须要有 Claude 付费，不能用 API 了

0 00

有天清晨

1月前

歸藏: 昨晚 Kimi K2 的训练团队在 Reddit LocalLLaMA 频道做了一次 AMA 看了一下海外用户对于 K2-Thinking 的评价和国内在我评论区的评价还是挺不一样的。海外用户对价格相对没那么敏感，当然也提到了按调用次数而不是按 Token 这样有些问题，总体来说还是跟关注技术和质量，当然也跟 LocalLLaMA 这个频道的属性有关系。他们昨晚也在 AMA 里面回答了很多问题，我整理了一些有信息量的： ---------------------------- KDA 会用在下一代旗舰模型 Kimi 吗？它的优势是什么？ KDA 混合结构（KDA hybrids with NoPE MLA）比传统的 MLA + RoPE 表现更好。它在预训练和 RL 阶段都更快、更经济、更高效。可以更快预训练、更快上线，也能服务更多用户。可能会用在 K3 的训练里面。 K2 会有视觉语言（VL）版本吗？有的，正在做。 K2 明显不像其他模型那样讨好用户（不拍马屁），是刻意设计的吗？这是后训练的结果吗？ K2 的非迎合式人格是通过精心数据挑选设计出来的。预训练和后训练都对这种风格有贡献。预训练编码了相关的先验，而后训练则为其增添了一些风味。当前 Kimi for Coding 的计费方式按 API 请求数计算，极不透明，一次 prompt 可能多次请求，是否能改成按 token 或 prompt？当前按请求数计费是因为：对用户可见；更符合他们的成本结构。但确实理解用户困惑，会考虑改进。请问你认为 fp4 相比 int4 真的是一个很重要的改进吗？还是说 int4 已经足够好的编码了？选择 int4 是为了对非 Blackwell GPU 更友好，同时利用现有的 int4 推理 marlin 内核。 K2 Thinking 模型比 GPT-5 Thinking 更强，但输出速度慢很多，是否刻意让它“思考更久”？承认 K2-Thinking 在推理阶段更细致、更耗时，但优化正在进行。专注于纯文本代理是为了在短期内以牺牲换取达到 SOTA 吗，还是一项长期押注？要把视觉语言模型（VL）的数据和训练做对需要时间，因此我们选择先发布文本模型。那个 460 万美元的 K2 Thinking 训练费用是真的吗？不是官方数字。很难量化训练成本，因为很大一部分属于研究和实验。在制作 K2 thinking 的过程中，你们遇到的最大挑战是什么？谢谢！一个挑战是支持交错的“思考 - 工具 - 思考 - 工具”模式。这在 LLMs 中是相对新颖的行为，实现起来需要大量工作才能正确运行。 K2 thinking 在几个月来经过许多评测后，已经能抓到 Sonnet 4.5 和 Opus 4.1 漏掉的问题。说实话，感觉 K2 thinking 只差一点系统提示（system prompt）调整就能达到同等水平。这全都要归功于你们的新架构吗？还是你们的训练数据质量也有提升？我认为拥有合适的评估方法和数据对性能至关重要。架构和优化器提高了样本效率。你们训练堆栈的硬件是什么样的？想了解你们的基础设施如何与那些美国大型公司使用的堆栈相比？使用带有 Infiniband 的 H800 GPU；它们不如美国的高端 GPU，而且数量也不占优势，但我们把每一张卡都充分利用起来

0 00

有天清晨

2月前

歸藏: 藏师傅复刻了爆火的社交媒体卡片提示词，大幅增加表现力与中文适应性！还增加了这种霓虹灯管手写体名字，通过用即梦&豆包修复了中文显示问题主题色和提示词会根据不同平台适配，目前支持即刻、推特、微博、小红书。提示词：在后面图片里适配模型：豆包或者即梦，GPT 也可以，中文可能会有问题使用方法：选择合适的平台提示词，修改引号中的名字，上传社交媒体主页截图，内容较多的话简易遮挡一些无关的，比如 IP 属地等，可以防止文字崩坏

0 00

有天清晨

2月前

Niko_: 一直好奇——那些月入过万的 AI 工具站，到底做对了什么？于是我用一个小工具 Easy Scraper（网页数据抓取插件）可视化选择、批量抓取、几分钟搞定。我直接把 Toolify 收入榜前 500 个站点全抓下来做了个分析，结果非常有意思赚钱的 AI 项目有一个共同点：他们不卷功能，只卷转化。他们知道用户点进来想要什么，用户路径做的极好。下一步我打算复盘其中 10 个最赚钱的网站，看看他们的产品结构、定价和引流路径。

0 00

有天清晨

2月前

陈沫_Ted: YouTube 上的头部播客已瞄准了中文听众。利用 Test / Compare 的能力把封图都汉化了。

0 00

有天清晨

2月前

厉害

你们的潇潇姐: 构建一个社群最好的办法是用熟人包围新朋友，尽快变熟。

0 00

有天清晨

2月前

任何一种不能生财的食伤都是偏印导致的。所以就很好区分了。

0 00

有天清晨

4月前

还是得写日记和拍照，但是不回看。
禁止自己写完日记回看。每十年回看一次比较好。

1 00

有天清晨

6月前

歸藏: 给 Claude Code 用的开源 GUI 真的越来越多 CCSeva 一款 macOS 菜单栏应用，可以实时追踪 Claude Code 的使用情况。每 30 秒自动更新，支持自动识别不同订阅计划，提供 7 天用量分析、模型分布、趋势图表、费用估算和智能通知等功能详细信息：https://github.com/Iamshankhadeep/ccseva

0 00

有天清晨

8月前

感觉无论住在哪里，都会有一个时间节点对家周边的咖啡店很厌倦不想去，哪怕外人看来环境很好

0 00