即刻App年轻人的同好社区
下载
App内打开
夜礼服嘎面
146关注170被关注3夸夸
AKA afon
夜礼服嘎面
10天前
今天去试驾了SU7 Ultra,感觉试驾了个寂寞。

店里的人太忙了,根本顾不上你,时间太短。给你介绍也是心不在焉,一直在回消息。
试驾车还限速,加速到80km/h以上,动力就明显被限制了。
性能车限制性能,那还试驾Ultra干啥,试驾普通版就可以了。
70
夜礼服嘎面
13天前
最近用 Cline 通过自建的 LLM 路由调用 Gemini API(试了 gemini-2.5-pro-exp,用的 OpenAI 兼容模式),结果发现 Cline 统计的 Token 使用量高得离谱,比我后台通过接口返回的 usage 字段实际算出来的数值高出好几倍。

好奇去看了下 Cline 的代码,发现它处理 stream 响应时,会把收到的每一个 chunk 中包含的 usage 都累加起来。而 Gemini OpenAI 兼容接口,恰好就是 每个 chunk 都带有 usage 信息。

看着错误的统计和费用估算不舒服,修改了响应输出逻辑,让它只在最后一个 chunk 输出 usage 信息。

Cline 的统计和实际数据对上之后,强迫症表示很满意。
00
夜礼服嘎面
15天前
感觉OpenRouter的tps计算方式针对gemini-2.5-pro-exp不太对,15,594 tokens/s也太夸张了,时间应该算上“思考过程”,因为completion_tokens的值包含了reasoning_tokens(虽然未输出)。
算上TTFT的时间,算出来的值还算符合直觉:144 tokens/s。
00
夜礼服嘎面
18天前
感觉自己做了一个简易版的OpenRouter。
00
夜礼服嘎面
18天前
腾讯元宝Mac客户端好久没打开,更新之后支持划词翻译了居然。
00
夜礼服嘎面
22天前
是谁教高德这么开的?
00
夜礼服嘎面
24天前
小闲即欢,小清即静。
00
夜礼服嘎面
25天前
最近阿里百炼的DeepSeek R1怎么提速了🚀,差不多有40 tokens/s以上了。超过火山方舟了都。
00
夜礼服嘎面
26天前
ChatGPT免费作图一天三张😂一下子就没了
00
夜礼服嘎面
1月前
如果一个AI/LLM相关产品,它的页面呈现形式就是聊天窗口式的,但它不是流式输出的,要等全部完成之后,一次性返回,这能接受吗?
00