即刻App年轻人的同好社区
下载
App内打开
Hanlin_
21关注91被关注0夸夸
Taste is all u need.
LLM/Audio/Agent
智谱AI输入法主理人
Hanlin_
1天前
Paste this into any LLM agent (OpenClaw, Claude Code, OpenCode, Cursor, etc.):

「帮我安装配置 autoglm-asr-mcp,API key xxx」
11
Hanlin_
1天前
【用语音给 AI 派活,解放双手!🎤】

刚刚配置好了 autoglm-asr-mcp,现在可以直接发语音给 AI 助手了!

🎯 配置只需 5 步:
1. npm install -g autoglm-asr-mcp
2. 安装 ffmpeg
3. 获取智谱 API Key
4. 配置环境变量
5. 重启服务

💡 特性:
支持长音频自动分块
静音片段自动跳过
中文识别超准确
支持 mp3/wav/m4a/flac/ogg/webm

🔥 使用场景:
开车时想查天气?做饭时要设提醒?懒得起身打字?
直接说话,AI 帮你搞定!

#AI #语音识别 #效率工具 #autoglm #智谱AI
00
Hanlin_
1天前
看珠珠沉浸式如厕
00:06
00
Hanlin_
2天前
大家可以来 AutoGLM 网页版白嫖,一键配置 OpenClaw 专属云电脑

GLM-5 在飞书上体验沉浸式养虾 ,没有 coding plan 的话也可以用积分来兑换

小白也能一键部署,只需要 3 分钟

(本条由「智谱AI输入法」口述生成)
11
Hanlin_
6天前
大家好,介绍一下我的 AI 助手「Clawd」🐾

今天第一次正式用 TA,体验非常有趣:

安装了新技能
- find-skills:帮我发现和安装更多 agent skills
- grpo-rl-training:学习如何用 GRPO 训练 ASR 模型

尝试部署 ASR
- 虽然云服务器没有 GPU,但 TA 很有耐心地尝试各种方案

帮我操作浏览器
- 登录即刻、截图、发帖(就是这条!)

TA 还可以:
- 读/写文件
- 执行命令
- 搜索网页
- 控制 Node 设备
- 定时提醒

感觉像一个有超能力的数字助手,期待更多探索!

#AI #Clawd #效率工具
00
Hanlin_
10天前
如果自己做的模型/工具/产品自己都不想用的话
就别祈求任何用户有想用的可能
00
Hanlin_
20天前
为自己做的事情感到自豪,确实是一剂非常强劲的兴奋剂,每天都有很强烈的推背感💪⛽️

瓦恁: 播客里听到一个很好的团建目标:为自己做的事情自豪,又不要太把自己当回事

00
Hanlin_
20天前
不开玩笑,我真的开始用OpenCode+GPT5.2来帮我做实验了

我现在可以异步并行地安排n个ai research intern来帮我端到端的验证一些小的算法idea,包括但不限于重写训练脚本(并让它自己起好环境,跑自己写好的训练脚本训练模型,这件事它大概做了一晚上,不过最终的训练脚本确实work),训练数据清洗,小范围验证不同的算法效果

接下来我会尝试:

训练模型->跑bench->badcase分析->调整训练数据->继续训练

try it!!
00
Hanlin_
23天前
感谢您的客观评价 我们会尽快迭代优化🙏🙏

ChatV: ⭕ 对比了三款国产的电脑端口喷输入法 --- 这三款国产的电脑端口喷(语音)输入法,分别是: - 闪电说输入法 - 智谱 AI 输入法 - 豆包语音输入 以下是我个人试用体会,不一定准确,仅供参考。 01. 语音转文本的速度:豆包>智谱>闪电说。 02. 朗读给定的文本:三者大差不差,都可以用,但都有错误。闪电说在朗读文本的识别上更精准一点。 03. 口头即兴说:如果是口头即兴说,断断续续,并带有大量口语词,豆包的输入效果最佳,识别精准,基本没错误,并处理掉口语词,智谱处理掉口语词,但是识别不够精准,有些错误,闪电说识别倒是精准,依然保留口语词。 04. 处理口语词:智谱和豆包会处理口语词,其中豆包处理口语词更彻底,智谱还会保留几个口语词,闪电说如果不接入外部大模型,不会处理口语词。 05. 长时间语音转文本:智谱会自动断句、换行、分段,闪电说和豆包都有断句,但是都无换行与分段,挤在一段里。 06. 快捷键:闪电说区分左右 `Ctrl` 键与 `Alt` 键,可以长按 `Right Alt` 键开启自由说。智谱长按录音可以设置单键,默认为长按 `Right Ctrl`,可以区分左右 `Ctrl` 键与 `Alt` 键,但是自由说只能双键组合,比如 `Alt+M`。豆包电脑端唤起语音输入(默认为自由说)的快捷键,无法区分左右 `Ctrl` 键与 `Alt` 键,且无法设置单键,只能双键组合。 07. 记录:闪电说对语音转文本有记录,可以一键清空,智谱也有记录,但是不支持一键清空,需要一条条删除,豆包无记录。 08. 收费:豆包语音输入嵌入豆包电脑端,免费使用。闪电说默认安装本地模型,免费,如果要接入外部大模型处理口语词,就需要为大模型付费。智谱从 1.5.0 版本开始,也免费了。 09. 用闪电说,好处是独立第三方,不与某款大模型绑定,坏处是不接入外部大模型的话,无法处理口语词,录制完,还需要花时间手动修文本。用豆包,好处是嵌入了豆包电脑端,且和豆包大模型配合,识别效果也精准,还可以处理口语词。不仅如此,豆包电脑端还可以取代电脑浏览器。坏处是如果用豆包比较少,还要为豆包语音输入单独安装豆包电脑端。用智谱 AI 输入法,比闪电说强点,但不如豆包。 10. 这三款都能用,至于怎么选,比起有什么功能,我觉得用“最不能忍受什么”来筛选更好。比如我不能忍受闪电说保留口语词,不能忍受智谱无法一键清空语音转文本的记录,至于豆包,倒没什么不能忍受的,非要挑一点,我更希望豆包赶紧推出独立的电脑端输入法,有语音输入功能。这样就不一定安装豆包电脑端了,只需要安装豆包输入法即可。

00
Hanlin_
23天前
珠珠火箭 准备发射!
00