用Cursor+Claude Code搞定!自制AI语音笔记,比MacWhisper+Gemini客户端还顺手~
之前一直靠「MacWhisper+手机Gemini客户端」组合处理录音:先用前者转文字,再复制到后者润色提要点,虽说能解决问题,但来回切换APP总觉得麻烦,尤其是赶时间的时候。
这两天突然想:不如自己搭一个?没想到真成了!用AI编程工具折腾出一套专属的语音笔记工具,从转写到润色一气呵成,顺滑到想夸爆AI编程的强大~
原理其实和之前的组合类似,但更一体化:本地用Whisper模型转写录音(离线就能跑,还支持逐词回放核对),连上网直接调用Gemini的API做润色和重点提取,不用再复制粘贴切换APP了。
开发时主要靠Cursor和Claude Code写代码:一开始用Cursor扩展Whisper的基础功能,结果网络太坑总崩溃,后来换Claude Code(用了大佬的镜像)才顺利跑通,总共花了190多刀(约100块),性价比绝了。
现在用自己开发的工具处理录音,比之前的APP组合快了至少一半,还能自定义模型配置、保存记录,连润色规则都能按自己的习惯调。不得不说,AI编程是真的香——以前想都不敢想自己能搭这种工具,现在跟着提示一步步来,居然真成了~
你们平时有没有靠多个APP凑合用的场景?说不定也能自己搭个工具解决呢~