日常听播客听的多,但音频转文字类应用用的少,随手测了下All Video X-ray(即友
@河粉hofun 搓的一个GPTs) 、Podwise(目前最强播客内容AI总结产品)、BibiGPT(好像也是一个即友的产品)三个音频转文字的工具。从不专业的角度简单试了下表现。主要测试的是“乱翻书”最近一期关于飞书的访谈类节目及道长21年关于互联网黑话的一期节目。
1、All Video X-ray,转录速度很快,虽然对话信息中提示说总结需要0.5-3分钟,实测一分钟左右就可以生成。输出内容是按照“背景”、“嘉宾/主持”、“关键词”、“内容详情”、“我的问题”的结构来输出。不过总结内容没有时间线对照,但在互联网黑话这期内容总结的时候,加了时间线标注,不过时间点跟实际内容出现的位置会稍微有些偏差。另外34分钟之后的节目内容,总结说的是对互联网黑话的“个人思考”,而常听“八分”的人可能知道,道长很多时候在节目后半段是对观众留言的回复的"水"内容,这期节目实际也是,34分钟后内容实际跟互联网黑话无关。由于是在ChatGPT内进行转录总结,能够便捷地对转录内容进行多轮次对话。问及道长节目中提到的“方便”一次的由来,也能很好地复述,不过在飞书节目的开始,潘乱提到了“飞飞看图”这款字节在头条之前的主产品,纠正了几次后勉强能够回复出。
2、Podwise,作为一款成熟产品,表现依旧是中规中矩,summary、mindmap、keywords、highlights、transcript、shownotes,每一部分依旧很详细,但就是不能交互进行对话,另外在keywords等卡片里中将“飞飞”转录成了“菲菲”,尽管“乱翻书”那期的shownotes里也很明显地提到了“飞飞”。
3、BibiGPT,总结不是特别稳定,两期节目尝试多次,只转录出了道长那期,总结的内容应该适合简单发发小红书。BibiGPT界面元素有点多,使用路径有些长。