即刻App年轻人的同好社区
下载
App内打开
YiqinFu
4年前
一个特别好用的播客应用 Snipd,也是我看过 C NLP 应用最好的产品,用到了声音到文字(分说话人)、话题提取、文本总结、文本分段等近几年成熟的技术。举几个我的使用场景:

1)文字和章节:应用会给每一集节目自动生成文字版并分章节——我们可以跳到想听的部分,回头找某一段的时候也可以快速定位。

这个功能目前不支持中文,英文的章节分段我觉得做的已经很好——无法达到人工水平,但作为辅助已经能大幅提高使用效率。本身结构性强的播客单集、嘉宾口音是英美等主流地区口音的,分段的时间点、章节的标题可能已经达到人工水平。

(有些大牌节目本身已有人工校对的文字版、章节分段,但绝大多数节目是没有的。速度和成本上,处理一集只需要调用一次 API,所以收听人数多的单集一般你打开就能看到现成的文字版和章节分段。如果你是第一个听的,需要等十分钟。我不知道这一套服务的成本是多少,是不是大家普遍用 Amazon Transcribe?)

2)个人笔记:在听到想要记下的部分时,你只需要按 snipd 这个键就可以。应用会自动提取整块主题,你只要在文字版页面手动确认开始和结束点就可以。我的使用体验非常好,基本上每次自动提取的前后文就是我要的那段。

给笔记起名字也是自动生成(你可以在几个推荐的里面选择)。我基本没有自己手写过。

应用支持导出到新一代的笔记应用,例如 Readwise、Obsidian、Logseq。存储格式是纯文本。

3)分享:你可以分享文本,也可以分享截取片段自动生成的 Snipd 网页(图九)。网页版有文字、自动总结、声音片段。应用里他们也有分享、发现片段的页面,不知道之后是会加入社交功能还是被大厂收购,加入大厂的社交图。



用到这个产品我超级兴奋!感觉 NLP 的应用现在已经成熟并且 commoditized,除了辅助写码、辅助翻译、辅助搜索,更能辅助在大片文本、音频、视频中定位信息(通过提取话题、分段、总结)。Snipd 这样结合多种 NLP 应用的产品会加快人类获取信息的速度,现在很多读者已经是先听作者采访再决定是否买书了。

最后还想感叹一下开放生态及某种程度上“无产权保护”对创新的积极作用。最适合用话题提取、文本总结的我觉得是 Google Books、Amazon、论文发行方。如果他们能分析各领域的所有作品,再把机器生成的结果给研究人员手动处理,那我们真的可能“消化”历史上所有的知识。(不是人类不读书,而是机器辅助人类快速找到他们要读的某一章节。现在人类遇到的困难是过去积累的知识一代比一代多,新人已经学不过来,跨细分学科的专家也很少。)但 Google、Amazon 因为版权保护,不能用新技术处理这些书籍(哪怕是几百年前的很多作品)。创业公司更没有门路。

反过来,播客一直保持 RSS 年代去中心化的样子,而且因为音频媒介对人的冲击不如视频,所以音频商业化一直不怎么成功。相比书籍和论文它又不够“永恒”、“正式”,所以版权保护也不太严格。这才有了“瑞士几人小公司用新技术重新组织信息”的可能。

从一个 RSS feed 下载音频,根据自动提取的文字自动生成段落,再把这一段文字以纯文本格式保存在本地,这是我想象中的“去中心化”,也是我想象中 21 世纪获取知识的方式。

希望我们能赶紧找到合适的法律框架,允许处理历史上所有的书籍和论文。
1534