AI技术让文字,图片,音频,视频等不同模态的内容可以相互转换,让内容学习和传播有了质的改变。
最近谷歌NotebookLM做了一个功能,根据文本,生成双人播客。很有意思,对话也非常之流畅,很像真人。因为我自己在做ReadLecture,本质是把视频或者音频转成图文,再总结,提高视频学习效率和传播,和这个功能正好是反过来的。
对于内容输入,每个人的习惯不一样,有的人喜欢看文字,阅读效率高,而且方便检索和管理。有的人喜欢听,在通勤路上听听播客就很顺畅。有的人喜欢看视频,觉得直观的动画能透彻的讲清楚问题。有的人就喜欢一张漂亮的分享卡片图,能很轻量高效的传播。
如何把同一个内容用不同模态表现出来,让它们更好得适配到不同的人和不同的场景,怎么精准让这些内容和人群匹配起来,这个是目前做AI应用的人应该仔细去考虑的。