即刻App年轻人的同好社区
下载
App内打开
MrCoffeeTalker
4天前
最近做的一个测试,似乎戳破了 AI 多模态一部分泡沫

AI 训练涉及到的对互联网文字信息的有损压缩,当前无法高效的跨功能模块传递非文字信息,促成了戳破泡沫的可能性。

前者让 AI 缺失了互联网历史中不够高频出现的非文字信息(换句话说,只有文字记忆而没有同等水平的视觉记忆、听觉记忆这些),后者让 AI 即便被赋予了联网搜索、推理能力,也难以解决以非文字信息为主的问题。

一个例子,识别不是人尽皆知的作品中的角色,在 2025 年的当下,哪怕是用 2023 年完结的作品问 GPT-4o 模型驱动的 ChatGPT 也认不出角色是谁、来自什么作品。
101

来自圈子

圈子图片

AI探索站

88486人已经加入