知乎上已经开始有人提问这代ai技术是否开始幻灭了,我也看到越来越多人开始寻找一些新突破口。这个时候希望重新总结下这代技术我认为的SoLoMo可能是什么。
整体来说,个人觉得大模型最开始的大家印象深刻的AGI能力特征给了大家一些误导,原因是这一代的技术离达到这几个共识目标还有比较大的差距:
1. Multi-agent智能体可以解决很多的实际问题,但是由于当代模型推理速度过慢+多步幻觉叠加之后极大的影响了效果,实际上很可能还需要几年以上的技术准备和产品打磨;
2. Copilot看上去很有道理,但是实际上的大幅度生产力提效(>50%)极大程度依赖单场景现有的数据丰富度,最后发现还是编码的数据最多;
3. LUI拟人的语音交互、对话交互看上去可以革新交互,但是事实上为他们准备的终端场景(眼镜、车驾驶舱)当前看来也还没有完全准备好。
然而,这一代模型真正**已经超过人类智能**的部分能力,又在之前的一段时间整体没有得到足够多认可和发掘,至少我认为还不够:
1. Curation:大量非结构化信息输入,少量输出的交互式多模态信息探索,结合具体场景下的信息洞察。
2. Remix:多来源、远距离信息之间的组合,寻找底层广泛联系,LLM可以找到原子弹和堆肥,孙悟空和指环王的相关性。
3. Simulation:低成本通用化的世界模拟,可以使用大模型多模态去更低成本的近似模拟原本需要定制构造3D复杂场景的推演。
再给上一两年时间,等到**生成推理的单位成本不高于当前网络流量费用**的时候,我们来看看这代模型真正基于以上几点带来的变革有多大。