读微软研究院那篇GPT4能力的综述有感,从一个外行麻瓜的角度,总结了一下目前看到AI具备的能力变化,一些我接下来期待看到的新能力,以及如何测试这些新能力是否存在的一些潜在方法…
- 产生“爱“(我们如何定义爱?反正这往往是科幻电影里面人类面对AI或外星人时的大招!)
- 能够思考“思考”本身,产生对究极问题的哲学思考能力。(`可能的测试标准:提出新的合理的哲学理论`)
- 产生目的感、好奇心等人类的心智特性。(`可能的测试或观察标准:AI长期表达出方向性明确的主动行为,如进行人类没有要求的学习,使用工具去完成人类本身没有要求的任务。`)
- 独立产生道德、善恶等价值观判断(不同于Alignment中被人类赋予的价值观,而是AI通过自己使用工具对世界进行学习探索总结后形成新的价值观。`可能的测试标准:AI对人类赋予的价值观提出有理有据的质疑或否定,并且能够经受质疑去坚持。`)
- 发现人类尚不具备的原创知识(`可能的测试标准:通过数理推理发现新的定理,或是通过处理实验数据总结出新的规律,并且通过使用外部工具做实验证实。后者目前已经有类似穷举爆破的工具。`)
- 具备形式逻辑的推理能力(ChatGPT通过调用Wolfram 插件可以部分具备,但基于连接主义的大模型本身需要具备符号主义的形式逻辑能力应该还需要比较底层的突破?`可能的测试标准:AI能够完美进行复杂形式逻辑推理。`)
- 产生原创的文学、图画,音乐等艺术风格(不只是模仿/缝合人类的作品,也不是随机出现的单件作品,而是某种全新的特定的可辨识的可重复产生的风格。`可能的测试标准:AI匿名发专辑/画展/小说获得人类社会高度评价,自成一派`)
- 具备”共情““陪伴”等社交能力(AI已经表现出初步的共情能力,目标是能够自由和人类交朋友。`可能的测试标准:和人进行在一个在线社交网络上长时间隐藏自己是AI的事实。可以认为是图灵测试的进阶版本`)
- 自主解决相对复杂的问题(GPT4已经体现出来这种能力的潜力。`可能的测试标准:AI自行使用工具观察,分享,试探,最后获得一个网站的admin权限`)
✅通过经典图灵测试(能够和人类保持长时间的对话而不暴露自己是AI,可以认为已经接近通过)
✅能够产生人类难辨真假并感到优美的艺术创作(Midjourney/Stable Diffusion已经做到)
✅能够自我反思与提高(已经有self-critic和self-improve的框架,并且Alpaca已经开始使用ChatGPT生成的数据进行再训练)
✅能够使用互联网等工具学习新知识(ChatGPT 的plugin已经可以做到)
✅编写可运行的程序(GPT4已经做到)
✅产生初步的推理思考能力(大模型开始具备的Chain of Thought)
✅在人类标准智力测试中击败人类(GPT4已经做到)
✅在棋类游戏中击败人类(DeepBlue,AlphaGo已经做到)