做数据分析,什么大模型比较合适?
这个数据分析场景下的大模型能力评测框架告诉你,快速测评结论:
GPT-4 综合成绩最强,国产大模型表现已经基本不弱于 GPT-3.5
不同大模型在“数据计算”方面的差异较大,且参数越高,表现越好
多数大模型在“数据洞察”方面的表现接近,一些低参数大模型的表现依然强劲,这意味着可以通过“大数据+大模型”结合来实现低成本的 AI 数据分析场景
在本评测工作,包含以下大模型测评
Azure OpenAI GPT-4
通义千问 Qwen-14B
文心一言 Ernie-Bot-turbo
MiniMax
Azure OpenAI GPT-3.5-Turbo
智谱 AI ChatGLM-Pro 和 ChatGLM-Std
百川智能 Baichuan2-53B 和 Baichuan2-13B
开源 Falcon-40B 和 LLaMA2-13B
阅读原文:
mp.weixin.qq.com