ChatGPT 的数值计算能力在其发布之初,一直饱受用户诟病。虽然随着 GPT-4 的发布,计算能力明显上升,但偶尔还是会出现计算错误。
为了解决这个问题,GitHub 研究人员做了一个很有意思的研究。
虽然大语言模型的数值计算能力弱,但是它却很擅长写数值逻辑计算代码。
那么,能不能让 GPT-4 来编写计算代码,让 Python 对其进行评估,进而提升大语言模型的数值计算准确度?
简而言之,就是为 GPT-4 装备一个数字计算器,以增强它的能力。
在实验时,还能将计算代码、结果一并输出给用户,让他们可以基于这些数据进行检查、校对、保存。
通过多次对比记录,最终实验结果表明,在给 GPT-4 装备上计算器后,其计算结果的准确度明显上升了不少,不过对于日期计算的能力提升有限。
具体结果对比,可看我这篇帖子中的配图,其中红色部分为未装备计算器,绿色部分则是装备了计算器。
一些原本有着高达 50% 错误率的问题,直接下降到了 0%,着实恐怖。
该计算器代码已开源至 GitHub,技术团队对其进行了封装,在填入 API Key 之后,即可通过脚本运行使用。
GitHub:
github.com详细介绍:
githubnext.com这个项目对于一些基于 ChatGPT 搞数学研究,或者需要出具更为准确的产品分析、市场调研报告等场景将十分有用,建议大家关注一下。