OpenAI推出SimpleQA:专治大模型“胡说八道” 人工智能(AI)大模型经常“一本正经地胡说八道”,这个问题也让OpenAI感到头疼。10月30日,该公司祭出新武器—— SimpleQA,并已正式开源,这是一个全新的事实性基准测试,专门用来检测大模型回答事实性问题的准确性。OpenAI的研究科学Jason Wei表示,由于此前一直缺乏一个好的事实性基准测试,所以他们团队决定自己动手,创建一个简单、可靠、易用的评估工具,供所有AI研究人员使用。