OpenAI推出SimpleQA：专治大模型“胡说八道”

人工智能（AI）大模型经常“一本正经地胡说八道”，这个问题也让OpenAI感到头疼。10月30日，该公司祭出新武器—— SimpleQA，并已正式开源，这是一个全新的事实性基准测试，专门用来检测大模型回答事实性问题的准确性。OpenAI的研究科学Jason Wei表示，由于此前一直缺乏一个好的事实性基准测试，所以他们团队决定自己动手，创建一个简单、可靠、易用的评估工具，供所有AI研究人员使用。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。