7*24 快讯

国内量化私募首次向国际顶会投递大模型研究论文,提出全新大模型后训练方法

近日,量化私募念空科技向AI领域的国际顶会NIPS(Neural Information Processing Systems,神经信息处理系统大会)投递了与上海交大计算机学院合作的大模型研究论文,并于5月20日发表。这是中国量化私募首次在AI基础研究领域挑战全球顶级学术舞台。念空科技提交的论文提出了一种全新的大模型后训练方法。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

念空科技所递交的论文的突破性成果在于,从人类的学习方法的经验得到启发,如果高频的在少量刷题和小测试经验总结之间切换,可能更有利于学习成绩(推理能力)的提高,最终实验发现,在三个不同的公开数据集上,念空科技提出的新的训练框架明显优于单独的sft、单独的rl以及简单混合sft和rl,通俗的说,该研究成果可以帮助大模型在同等训练量下变得更聪明。(澎湃新闻)

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。