一张图读懂 2023/05/30 08:27

OpenAI 大神Andrej Karpathy 揭秘大模型原理和训练全过程

OpenAI的创始人之一,大神Andrej Karpathy刚在微软Build 2023开发者大会上做了专题演讲:State of GPT(GPT的现状)。

他详细介绍了如何从GPT基础模型一直训练出ChatGPT这样的助手模型(assistant model)。这或许是OpenAI官方第一次详细阐述其大模型内部原理和RLHF训练细节。(图片来自“Web3天空之城”)

其中,Karpathy讲述了AI助手的四个训练阶段:预训练(pre-training)、监督微调(supervised fine tuning)、奖励建模(reward modeling)和强化学习(reinforcement learning)。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。