一张图读懂 2023/05/30 08:27

OpenAI 大神Andrej Karpathy 揭秘大模型原理和训练全过程

OpenAI的创始人之一，大神Andrej Karpathy刚在微软Build 2023开发者大会上做了专题演讲：State of GPT（GPT的现状）。

他详细介绍了如何从GPT基础模型一直训练出ChatGPT这样的助手模型（assistant model）。这或许是OpenAI官方第一次详细阐述其大模型内部原理和RLHF训练细节。（图片来自“Web3天空之城”）

其中，Karpathy讲述了AI助手的四个训练阶段：预训练（pre-training）、监督微调（supervised fine tuning）、奖励建模（reward modeling）和强化学习（reinforcement learning）。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。