OpenAI宣讲第二天:推出强化微调研究项目,能够使用多个高质量任务定制模型 12月6日,OpenAI连续12个工作日的宣讲进入第二天,今天介绍的是强化微调研究项目(Reinforcement Fine-Tuning Research Program)。据介绍,该项目旨在使开发人员和机器学习工程师能够创建经过微调的专家模型。新的模型自定义技术使开发人员能够使用数十到数千个高质量任务定制模型,并根据提供的参考答案对模型的响应进行分级。