当地时间1 1 月 30 日,OpenAI 发布了全新的聊天机器人模型 ChatGPT,引发热议。

图片来自ChatGPT

OpenAI 使用 RLHF 技术对 ChatGPT 进行了训练,加入了更多人工监督微调。相比 GPT-3,ChatGPT 的主要提升点在于记忆能力,可实现连续对话,极大地提升了对话交互模式下的用户体验。ChatGPT 的多元全面的能力使其作为一个通用AI 助手参与交互,其在辅助编程领域表现卓越。目前ChatGPT 免费开放,海量用户反馈加速模型迭代。

ChatGPT 是 OpenAI 训练的对话式大规模语言模型,是 InstructGPT 的兄弟模型,二者同属 GPT-3.5 系列的主力模型。ChatGPT 目前处于测试阶段,ChatGPT 新加入的训练方式被称为「从人类反馈中强化学习」(ReinforcementLearning from Human Feedback,RLHF)。这一训练方法增加了人类对模型输出结果的演示,并且对结果进行了排序。拥有OpenAI 账户的用户可以免费使用。模型采用对话格式,可以跟进回答问题、承认错误、挑战不正确的前提并拒绝不正当的请求,且支持中文。模型一经推出,就引起较高关注度和讨论度。

OpenAI 首席执行官 Sam Altman 昨日在推特上发文表示,于上周三推出的 OpenAI 训练的大型语言模型 ChatGPT 截至当日已突破 100 万用户。Sam Altman 还表示正在寻求降低 Twitter 运营成本。随后,Twitter 的新 CEO 马斯克询问,每次使用 ChatGPT 聊天的平均费用是多少?Sam Altman 回复说,每次对话的平均费用可能只有几美分,他们正在寻找更精确的测量方法并压缩费用。

另外推特用户 Chief Disruptor 提问,使用 ChatGPT 是否永久免费?Sam Altman 回答说:「我们将不得不在某个时间点,以某种方式将其商业化,因为运算成本令人瞠目结舌。」