ChatGPT 简介

Alex Sun大约 1 分钟

ChatGPT 简介。

1. ChatGPT 发展历史

GPT-1 是由 OpenAI 于 2018 年推出的第一代 GPT 模型，使用了 12 层 Transformer 架构，共有 117M 参数。GPT-1 在多项自然语言处理任务上均取得了较好的效果，例如文本生成、机器翻译、问答等。^[1]^[2]

GPT-2 是在 GPT-1 的基础上进一步扩展和优化的模型，使用了更大的数据集和更多的参数。GPT-2 采用了 48 层 Transformer 架构，共有 1.5B 个参数。GPT-2 在多项自然语言处理任务上取得了 SOTA 的效果，例如文本生成、文本分类、语言推理等。GPT-2 还引起了广泛的社会讨论，因为它能够生成高度逼真的文本，包括假新闻和有害内容。

GPT-3 由 OpenAI 于 2020 年推出。GPT-3 使用了 1750B 个参数，比 GPT-2 大了一千倍以上。GPT-3 在多项自然语言处理任务上取得了 SOTA 的效果，并能够完成一些常识推理和常识问答等任务。与 GPT-2 相比，GPT-3 不仅参数更多，而且采用了更多的训练数据，以及更加复杂的预训练任务。

GPT-1/GPT-2/GPT-3 简介，知乎，https://zhuanlan.zhihu.com/p/473001104 ↩︎
The Journey of Open AI GPT models，medium.com，https://medium.com/walmartglobaltech/the-journey-of-open-ai-gpt-models-32d95b7b7fb2 ↩︎