LLM 发展时间线图

一、LLM 的发展历程(按时代划分)

阶段 1:统计语言模型时代(1990s–2017)

这是 LLM 的“石器时代”,AI 不懂真正的语言,只能做数学统计。

代表模型

  1. n-gram 语言模型(Google、IBM 等)
  2. Word2Vec(2013,Google)
  3. GloVe(2014,Stanford)
  4. RNN / LSTM / GRU 语言模型(2014–2017)

特点

  • 靠概率计算词序列
  • 记忆短、不能长文本
  • 不理解上下文
  • 算不上“现代 LLM”

阶段 2:预训练 + 微调时代(2018 – 2020)

这是现代 LLM 的起点,标志性突破是Transformer 架构

关键论文

2017:Attention is All You Need(Google)
这是 LLM 的“总祖宗”。

代表模型(按时间)

1. ELMo(2018,AI2)

第一个双向语言表示模型。

2. BERT(2018,Google)

革命性突破,理解能力极强。

3. GPT-1(2018,OpenAI)

首次提出“生成式预训练 + 下游微调”路线。

4. GPT-2(2019,OpenAI)

第一次展示长文本生成能力,震惊世界。

5. T5(2019,Google)

将所有任务统一为“文本到文本”。

6. RoBERTa(2019,Meta)

优化后的更强 BERT。

特点

  • 需要针对每个任务做微调
  • 模型规模比以前大了 100 倍
  • LLM 时代开始露出雏形

阶段 3:大规模生成式 LLM(2020 – 2022)

真正意义上的 LLM 时代,从 GPT-3 开始。

代表模型

1. GPT-3(2020,OpenAI)

  • 175B 参数
  • 少样本学习(few-shot learning)出现
  • 第一款真正意义的大型语言模型

2. GPT-J / GPT-NeoX(EleutherAI)

  • 开源替代 GPT-3 的路线

3. PaLM(2022,Google)

  • 540B 参数
  • 多语言、多任务能力增强

4. BLOOM(2022,HuggingFace)

  • 大型开源 LLM

特点

  • 模型规模爆炸式增长
  • 不需要微调,也能完成任务
  • AI 开始具备“泛化能力”

阶段 4:对齐训练 + RLHF + ChatGPT 时代(2022 – 至今)

这是 LLM 的“普及时代”。

代表模型

1. ChatGPT(GPT-3.5 + RLHF)(2022,OpenAI)

  • 人类反馈强化学习(RLHF)
  • AI 第一次可以自然对话
  • 全球普及

2. GPT-4(2023,OpenAI)

  • 逻辑、推理、安全性全面升级
  • 成为最强商用模型之一

3. Claude(Anthropic)

  • 更安全的对齐技术(Constitutional AI)

4. Google Gemini(2023–2024,Google)

  • 多模态能力极强
  • 强调跨文本、图像、音频的统一模型

5. Llama 系列(Meta,2023–2024)

  • 开源革命
  • 让整个行业进入大模型民主化时代

6. DeepSeek(2024–2025,中国)

  • 性价比和性能突破
  • 强调高效训练与推理技术

特点

  • AI 第一次变成人类可使用的工具
  • 对齐技术的成熟(AI 更听话、更安全)
  • 模型多模态化

阶段 5:多模态统一 + Agent + 推理增强(2024 – 未来)

这是现在正在发生的阶段。

代表方向与模型

  1. GPT-5(OpenAI,预计 2025)
  2. Gemini Ultra 系列(Google)
  3. Claude 3 家族(Anthropic)
  4. 多 Agent 系统(AutoGPT、DevIn 等)
  5. R1 / DeepSeek R1 系列(中国)
  6. 大规模推理模型(Reasoning LLM)

特点

  • AI 具备自主推理能力
  • 多模态统一(文字、图像、视频、音频全部打通)
  • Agent 能自动执行任务
  • 更接近“通用人工智能 AGI”

二、总结:每个时代的代表性 AI

按年份总结最重要的“时代代表”:

年代代表模型
2013–2017Word2Vec、LSTM、Seq2Seq
2018BERT、ELMo
2019GPT-2、T5、RoBERTa
2020GPT-3
2022ChatGPT
2023GPT-4、Llama、Claude、Gemini
2024–2025DeepSeek、R1 推理模型、多模态统一模型