生成式 AI(Generative AI / Gen AI)

理解生成式 AI 是什么、它和传统 AI 有什么不同,以及它为什么不等于“会聊天的机器人”。

生成式 AI(Generative AI / Gen AI)

生成式 AI,是一类能够根据提示或上下文生成新内容的人工智能方法。它生成的内容可以是文本、图像、音频、视频,也可以是代码。

生成式 AI 常见输出模态示意图

[!info] 一句话先记住:生成式 AI 的重点不是“判断这是什么”,而是“产出一个原本不存在的新结果”。

先记住这 3 点

  • 生成式 AI 是一个大类,不只等于聊天机器人。
  • 它能生成新内容,但不保证内容真实、合规或可直接使用。
  • 大语言模型和扩散模型都属于生成式 AI 的重要路线。

给普通人的解释

过去很多 AI 更擅长“识别”和“判断”。

比如:

  • 判断一封邮件是不是垃圾邮件
  • 识别一张照片里是不是猫
  • 预测一个用户会不会点击广告

生成式 AI 处理的是另一类问题:

  • 写一段文字
  • 画一张图
  • 生成一段语音
  • 根据提示做一段视频
  • 帮你补代码、改文案、整理摘要

所以它的关键变化是:AI 不只是看和判,而是开始“产出”内容。

这也是为什么普通人会突然强烈感受到 AI 进入生活——因为它直接开始参与写、画、说、做。

它和传统 AI 有什么区别

最简单的区分方式是:

  • 传统判别型 AI:更擅长分类、识别、排序、预测
  • 生成式 AI:更擅长生成文本、图像、音频、视频、代码等结果

当然,现实系统经常会混合两种能力。但如果你只记一个判断标准:

它是在回答“这是什么”,还是在回答“给你生成一个新的东西”?

前者更偏判别,后者更偏生成。

它常见的两条主线

1. 大语言模型(LLM)

这一条主线主要处理文字,也会逐渐扩展到代码、工具调用和多模态输入。

典型能力包括:

  • 对话
  • 写作
  • 总结
  • 翻译
  • 代码生成

2. 扩散模型(Diffusion Models)

这一条主线在图像和视频生成里特别重要。

典型能力包括:

  • 文生图
  • 图生图
  • 图像编辑
  • 视频生成

所以当很多人说“生成式 AI”时,脑子里想到的其实是两种常见入口: ChatGPT 一类的文字系统,以及Midjourney、Stable Diffusion 一类的图像系统

它和 AIGC、LLM、扩散模型是什么关系

和 AIGC 的关系

AIGC 更像是中文互联网和产业语境里常见的叫法,强调“AI 生成内容”这件事。

大多数时候,AIGC 和生成式 AI 指向的是非常接近的范围,只是表达习惯不同。

和 LLM 的关系

LLM 是生成式 AI 里很重要的一支,但生成式 AI 不只包含 LLM

如果你把生成式 AI 只理解成聊天机器人,会漏掉图像、音频、视频和 3D 生成。

和扩散模型的关系

扩散模型也是生成式 AI 的重要路线,特别常见于图像和视频生成。

如果说 LLM 更像“会写、会说”的生成系统,扩散模型更像“会画、会补、会变”的生成系统。

为什么它这么火

因为它第一次大规模把 AI 的能力直接暴露给普通用户。

以前很多 AI 藏在后台:推荐系统、风控、排序、广告出价,你感受到的是结果,但不一定看见 AI 本身。

生成式 AI 不一样。它直接出现在你眼前,跟你对话、给你出图、帮你改 PPT、写邮件、补代码。

它的爆发,本质上是AI 从后台判断系统,变成了前台内容协作工具

常见误解

误解 1:生成式 AI 就是 ChatGPT

不对。ChatGPT 只是生成式 AI 的一个代表产品入口。

误解 2:会生成就代表懂事实

不对。生成式 AI 很会“生成像真的东西”,但像真不等于为真。

误解 3:生成式 AI 只会替代创作者

也不对。很多场景里它更像放大器、草稿机、协作工具,而不是完全替代人。

为什么普通读者需要知道它

因为今天你接触到的很多 AI 产品,不再只是“帮你算”,而是“帮你产出”。

如果你不理解生成式 AI,很容易把下面这些东西混在一起:

  • 聊天机器人
  • AI 搜索
  • 文生图
  • 自动摘要
  • 代码补全
  • 视频生成

而一旦把“生成式 AI”这层搞明白,你就更容易继续理解:

  • 为什么提示词重要
  • 为什么事实核验重要
  • 为什么版权和数据来源会变成现实问题
  • 为什么多模态会成为下一步重点

延伸阅读

参考来源

最后审核时间:2026-04-24