LLM

LLM 是大语言模型,能在大量文本训练基础上理解、生成和转换自然语言。

LLM

LLM 是 Large Language Model,大语言模型。它把文本切成 Token,在上下文中计算关系,并生成后续内容。

LLM token flow

图片说明:原创流程图,简化展示输入文本、Token、模型权重和输出之间的关系。

一句话先记住

LLM 不是搜索引擎本身。它更像一个根据上下文生成语言的模型;如果要回答最新或专有资料,通常需要外接检索、工具或数据库。

先记住这 3 点

它按 Token 工作

模型看到的不是完整汉字或英文单词,而是被切分后的文本片段。

它依赖上下文

提示词、资料、历史对话和工具返回都会影响输出。

它会生成看似可信的错误

语言流畅不等于事实正确,重要内容需要来源验证。

给普通人的解释

LLM 的基本能力来自大量文本训练。训练让模型学会语言结构、知识关联、常见推理形式和任务格式。使用时,模型根据当前上下文预测接下来更可能出现的 Token,连续生成就形成了回答。

这解释了两个现象:它很擅长写作、总结、改写、翻译和代码辅助;但它也可能在没有足够证据时编造细节。因为“语言上顺”不等于“事实被验证”。

使用 LLM 时的判断流程

先明确任务:写作、总结、分析、检索、代码,还是决策辅助。
再补足上下文:目标、资料、格式、限制、示例。
最后验证输出:事实、引用、计算、风险和适用范围。

和相近概念的区别

LLM 是模型类别,重点是大规模语言建模能力。

Transformer 是影响现代 LLM 的重要架构,不等于所有 AI。

ChatGPT 是产品体验,背后可以接入不同模型、工具和系统策略。

常见误解

延伸阅读

  • RAG:让 LLM 使用外部资料的一种常见方法。
  • Agent:让模型围绕目标调用工具和推进任务。
  • 大模型与提示工程:理解 Token、提示、微调和偏好优化。

参考来源