LLM 是大语言模型，能在大量文本训练基础上理解、生成和转换自然语言。

LLM

LLM 是 Large Language Model，大语言模型。它把文本切成 Token，在上下文中计算关系，并生成后续内容。

LLM token flow

图片说明：原创流程图，简化展示输入文本、Token、模型权重和输出之间的关系。

一句话先记住

LLM 不是搜索引擎本身。它更像一个根据上下文生成语言的模型；如果要回答最新或专有资料，通常需要外接检索、工具或数据库。

先记住这 3 点

模型看到的不是完整汉字或英文单词，而是被切分后的文本片段。

提示词、资料、历史对话和工具返回都会影响输出。

语言流畅不等于事实正确，重要内容需要来源验证。

LLM 的基本能力来自大量文本训练。训练让模型学会语言结构、知识关联、常见推理形式和任务格式。使用时，模型根据当前上下文预测接下来更可能出现的 Token，连续生成就形成了回答。

这解释了两个现象：它很擅长写作、总结、改写、翻译和代码辅助；但它也可能在没有足够证据时编造细节。因为“语言上顺”不等于“事实被验证”。

先明确任务：写作、总结、分析、检索、代码，还是决策辅助。

再补足上下文：目标、资料、格式、限制、示例。

最后验证输出：事实、引用、计算、风险和适用范围。

LLM 是模型类别，重点是大规模语言建模能力。

Transformer 是影响现代 LLM 的重要架构，不等于所有 AI。

ChatGPT 是产品体验，背后可以接入不同模型、工具和系统策略。