LLM
LLM 是大语言模型,能在大量文本训练基础上理解、生成和转换自然语言。
LLM
LLM 是 Large Language Model,大语言模型。它把文本切成 Token,在上下文中计算关系,并生成后续内容。
图片说明:原创流程图,简化展示输入文本、Token、模型权重和输出之间的关系。
一句话先记住
LLM 不是搜索引擎本身。它更像一个根据上下文生成语言的模型;如果要回答最新或专有资料,通常需要外接检索、工具或数据库。
先记住这 3 点
它按 Token 工作
模型看到的不是完整汉字或英文单词,而是被切分后的文本片段。
它依赖上下文
提示词、资料、历史对话和工具返回都会影响输出。
它会生成看似可信的错误
语言流畅不等于事实正确,重要内容需要来源验证。
给普通人的解释
LLM 的基本能力来自大量文本训练。训练让模型学会语言结构、知识关联、常见推理形式和任务格式。使用时,模型根据当前上下文预测接下来更可能出现的 Token,连续生成就形成了回答。
这解释了两个现象:它很擅长写作、总结、改写、翻译和代码辅助;但它也可能在没有足够证据时编造细节。因为“语言上顺”不等于“事实被验证”。
使用 LLM 时的判断流程
先明确任务:写作、总结、分析、检索、代码,还是决策辅助。
再补足上下文:目标、资料、格式、限制、示例。
最后验证输出:事实、引用、计算、风险和适用范围。
和相近概念的区别
LLM 是模型类别,重点是大规模语言建模能力。
Transformer 是影响现代 LLM 的重要架构,不等于所有 AI。
ChatGPT 是产品体验,背后可以接入不同模型、工具和系统策略。