资料来源清单
当前用于整理 Content Show AI 知识目录、核心词条和名词库的来源线索,按主题追踪公开核心词条的主要依据。
资料来源清单
本页记录 Content Show 当前公开内容使用和后续核查优先参考的资料来源。原则很简单:公开词条要能回到可信来源,不把二手截图或营销话术当成事实本身。
来源使用原则
| 来源类型 | 使用方式 |
|---|---|
| 原始论文、官方文档、标准机构 | 优先用于定义、技术机制、风险框架和产品事实 |
| 大学课程、教材、研究机构解释 | 用于补充概念背景和学习路径 |
| 公司博客、产品文档 | 只用于对应公司产品、API、工程实践,避免泛化成行业定论 |
| 用户提供截图、知识库或笔记 | 可作为选题和结构线索,不作为唯一事实依据 |
核心来源索引
下面先按主题整理常用来源。它们不是“装饰性参考文献”,而是写作时判断定义、边界和风险的依据。
已发布核心词条来源覆盖
截至 2026-05-02,公开核心词条均已在页面 frontmatter 和内部来源笔记中保留至少 2 个可信来源。下面这张表用于快速检查“这个词条主要靠什么来源站住脚”。
| 主题组 | 已发布词条 | 主要来源线索 |
|---|---|---|
| AI 总论与能力层级 | AI、AGI、ASI | OECD / NIST 用于定义与风险框架;Levels of AGI、OpenAI Charter、DeepMind Frontier Safety Framework 用于 AGI/ASI 的层级和治理边界 |
| 机器学习基础 | Machine Learning、Deep Learning、Neural Network、Supervised Learning、Unsupervised Learning、Reinforcement Learning、Training Data、Validation Data、Generalization ability、Overfitting、Underfitting、Regularization | Tom Mitchell、Stanford CS229、Deep Learning Book、LeCun/Bengio/Hinton、Sutton & Barto、scikit-learn、Google ML Crash Course 用于解释“从数据中学习”、三种学习方式、数据划分、泛化和质量控制 |
| 模型结构与语言模型 | Transformer、LLM、Inference、Token | Attention Is All You Need、Stanford CS224N / CS324、OpenAI tiktoken、Hugging Face TGI、NVIDIA Triton 用于解释注意力、语言模型、推理调用和分词单位 |
| 提示、检索与适配 | Prompt Engineering、Embedding、RAG、Vector Database、Fine-Tuning | OpenAI / Anthropic 提示工程文档、OpenAI Embeddings、Mikolov word vectors、Lewis RAG、FAISS、Qdrant vector search overview、Hugging Face PEFT 用于区分提示、向量检索、检索增强和微调 |
| 生成式 AI 与多模态生成 | Generative AI、Diffusion Models | NIST GenAI Profile、IBM generative AI、DDPM / Improved DDPM 用于解释生成式系统与扩散生成机制 |
| 治理、可靠性与代理 | Alignment、Bias、Hallucination、Agent | AI Alignment Survey、NIST AI RMF / GenAI Profile、NIST SP 1270、ISO/IEC TR 24027、Hallucination Survey、Anthropic agents、MCP specification 用于说明风险、权限和证据边界 |
| 基础设施与模型组织 | Foundation Model、MoE | Foundation Models report、Stanford HAI、Switch Transformers、Outrageously Large Neural Networks 用于解释可复用底座模型和稀疏专家路由 |
编辑边界备忘
- 定义类内容优先回到教材、课程、论文或标准机构,不用厂商宣传语定调。
- 产品类内容只说明对应产品或文档承诺的能力,不外推成整个行业事实。
- 治理和风险类内容要标明日期和框架来源;不要把“研究争议”写成已经解决的问题。
- 相近词条要互相区分:例如 Prompt Engineering、RAG、Fine-Tuning 解决的问题不同;Foundation Model、LLM、Generative AI 也不是同义词。
维护要求
每新增或重写一篇公开核心词条,需要同时确认:
- MDX frontmatter 中有
sources和lastReviewed。 AI Knowledge/glossary-core-sources.md中有对应来源笔记和编辑边界。- 如果使用图片或图示,必须有
imageCredit;原创图示写Content Show diagram。 - 涉及产品、模型版本、API 行为、治理框架时,记录审核日期,避免把旧事实写成永久事实。