资料来源清单

当前用于整理 Content Show AI 知识目录、核心词条和名词库的来源线索,按主题追踪公开核心词条的主要依据。

资料来源清单

本页记录 Content Show 当前公开内容使用和后续核查优先参考的资料来源。原则很简单:公开词条要能回到可信来源,不把二手截图或营销话术当成事实本身。

来源使用原则

来源类型使用方式
原始论文、官方文档、标准机构优先用于定义、技术机制、风险框架和产品事实
大学课程、教材、研究机构解释用于补充概念背景和学习路径
公司博客、产品文档只用于对应公司产品、API、工程实践,避免泛化成行业定论
用户提供截图、知识库或笔记可作为选题和结构线索,不作为唯一事实依据

核心来源索引

下面先按主题整理常用来源。它们不是“装饰性参考文献”,而是写作时判断定义、边界和风险的依据。

主题代表来源当前用途
AI 总论与风险框架OECD AI PrinciplesNIST AI RMFAI、治理、安全、风险边界
AGI / ASILevels of AGIOpenAI CharterDeepMind Frontier Safety FrameworkAGI、ASI、前沿风险讨论
机器学习Tom Mitchell, Machine LearningStanford CS229scikit-learn User GuideGoogle ML Crash CourseMachine Learning、学习方式、训练/验证数据、泛化与质量控制
深度学习与神经网络Deep Learning BookLeCun/Bengio/Hinton, Deep LearningDeep Learning、Neural Network、训练机制
Transformer / LLM / 推理Attention Is All You NeedStanford CS324Hugging Face Text Generation InferenceNVIDIA Triton Inference ServerTransformer、LLM、Inference、Attention 相关解释与推理工程边界
Token / PromptingOpenAI tiktoken CookbookOpenAI Prompt EngineeringAnthropic Prompt EngineeringToken、Prompt Engineering、提示边界
Embedding / RAG / 向量检索OpenAI Vector EmbeddingsMikolov word vectorsLewis et al., RAGFAISS similarity searchEmbedding、RAG、Vector Database、语义检索
Fine-Tuning / PEFTHugging Face PEFTTransformers PEFTFine-Tuning、LoRA/PEFT 边界
生成式 AI / 扩散模型NIST GenAI ProfileDDPMImproved DDPMGenerative AI、Diffusion Models
对齐、偏差与幻觉AI Alignment SurveyNIST SP 1270 Bias in AIISO/IEC TR 24027Hallucination SurveyNIST GenAI ProfileAlignment、Bias、Hallucination、治理判断
基础模型与 MoEFoundation Models reportStanford HAI Foundation Model explainerSwitch TransformersFoundation Model、MoE、基础设施语境
信息架构原始线索WaytoAGI 公开知识库、用户提供的 WaytoAGI 飞书名词表截图学习路径、初始 99 个术语和栏目结构参考
站点实现Fumadocs 官方文档搜索、图谱、MDX 和静态站点实现参考

已发布核心词条来源覆盖

截至 2026-05-02,公开核心词条均已在页面 frontmatter 和内部来源笔记中保留至少 2 个可信来源。下面这张表用于快速检查“这个词条主要靠什么来源站住脚”。

主题组已发布词条主要来源线索
AI 总论与能力层级AI、AGI、ASIOECD / NIST 用于定义与风险框架;Levels of AGI、OpenAI Charter、DeepMind Frontier Safety Framework 用于 AGI/ASI 的层级和治理边界
机器学习基础Machine Learning、Deep Learning、Neural Network、Supervised Learning、Unsupervised Learning、Reinforcement Learning、Training Data、Validation Data、Generalization ability、Overfitting、Underfitting、RegularizationTom Mitchell、Stanford CS229、Deep Learning Book、LeCun/Bengio/Hinton、Sutton & Barto、scikit-learn、Google ML Crash Course 用于解释“从数据中学习”、三种学习方式、数据划分、泛化和质量控制
模型结构与语言模型Transformer、LLM、Inference、TokenAttention Is All You Need、Stanford CS224N / CS324、OpenAI tiktoken、Hugging Face TGI、NVIDIA Triton 用于解释注意力、语言模型、推理调用和分词单位
提示、检索与适配Prompt Engineering、Embedding、RAG、Vector Database、Fine-TuningOpenAI / Anthropic 提示工程文档、OpenAI Embeddings、Mikolov word vectors、Lewis RAG、FAISS、Qdrant vector search overview、Hugging Face PEFT 用于区分提示、向量检索、检索增强和微调
生成式 AI 与多模态生成Generative AI、Diffusion ModelsNIST GenAI Profile、IBM generative AI、DDPM / Improved DDPM 用于解释生成式系统与扩散生成机制
治理、可靠性与代理Alignment、Bias、Hallucination、AgentAI Alignment Survey、NIST AI RMF / GenAI Profile、NIST SP 1270、ISO/IEC TR 24027、Hallucination Survey、Anthropic agents、MCP specification 用于说明风险、权限和证据边界
基础设施与模型组织Foundation Model、MoEFoundation Models report、Stanford HAI、Switch Transformers、Outrageously Large Neural Networks 用于解释可复用底座模型和稀疏专家路由

编辑边界备忘

  • 定义类内容优先回到教材、课程、论文或标准机构,不用厂商宣传语定调。
  • 产品类内容只说明对应产品或文档承诺的能力,不外推成整个行业事实。
  • 治理和风险类内容要标明日期和框架来源;不要把“研究争议”写成已经解决的问题。
  • 相近词条要互相区分:例如 Prompt Engineering、RAG、Fine-Tuning 解决的问题不同;Foundation Model、LLM、Generative AI 也不是同义词。

维护要求

每新增或重写一篇公开核心词条,需要同时确认:

  • MDX frontmatter 中有 sourceslastReviewed
  • AI Knowledge/glossary-core-sources.md 中有对应来源笔记和编辑边界。
  • 如果使用图片或图示,必须有 imageCredit;原创图示写 Content Show diagram
  • 涉及产品、模型版本、API 行为、治理框架时,记录审核日期,避免把旧事实写成永久事实。