一文读懂 AI 基础概念：从人工智能到大模型

dundun-wang2026/3/31大约 6 分钟

从科幻到现实，人工智能正在重塑我们的世界。本文用最通俗的语言，带你理清 AI、机器学习、深度学习、大模型之间的关系，掌握训练、推理、微调等核心概念。

一、人工智能的"套娃"关系

很多人对人工智能（AI）、机器学习（ML）、深度学习（DL）、大模型（LLM）这几个词傻傻分不清。其实，它们是一种层层递进的"套娃"关系：

人工智能 ⊃ 机器学习 ⊃ 深度学习 ⊃ 大模型

人工智能（Artificial Intelligence, AI）

定义：让机器表现出类似人类智能的技术总称。

这是最宽泛的概念，任何让机器"聪明"起来的技术都算。从 1950 年代简单的棋类程序，到今天的 ChatGPT，都是人工智能的范畴。

生活例子：

飞书的智能会议纪要
钉钉的智能客服机器人
支付宝的风险检测系统

机器学习（Machine Learning, ML）

定义：让机器从数据中自动学习规律的技术，是 AI 的一个子集。

传统程序需要人写好规则（如果 A 则 B），机器学习则是给机器大量数据，让它自己找规律。

生活例子：

淘宝的"猜你喜欢"推荐
微信朋友圈的广告投放
银行的信用卡欺诈检测

深度学习（Deep Learning, DL）

定义：使用多层神经网络进行学习的机器学习方法，是 ML 的一个子集。

灵感来自人脑神经元的工作方式。深度学习之所以"深"，是因为它有多个处理层，能自动提取数据的特征，无需人工设计。

生活例子：

微信的语音转文字
抖音的内容审核
小爱同学的语音助手

大模型（Large Language Model, LLM）

定义：参数量巨大、训练数据海量、能力强大的深度学习模型，是 DL 的最新发展。

大模型的"大"体现在三个方面：参数多（千亿级）、数据多（TB 级文本）、算力多（万张 GPU）。代表产品有 GPT、DeepSeek、智谱 GLM、Kimi 等。

生活例子：

DeepSeek 帮你写代码
智谱清言回答问题
Kimi 总结长文档

四者的区别对比

概念	范围	关键特点	典型应用
人工智能	最广	智能行为的总称	智能客服、游戏 AI
机器学习	AI 子集	从数据中学习规律	推荐系统、预测模型
深度学习	ML 子集	多层神经网络	图像识别、语音识别
大模型	DL 前沿	参数巨大、能力通用	ChatGPT、DeepSeek

二、模型的生命周期：训练与推理

理解了大模型的定位，我们来看看模型是如何"诞生"和"工作"的。

训练（Training）

定义：让模型从数据中学习的过程。

就像学生上课学习一样，训练就是让模型"看"大量数据，调整内部参数，学会某种能力。

类比理解：

训练 = 学生上课学习
数据 = 教材
参数调整 = 记笔记、理解知识

训练类型：

预训练（Pre-training）：在超大规模数据上进行初始训练，学习通用知识
微调（Fine-tuning）：在预训练基础上，用特定领域数据进一步训练

推理（Inference）

定义：用训练好的模型处理新数据、产生输出的过程。

就像学生考试一样，推理就是让模型"做题"，运用已学知识解决问题。

类比理解：

推理 = 学生参加考试
输入 = 考题
输出 = 答案

训练 vs 推理对比：

维度	训练	推理
目的	让模型学习知识	让模型应用知识
计算量	极大	较小
耗时	数周到数月	毫秒到秒级
费用	非常昂贵	相对便宜
类比	上学读书	参加考试

三、学习方法：监督学习与强化学习

模型如何学习？主要有两种方式：

监督学习（Supervised Learning）

定义：使用带标签的数据进行学习，模型通过"标准答案"来调整自己。

工作原理：

给模型一个输入（如一张图片）
模型预测输出（如"这是猫"）
告诉模型正确答案（"对，就是猫"或"不对，这是狗"）
模型根据反馈调整参数

类比理解：就像老师带着答案批改作业，学生知道哪里对、哪里错，逐渐学会。

生活例子：

垃圾邮件分类（标注好哪些是垃圾邮件）
图像识别（标注好每张图是什么）
情感分析（标注好每句话是正面还是负面）

强化学习（Reinforcement Learning, RL）

定义：模型通过与环境互动，根据奖励反馈来学习最优策略。

工作原理：

模型做出一个动作
环境给出奖励或惩罚
模型调整策略以获得更多奖励

类比理解：就像训练小狗：做对了给零食，做错了不奖励，小狗慢慢学会正确行为。

生活例子：

游戏AI（如围棋 AI AlphaGo）
机器人行走训练
自动驾驶决策

监督学习 vs 强化学习对比

维度	监督学习	强化学习
数据	有标准答案	无标准答案，只有奖励信号
反馈	立即明确	延迟模糊
学习方式	对比答案调整	试错探索
适用场景	分类、预测	决策、控制

四、大模型特有概念：预训练与对齐

大模型有一些独特的训练阶段，理解它们对使用 AI 产品很重要。

预训练（Pre-training）

定义：在超大规模数据上进行初始训练，让模型学习通用的语言知识和世界知识。

特点：

数据量极大（万亿级 token）
无需人工标注，使用互联网文本即可
学到的是通用能力，不是特定任务

类比理解：就像读万卷书，虽然不是为了某次考试，但积累了广博的知识。

预训练教会模型什么：

语言规律（语法、语义）
世界知识（历史、科学、常识）
推理能力（逻辑、因果）

对齐（Alignment）

定义：让模型的行为符合人类期望和价值观的过程。

为什么需要对齐：预训练后的模型虽然"博学"，但可能：

输出有害内容
编造事实（幻觉）
不遵循指令

对齐方法：

指令微调：让模型学会听懂人的指令
人类反馈强化学习（RLHF）：用人类偏好训练模型
安全训练：过滤有害内容

类比理解：预训练后的模型像"野生天才"，对齐就像"道德教育"，让它既聪明又懂事。

小结

概念	一句话理解
人工智能	让机器变聪明的技术总称
机器学习	让机器从数据中学习的方法
深度学习	用多层神经网络学习的方法
大模型	参数巨大的深度学习模型
训练	模型的"学习"阶段
推理	模型的"考试"阶段
微调	模型的"专业培训"
监督学习	有标准答案的学习方式
强化学习	试错反馈的学习方式
预训练	学习通用知识的基础训练
对齐	让模型符合人类价值观

掌握这些基础概念，你就迈进了 AI 世界的大门。无论是使用 DeepSeek 写代码，还是用 Kimi 读文档，都能更清楚地知道背后发生了什么。AI 时代，做一个清醒的使用者！