AI 通识入门 · 知识图鉴版

01

第一讲

面向普通人的
基础 AI 应用通识入门

课程定位

先建立地图，再学工具
先建立预期，再开始行动

前置要求

会用浏览器

适用人群

所有人

更新

2026-05

课程提纲

先把
地图
搭起来

01

为什么现在每个人都需要了解 AI

02

AI 到底是什么（它在做什么）

03

三个真实场景：普通人的工作变化

04

AI 不能做什么 / 什么时候不要信它

05

常见基础概念（绑定到你会踩的坑）

06

不同模型大概有什么区别

07

普通人能用到的工具分类

08

后续这套课会怎么学

AI · LITERACY · 2026

开场

学 AI 最常见的错误模式

问题诊断

大多数人
这样开始学

一上来就收藏工具，听了一堆名词，试了几次问答，最后还是不清楚自己到底在学什么。

这节课的任务

先把 AI 这张地图搭起来

建立整体认知，再学具体工具时脑子里不会是一团雾

典型错误路径

ERR

收藏了一堆工具

还没想清楚用来做什么，先收藏着

ERR

听了一堆名词

LLM、Token、Agent、API——听过但不知道关系

ERR

试了几次问答

结果不满意，觉得"AI 也没什么用"

ERR

最终还是迷茫

不清楚自己到底在学什么、学这些有什么用

ChatGPT 周活用户

4亿

2025 年 2 月突破，上线仅两个月破亿

TikTok: 9个月 Instagram: 2.5年

来源：Sam Altman · X平台 · 2025.02

企业 AI 部署比例

78%

的企业在至少一个业务场景使用 AI

2023年：55%

知识工作者效率提升 20–45%

来源：McKinsey Global Survey · 2025

AI 企业采用率增速

+40%

同比增长，单年 AI 相关投资

$2,000 亿美元

来源：Stanford HAI AI Index Report · 2025

DeepSeek-R1 训练成本

$550万

接近 OpenAI o1 推理能力，2025.01 开源

让「大模型只能靠烧钱」的认知彻底动摇

来源：DeepSeek 官方技术报告 · 2025.01

核心认知框架

AI 在做
一件事

// CORE MECHANISM

给你一段文字，它猜
接下来最可能出现的内容。

这件事被训练得极其强大——强大到它能完成你认为需要「智能」才能做到的任务。

KEY INSIGHT

它不是「懂」了，它是「猜」得很准。
这个区别在后面 AI 的局限那节会很重要。

它猜出来的能力

01

写文章

根据上下文猜出最合适的表达方式

02

翻译

猜出另一种语言中语义最对应的表达

03

找 bug

猜出代码中最可能有问题的位置和原因

04

回答问题

猜出最可能正确、最符合预期的答案

MENTAL MODEL

遇到 AI 做任何事，都可以用这个框架理解：
它「猜」——训练让猜变得极其准确。

场景一 · 行政

小李的周报

以前2–3 小时

→

现在20 分钟

以前的流程

01

发消息催各部门提交进展，等待回复

02

把 7-8 份碎片内容复制到一个文档

03

自己归纳整理、套格式、写总结

04

领导打回来改，重复修改

05

最终发出去

↓

AI辅助

↓

现在的流程

01

把各部门内容直接扔给 AI

02

"按部门分类、提炼关键进展、生成 600 字周报"

03

AI 出初稿，她看一遍改几句语气

04

发出去

节省时间

2 小时 → 20 分钟。省出的 100 分钟，她在做别的事。

场景二 · 销售

老王的提案

以前半天

→

现在30 分钟

以前的流程

01

在网上查客户行业情况

02

翻产品手册、找匹配点

03

写 1500 字提案，改了又改

04

半天时间，质量还不稳定

↓

AI辅助

↓

现在的流程

01

告诉 AI："客户做汽车零部件，关心降本和交期，我们的优势是……"

02

AI 出结构完整的提案初稿

03

他核对事实数据，补充具体案例

04

30 分钟搞定，质量反而更稳定

关键转变

把「从零到初稿」交给 AI，自己只做「从初稿到完稿」需要判断力的部分。

场景三 · 宝妈

小陈的副业

已涨粉4000+

门槛认知（以前）

×

不会设计

×

不会写代码

×

普通话不是播音腔

×

全职妈妈，时间碎片化

「我以前觉得做内容要会很多技能。」

↓

AI工具

↓

现在的工作流

文

AI 写小红书文案草稿（她提供方向和关键词）

图

AI 生图工具生成配图

音

AI 语音工具做配音

发

每周发 3 篇内容

核心洞察

AI 把很多「门槛技能」填平了，剩下的是你对读者的理解和对内容的判断——这才是真正的核心竞争力。

01

幻觉 Hallucination

它在猜，所以它会猜错

信息不够时，它还是猜——而且猜出的内容听起来非常像真的。

RISK CASE

引用「最新研究数据」→ 数据可能是编的
查某人履历 → 可能混入了别人的信息

RULE

涉及具体数字、人名、事件，必须自己核实

02

Prompt 质量

你问得越模糊，答得越烂

AI 的能力边界，很大程度由你的表达能力决定。

BAD PROMPT

"帮我写篇文章"
→ 毫无个性的通用文章

GOOD PROMPT

"面向 35 岁职场女性，主题副业规划，真诚不说教，1200 字" → 有用的初稿

03

高风险判断

AI 只能辅助，不能拍板

最终判断责任在你，不在 AI。

不能替代人类判断

合同法律效力 · 医疗方案决策
财务审计结论 · 生产环境重大配置

RULE

AI 提供参考有价值，但最终判断责任始终在人

04

知识截止日期

它没有「当下」的信息

大多数模型有训练数据截止日期，不知道最新发生的事。

STALE DATA RISK

问「现在最好的 XX 是什么」
→ 可能得到半年前的情况

RULE

实时信息、最新动态需配合联网搜索工具

ARTIFICIAL INTELLIGENCE

AI

人工智能，是大类不是产品。ChatGPT、Claude、豆包都是 AI 产品，就像 iPhone、小米都叫"手机"。

你会遇到它的场景

泛指所有 AI 产品和技术，不特指某一个

LARGE LANGUAGE MODEL

大模型 / LLM

现在绝大多数对话 AI 产品的底层技术基础。参数量从几十亿到数千亿不等。

你会遇到它的场景

"这个模型参数量是 700 亿" / "我在本地跑了一个开源模型"

PROMPT

提示词

你给 AI 的输入。一句话是 Prompt，一段详细指令也是。质量决定输出质量。

你会遇到它的场景

有人用 AI 结果很好，有人用同一工具觉得没用——区别就在 Prompt

TOKEN · CONTEXT WINDOW

Token

模型处理文字的计量单位。中文约 1字 = 1.5 Token，每个模型有最大 Token 上限（上下文窗口）。

你会踩坑的场景

总结 50 页报告 → "内容太长无法处理" = Token 上限触发

APPLICATION PROGRAMMING INTERFACE

API

让程序调用 AI 能力的接口。API Key、Base URL、中转平台都围绕这件事。

你会遇到它的场景

想让 AI 自动化某件事时，绕不开 API。只打开网页聊天可以完全忽略。

AI AGENT · WORKFLOW

Agent / 工作流

能拆解任务、分步执行、调用工具的 AI。可以搜索、读文件、发邮件、联动多个系统。

你会遇到它的场景

"读完 20 份合同，找出付款条款，整理成表格" = Agent 场景

通用对话模型

日常 90% 场景

问答、写作、总结、翻译、头脑风暴。大多数日常工作用这类就够了。

GPT-5 · 2025.05 GPT-4o Claude Sonnet 4 豆包 · Kimi

GPT-5 整合对话+推理能力，目前通用能力最强之一

推理模型

需要深度思考

复杂数学题、逻辑分析、代码 debug、拆解大任务。代价是速度慢、消耗 Token 多。

OpenAI o1 / o3 DeepSeek-R1 Claude extended thinking

DeepSeek-R1 开源，可免费用或自行部署

多模态模型

文字之外的内容

处理图片、音频、视频。菜单翻译、录音转文字、UI 截图写代码都靠这类。

gpt-image-1 Seedance（字节）可灵（快手）即梦视频

gpt-image-1 可生成带准确文字的商业级图片

开源 vs 闭源

部署方式不同

闭源：能力强，只能通过官方接口用。开源：代码公开，可自己部署、微调。

开源: Llama · Qwen · DeepSeek 闭源: GPT · Claude

金融、医疗、政务：开源+私有化部署，数据不出公司

▶

用对模型，比用「最贵的模型」更重要。

类型	用途	典型工具
对话型工具	问答、写作、翻译、总结	ChatGPT（GPT-5） Claude 豆包 Kimi
办公提效工具	PPT、表格、会议纪要、周报	通义腾讯元宝飞书 AI
图像生成工具	海报、插图、封面、商品图	Midjourney gpt-image-1 即梦可灵
视频生成工具	短视频、口播、分镜	Seedance（字节）可灵（快手）即梦视频
编程工具本课重点	写代码、改代码、调试、解释报错	GitHub Copilot Cursor Claude Code
知识库工具本课重点	笔记管理、文档问答、个人知识系统	Obsidian + 插件 Notion AI
Agent / 工作流本课重点	执行多步骤任务、联动多个系统	n8n Coze Dify

01

AI 基础认知

建立 AI 世界的整体地图，搞清能力边界、常见概念和工具分类

本节课 · 地图课

02

模型 · 密钥 · API

弄明白 API Key、Base URL、中转平台是什么，拿到调用 AI 的钥匙

入门技术基础

03

工具安装与配置

把工具真正装到你的机器上，能跑起来，能用起来

本地环境搭建

04

知识库工具

让 AI 能读你的文件，记住你的内容，成为个人知识系统

个人知识管理

05

Agent · 工作流

多步骤任务自动化，让不同系统之间的信息自动流转

自动化进阶

06

Vibe Coding

用自然语言驱动更复杂的 AI 协作开发，不需要专业编程背景

AI 协作编程

核心结论

今天这节课
是整张地图的
起点

AI 是在「猜」——所以要核实

AI 靠你的输入——所以要学会表达

AI 是能力，不是某个软件

用对模型比用贵的模型更重要

NEXT LECTURE

模型、密钥、API Key、Base URL
到底是什么 →

课后练习

01

用自己的话写一段

你理解的 AI 是什么（不能抄课件里的句子）

02

找一件每周重复做的事

花超过 1 小时的，想想能不能让 AI 参与

03

回忆一次 AI 给错误答案

当时你的 Prompt 是什么——为什么它猜错了？

04

定位你的需求

你最想用 AI 解决的那件事，属于哪个工具分类？

下一讲预告

02 · 模型、中转平台、API Key、Base URL 到底是什么

拿到调用 AI 的钥匙，而不只是在别人的界面上用 AI