1 / 13
01
第一讲
面向普通人的
基础 AI 应用通识入门
课程定位
先建立地图,再学工具
先建立预期,再开始行动
前置要求
会用浏览器
适用人群
所有人
更新
2026-05
课程提纲
先把
地图
搭起来
01
为什么现在每个人都需要了解 AI
02
AI 到底是什么(它在做什么)
03
三个真实场景:普通人的工作变化
04
AI 不能做什么 / 什么时候不要信它
05
常见基础概念(绑定到你会踩的坑)
06
不同模型大概有什么区别
07
普通人能用到的工具分类
08
后续这套课会怎么学
AI · LITERACY · 2026
开场
学 AI 最常见的错误模式
问题诊断
大多数人
这样开始学
一上来就收藏工具,听了一堆名词,试了几次问答,最后还是不清楚自己到底在学什么。
这节课的任务
先把 AI 这张地图搭起来
建立整体认知,再学具体工具时脑子里不会是一团雾
典型错误路径
ERR
收藏了一堆工具
还没想清楚用来做什么,先收藏着
ERR
听了一堆名词
LLM、Token、Agent、API——听过但不知道关系
ERR
试了几次问答
结果不满意,觉得"AI 也没什么用"
ERR
最终还是迷茫
不清楚自己到底在学什么、学这些有什么用
数据透视
这不是趋势——这是已经发生的现实。不了解 AI 的代价是多花 3 倍时间做别人不用做的事。
ChatGPT 周活用户
4亿
2025 年 2 月突破,上线仅两个月破亿
TikTok: 9个月 Instagram: 2.5年
来源:Sam Altman · X平台 · 2025.02
企业 AI 部署比例
78%
的企业在至少一个业务场景使用 AI
2023年:55%
知识工作者效率提升 20–45%
来源:McKinsey Global Survey · 2025
AI 企业采用率增速
+40%
同比增长,单年 AI 相关投资
$2,000 亿美元
来源:Stanford HAI AI Index Report · 2025
DeepSeek-R1 训练成本
$550
接近 OpenAI o1 推理能力,2025.01 开源
让「大模型只能靠烧钱」的认知彻底动摇
来源:DeepSeek 官方技术报告 · 2025.01
核心认知框架
AI 在做
一件事
// CORE MECHANISM
给你一段文字,它猜
接下来最可能出现的内容。
这件事被训练得极其强大——强大到它能完成你认为需要「智能」才能做到的任务。
KEY INSIGHT
它不是「懂」了,它是「猜」得很准。
这个区别在后面 AI 的局限那节会很重要。
它猜出来的能力
01
写文章
根据上下文猜出最合适的表达方式
02
翻译
猜出另一种语言中语义最对应的表达
03
找 bug
猜出代码中最可能有问题的位置和原因
04
回答问题
猜出最可能正确、最符合预期的答案
MENTAL MODEL
遇到 AI 做任何事,都可以用这个框架理解:
它「猜」——训练让猜变得极其准确。
场景一 · 行政
小李的周报
以前2–3 小时
现在20 分钟
以前的流程
01
发消息催各部门提交进展,等待回复
02
把 7-8 份碎片内容复制到一个文档
03
自己归纳整理、套格式、写总结
04
领导打回来改,重复修改
05
最终发出去
AI辅助
现在的流程
01
把各部门内容直接扔给 AI
02
"按部门分类、提炼关键进展、生成 600 字周报"
03
AI 出初稿,她看一遍改几句语气
04
发出去
节省时间
2 小时 → 20 分钟。省出的 100 分钟,她在做别的事。
场景二 · 销售
老王的提案
以前半天
现在30 分钟
以前的流程
01
在网上查客户行业情况
02
翻产品手册、找匹配点
03
写 1500 字提案,改了又改
04
半天时间,质量还不稳定
AI辅助
现在的流程
01
告诉 AI:"客户做汽车零部件,关心降本和交期,我们的优势是……"
02
AI 出结构完整的提案初稿
03
他核对事实数据,补充具体案例
04
30 分钟搞定,质量反而更稳定
关键转变
把「从零到初稿」交给 AI,自己只做「从初稿到完稿」需要判断力的部分。
场景三 · 宝妈
小陈的副业
已涨粉4000+
门槛认知(以前)
×
不会设计
×
不会写代码
×
普通话不是播音腔
×
全职妈妈,时间碎片化
「我以前觉得做内容要会很多技能。」
AI工具
现在的工作流
AI 写小红书文案草稿(她提供方向和关键词)
AI 生图工具生成配图
AI 语音工具做配音
每周发 3 篇内容
核心洞察
AI 把很多「门槛技能」填平了,剩下的是你对读者的理解和对内容的判断——这才是真正的核心竞争力。
能力边界
AI 不能做什么——更准确的预期,避免两个极端
01
幻觉 Hallucination
它在猜,所以它会猜错
信息不够时,它还是猜——而且猜出的内容听起来非常像真的。
RISK CASE
引用「最新研究数据」→ 数据可能是编的
查某人履历 → 可能混入了别人的信息
RULE
涉及具体数字、人名、事件,必须自己核实
02
Prompt 质量
你问得越模糊,答得越烂
AI 的能力边界,很大程度由你的表达能力决定。
BAD PROMPT
"帮我写篇文章"
→ 毫无个性的通用文章
GOOD PROMPT
"面向 35 岁职场女性,主题副业规划,真诚不说教,1200 字" → 有用的初稿
03
高风险判断
AI 只能辅助,不能拍板
最终判断责任在你,不在 AI。
不能替代人类判断
合同法律效力 · 医疗方案决策
财务审计结论 · 生产环境重大配置
RULE
AI 提供参考有价值,但最终判断责任始终在人
04
知识截止日期
它没有「当下」的信息
大多数模型有训练数据截止日期,不知道最新发生的事。
STALE DATA RISK
问「现在最好的 XX 是什么」
→ 可能得到半年前的情况
RULE
实时信息、最新动态需配合联网搜索工具
基础概念词典
不背定义——每个词绑定一个你会遇到它的真实场景
ARTIFICIAL INTELLIGENCE
AI
人工智能,是大类不是产品。ChatGPT、Claude、豆包都是 AI 产品,就像 iPhone、小米都叫"手机"。
你会遇到它的场景
泛指所有 AI 产品和技术,不特指某一个
LARGE LANGUAGE MODEL
大模型 / LLM
现在绝大多数对话 AI 产品的底层技术基础。参数量从几十亿到数千亿不等。
你会遇到它的场景
"这个模型参数量是 700 亿" / "我在本地跑了一个开源模型"
PROMPT
提示词
你给 AI 的输入。一句话是 Prompt,一段详细指令也是。质量决定输出质量。
你会遇到它的场景
有人用 AI 结果很好,有人用同一工具觉得没用——区别就在 Prompt
TOKEN · CONTEXT WINDOW
Token
模型处理文字的计量单位。中文约 1字 = 1.5 Token,每个模型有最大 Token 上限(上下文窗口)。
你会踩坑的场景
总结 50 页报告 → "内容太长无法处理" = Token 上限触发
APPLICATION PROGRAMMING INTERFACE
API
让程序调用 AI 能力的接口。API Key、Base URL、中转平台都围绕这件事。
你会遇到它的场景
想让 AI 自动化某件事时,绕不开 API。只打开网页聊天可以完全忽略。
AI AGENT · WORKFLOW
Agent / 工作流
能拆解任务、分步执行、调用工具的 AI。可以搜索、读文件、发邮件、联动多个系统。
你会遇到它的场景
"读完 20 份合同,找出付款条款,整理成表格" = Agent 场景
模型分类
模型不分聪不聪明——它们为不同任务优化了不同能力
通用对话模型
日常 90% 场景
问答、写作、总结、翻译、头脑风暴。大多数日常工作用这类就够了。
GPT-5 · 2025.05 GPT-4o Claude Sonnet 4 豆包 · Kimi
GPT-5 整合对话+推理能力,目前通用能力最强之一
推理模型
需要深度思考
复杂数学题、逻辑分析、代码 debug、拆解大任务。代价是速度慢、消耗 Token 多。
OpenAI o1 / o3 DeepSeek-R1 Claude extended thinking
DeepSeek-R1 开源,可免费用或自行部署
多模态模型
文字之外的内容
处理图片、音频、视频。菜单翻译、录音转文字、UI 截图写代码都靠这类。
gpt-image-1 Seedance(字节) 可灵(快手) 即梦视频
gpt-image-1 可生成带准确文字的商业级图片
开源 vs 闭源
部署方式不同
闭源:能力强,只能通过官方接口用。开源:代码公开,可自己部署、微调。
开源: Llama · Qwen · DeepSeek 闭源: GPT · Claude
金融、医疗、政务:开源+私有化部署,数据不出公司
用对模型,比用「最贵的模型」更重要。
工具全景图
七类工具及典型代表——本课程重点在后三列
类型 用途 典型工具
对话型工具
问答、写作、翻译、总结
ChatGPT(GPT-5) Claude 豆包 Kimi
办公提效工具
PPT、表格、会议纪要、周报
通义 腾讯元宝 飞书 AI
图像生成工具
海报、插图、封面、商品图
Midjourney gpt-image-1 即梦 可灵
视频生成工具
短视频、口播、分镜
Seedance(字节) 可灵(快手) 即梦视频
编程工具
本课重点
写代码、改代码、调试、解释报错
GitHub Copilot Cursor Claude Code
知识库工具
本课重点
笔记管理、文档问答、个人知识系统
Obsidian + 插件 Notion AI
Agent / 工作流
本课重点
执行多步骤任务、联动多个系统
n8n Coze Dify
学习路线图
每一步都是上一步局限被触碰之后的自然回答
01
AI 基础认知
建立 AI 世界的整体地图,搞清能力边界、常见概念和工具分类
本节课 · 地图课
02
模型 · 密钥 · API
弄明白 API Key、Base URL、中转平台是什么,拿到调用 AI 的钥匙
入门技术基础
03
工具安装与配置
把工具真正装到你的机器上,能跑起来,能用起来
本地环境搭建
04
知识库工具
让 AI 能读你的文件,记住你的内容,成为个人知识系统
个人知识管理
05
Agent · 工作流
多步骤任务自动化,让不同系统之间的信息自动流转
自动化进阶
06
Vibe Coding
用自然语言驱动更复杂的 AI 协作开发,不需要专业编程背景
AI 协作编程
核心结论
今天这节课
是整张地图的
起点
AI 是在「猜」——所以要核实
AI 靠你的输入——所以要学会表达
AI 是能力,不是某个软件
用对模型比用贵的模型更重要
NEXT LECTURE
模型、密钥、API Key、Base URL
到底是什么 →
课后练习
01
用自己的话写一段
你理解的 AI 是什么(不能抄课件里的句子)
02
找一件每周重复做的事
花超过 1 小时的,想想能不能让 AI 参与
03
回忆一次 AI 给错误答案
当时你的 Prompt 是什么——为什么它猜错了?
04
定位你的需求
你最想用 AI 解决的那件事,属于哪个工具分类?
下一讲预告
02 · 模型、中转平台、API Key、Base URL 到底是什么
拿到调用 AI 的钥匙,而不只是在别人的界面上用 AI