02
Lesson 02
开始动手:
学会跟 AI 说话
从失败案例到有效提问,
理解 Prompt、上下文窗口、Token,
掌握让 AI 输出更稳定的实用技巧
Course
AI 应用通识
Duration
60 min
AI COURSE WORKFLOW
Opening 02 / 17
你上次用 AI
失败在哪里?
我先问大家一个问题。

你有没有遇到过这种情况:
情况 1:模糊指令
你打了一句「帮我写个方案」,AI 给了你一坨八股文。你关掉页面,觉得 AI 没什么用。
情况 2:AI 失忆
你跟 AI 聊了十几轮,后面它突然开始给你答非所问的回答——好像把前面讨论的内容全忘了。
情况 3:语气不对
你让它帮你写一段文案,写出来的语气怎么都不对,你改了五遍还是感觉哪里不对劲。
这些不是 AI 不行,这是你还没有掌握给它发指令的方式。
Concept
Prompt 的本质:
给机器发的指令
Prompt 就是你给 AI 的输入。你打的每一句话、每一段文字,都是 Prompt。
给 AI 发 Prompt,不是跟人聊天,而是给机器发指令。
指令越精确,输出越符合预期。指令模糊,机器用默认值——默认值通常不是你要的。
这就是为什么「帮我写个方案」会得到一坨废话——你给的是一个极度模糊的指令,AI 就给了你一个极度通用的默认输出。
一个 Prompt 包含什么
要素 说明
任务 你要它做什么
「帮我改写这段产品介绍」
要求 对输出的具体限制
「控制在 200 字以内,语气亲切但不夸张」
背景 相关的上下文信息
「这是给淘宝详情页用的,目标客户是 25-35 岁女性」
角色 你希望 AI 扮演谁
「你是一个有 10 年经验的文案编辑」
示例 一个你满意的样本
「参考这种风格:[贴一段你喜欢的文案]」
任务和要求是必须的——这是指令的核心。角色、背景、示例是提升质量的加分项。
03 / 17
Practice 04 / 17
Prompt 实战:四个升级方向
Prompt 四个升级方向对比图
Mechanism 05 / 17
上下文窗口:
AI 记事本的硬限制
AI 有一个固定大小的记事本。记事本写满了之后,不是拒绝写入,而是从头部删掉最早的内容,腾出空间写新内容。
这就是为什么:
• 对话前几轮,AI 的回答跟你的要求非常贴合
• 聊了很多轮之后,它开始「答非所问」——因为你最开始给的关键指令已经从记事本里被删掉了
模型 上下文窗口大小 大概相当于
DeepSeek V4 1M Token 约 50-65 万字中文
GPT-4.1 1M Token 约 50-65 万字中文
Claude Sonnet 4 200K Token 约 10-13 万字中文
GPT-4o 128K Token 约 6-8 万字中文
豆包(Doubao) 128K Token 约 6-8 万字中文
三个实操建议
  • 重要的任务,开新对话 — 别在一个已经聊了 50 轮的窗口里开始新任务
  • 长对话中途,主动总结 — 如果 AI 开始「走偏」,让它总结要点,然后贴到新对话开头继续
  • 关键信息放在对话开头 — 记事本写满时删头部,放在开头的内容反而最后才被删
Mechanism 06 / 17
Token:
记事本的计量单位,
也是计费单位
Token 是 AI 处理文本的最小单位。
中文:1 个汉字 ≈ 1.5-2 个 Token
英文:1 个单词 ≈ 1-2 个 Token
代码:1 行代码 ≈ 10-30 个 Token
为什么要知道 Token?

1. 它决定你能输入多少内容
上下文窗口的「128K Token」就是说你最多能输入约 6-8 万字中文。

2. 它决定你要花多少钱
API 调用按 Token 计费。输入 + 输出的 Token 数越多,花费越高。
实际例子
输入:「请帮我写一篇关于 AI 的文章」
约 15 个 Token
输出:AI 生成了 800 字的文章
约 1200 个 Token
这次对话总共消耗:
15(输入)+ 1200(输出)= 1215 Token
成本参考(2026 年 5 月)
  • 豆包 / DeepSeek — 免费额度足够日常使用
  • GPT-4o — 1M Token 输入约 ¥35,输出约 ¥105
  • Claude Sonnet 4 — 1M Token 输入约 ¥21,输出约 ¥105
Infrastructure 07 / 17
API Key + Base URL + 中转平台:
下节课的三把钥匙
下节课我们要开始实操——安装工具、配置 API。在那之前,你需要理解这三个概念的关系。
API 调用流程图
Infrastructure 08 / 17
API Key:
你的身份证
API Key 是一串密钥,用来证明「这个请求是你发的」。
长这样:
sk-1234567890abcdefghijklmnopqrstuvwxyz

每个 API Key 绑定一个账号,用来计费和限流。
从哪里获取?
• OpenAI 官网 → API Keys 页面
• DeepSeek 官网 → 开放平台
• 豆包(字节跳动)→ 火山引擎控制台
• 中转平台 → 注册后获取
安全提醒
  • 不要泄露 — API Key 等于你的钱包密码,别发到公开的 GitHub / 论坛
  • 定期轮换 — 如果怀疑泄露,立即在官网删除旧 Key,生成新的
  • 设置额度 — 在官网设置每月消费上限,防止意外超支
常见错误:
把 API Key 直接写在代码里,然后把代码上传到 GitHub——几分钟内就会被爬虫扫到,你的额度会被刷光。
Infrastructure 09 / 17
Base URL:
请求发往哪里
Base URL 是 API 的服务器地址。你的工具会把请求发到这个地址。
官方 Base URL:
• OpenAI: https://api.openai.com/v1
• DeepSeek: https://api.deepseek.com
• 豆包: https://ark.cn-beijing.volces.com/api/v3
为什么要知道 Base URL?

因为下节课你要配置工具时,需要填两个东西:
1. API Key(身份证)
2. Base URL(服务器地址)
中转平台的 Base URL
如果你用的是中转平台(下一页会讲),Base URL 会变成中转平台的地址:
示例:
• 中转平台: https://api.haiyawl.com/
记住这个逻辑
  • 官方 API — Base URL 指向官方服务器
  • 中转平台 — Base URL 指向中转服务器,中转服务器再转发给官方
Strategy 10 / 17
模型选择:先用快的,不满意再升级
不同模型有不同的速度、成本、能力。选模型的原则:先用快的便宜的,不满意再换贵的强的。
模型选择指南
Infrastructure 11 / 17
中转平台:
解决网络和支付问题
中转平台是什么?

一个中间服务器,帮你转发请求给 OpenAI / Anthropic 等官方 API。
为什么需要中转平台?

1. 网络问题 — OpenAI 官方 API 在国内访问不稳定
2. 支付问题 — 官方只支持国际信用卡,中转平台支持支付宝/微信
3. 整合多家 — 一个 API Key 可以调用多家模型(OpenAI、Claude、Gemini)
推荐中转平台
海崖API
• 网址: https://api.haiyawl.com/
• 支持多家模型,国内访问稳定
• 支持支付宝/微信充值
选择建议
  • 新手 — 先用豆包/DeepSeek 官方(免费额度够用)
  • 需要 GPT-4/Claude — 用海崖API中转平台
Practical Skills
六个实用技巧:
让 AI 输出更稳
接下来是 6 个立刻能用的技巧,
帮你提升 AI 输出的稳定性和质量。
12 / 17
Tips 1-2 13 / 17
技巧 1:用「你是...」开头定角色
为什么有效?
AI 会根据角色调整语气、专业度、输出风格。
✓ 好的例子:
「你是一个有 10 年经验的产品经理,帮我分析这个需求的可行性。」
✗ 不好的例子:
「帮我分析这个需求的可行性。」
技巧 2:用「输出格式:...」固定结构
为什么有效?
明确格式能让 AI 输出更规整,方便你后续处理。
✓ 好的例子:
「输出格式:
1. 问题描述(50字以内)
2. 解决方案(3条,每条100字)
3. 风险提示(2条)」
✗ 不好的例子:
「给我一些解决方案。」
Tips 3-4 14 / 17
技巧 3:用「先...再...最后...」拆步骤
为什么有效?
复杂任务一次性做容易出错,拆成步骤让 AI 逐步推理。
✓ 好的例子:
「先列出这篇文章的 3 个核心观点,
再针对每个观点写 100 字的反驳,
最后总结你的立场。」
✗ 不好的例子:
「帮我反驳这篇文章。」
技巧 4:用「参考这个例子」给样本
为什么有效?
一个好例子胜过 100 句描述。AI 会模仿例子的风格和结构。
✓ 好的例子:
「参考这个例子写一段产品介绍:

[贴一段你满意的文案]

保持这种语气和节奏,但内容换成我们的产品。」
✗ 不好的例子:
「写得活泼一点、专业一点、有趣一点。」
Tips 5-6 15 / 17
技巧 5:用「不要...」明确禁区
为什么有效?
AI 的默认输出经常有你不想要的东西(比如客套话、重复内容)。明确说「不要」能避免。
✓ 好的例子:
「写一段产品介绍,
不要用「领先」「创新」「赋能」这类词,
不要写客套的开头和结尾,
直接进入正题。」
✗ 不好的例子:
「写一段产品介绍,要真实一点。」
技巧 6:用「如果不确定就说不知道」防止胡编
为什么有效?
AI 有时会为了「完成任务」而编造不存在的信息。这句话能降低胡编概率。
✓ 好的例子:
「帮我查一下 2025 年中国 AI 市场规模的数据。
如果你不确定或者没有可靠来源,就直接说「我不知道」,不要猜测。」
✗ 不好的例子:
「帮我查一下 2025 年中国 AI 市场规模的数据。」
(AI 可能会编造一个看起来很专业的数字)
Capability 16 / 17
多模态速览:
有时候发图比说话有效
多模态 = AI 不只能处理文字,还能处理图片、语音、视频。
典型场景:

看图回答 — 上传一张图,问「这是什么」「图里有几个人」
OCR 提取文字 — 拍一张纸质文档,让 AI 提取文字
代码 Debug — 截图报错信息,让 AI 分析问题
设计反馈 — 上传设计稿,让 AI 给改进建议
支持多模态的模型
模型 支持能力
GPT-4o 文字 + 图片 + 语音
Claude Sonnet 4 文字 + 图片
Gemini 2.0 Flash 文字 + 图片 + 语音 + 视频
豆包 文字 + 图片
实用建议
  • 能发图就别打字 — 描述一个复杂界面要 200 字,截图只要 1 秒
  • 图片质量影响识别 — 模糊、歪斜、光线差的图片识别率低
  • 隐私注意 — 上传的图片会被 AI 处理,别传敏感信息
总结:今天学了什么
1. Prompt 的本质
给机器发指令,不是跟人聊天。指令越精确,输出越符合预期。
2. 四个升级方向
模糊→精准、加角色、分步骤、给示例。
3. 上下文窗口
AI 的记事本有大小限制,写满了会从头删。重要任务开新对话。
4. Token
计量单位和计费单位。1 个汉字 ≈ 1.5-2 个 Token。
5. API 三要素
API Key(身份证)+ Base URL(服务器地址)+ 中转平台(可选)。
6. 六个实用技巧
定角色、固定格式、拆步骤、给样本、明确禁区、防止胡编。
下节课预告:
安装配置 OpenClaw,接入 QQ/飞书/微信,
把今天学的东西真正用起来。
17 / 17