02 开始动手：学会跟 AI 说话

02

Lesson 02

开始动手：
学会跟 AI 说话

从失败案例到有效提问，
理解 Prompt、上下文窗口、Token，
掌握让 AI 输出更稳定的实用技巧

Course

AI 应用通识

Duration

60 min

AI COURSE WORKFLOW

Opening 02 / 17

你上次用 AI
失败在哪里？

我先问大家一个问题。

你有没有遇到过这种情况：

情况 1：模糊指令
你打了一句「帮我写个方案」，AI 给了你一坨八股文。你关掉页面，觉得 AI 没什么用。

情况 2：AI 失忆
你跟 AI 聊了十几轮，后面它突然开始给你答非所问的回答——好像把前面讨论的内容全忘了。

情况 3：语气不对
你让它帮你写一段文案，写出来的语气怎么都不对，你改了五遍还是感觉哪里不对劲。

这些不是 AI 不行，这是你还没有掌握给它发指令的方式。

Concept

Prompt 的本质：
给机器发的指令

Prompt 就是你给 AI 的输入。你打的每一句话、每一段文字，都是 Prompt。

给 AI 发 Prompt，不是跟人聊天，而是给机器发指令。
指令越精确，输出越符合预期。指令模糊，机器用默认值——默认值通常不是你要的。

这就是为什么「帮我写个方案」会得到一坨废话——你给的是一个极度模糊的指令，AI 就给了你一个极度通用的默认输出。

一个 Prompt 包含什么

要素	说明
任务	你要它做什么「帮我改写这段产品介绍」
要求	对输出的具体限制「控制在 200 字以内，语气亲切但不夸张」
背景	相关的上下文信息「这是给淘宝详情页用的，目标客户是 25-35 岁女性」
角色	你希望 AI 扮演谁「你是一个有 10 年经验的文案编辑」
示例	一个你满意的样本「参考这种风格：[贴一段你喜欢的文案]」

任务和要求是必须的——这是指令的核心。角色、背景、示例是提升质量的加分项。

03 / 17

Practice 04 / 17

Prompt 实战：四个升级方向

Mechanism 05 / 17

上下文窗口：
AI 记事本的硬限制

AI 有一个固定大小的记事本。记事本写满了之后，不是拒绝写入，而是从头部删掉最早的内容，腾出空间写新内容。

这就是为什么：
• 对话前几轮，AI 的回答跟你的要求非常贴合
• 聊了很多轮之后，它开始「答非所问」——因为你最开始给的关键指令已经从记事本里被删掉了

模型	上下文窗口大小	大概相当于
DeepSeek V4	1M Token	约 50-65 万字中文
GPT-4.1	1M Token	约 50-65 万字中文
Claude Sonnet 4	200K Token	约 10-13 万字中文
GPT-4o	128K Token	约 6-8 万字中文
豆包（Doubao）	128K Token	约 6-8 万字中文

三个实操建议

重要的任务，开新对话 — 别在一个已经聊了 50 轮的窗口里开始新任务
长对话中途，主动总结 — 如果 AI 开始「走偏」，让它总结要点，然后贴到新对话开头继续
关键信息放在对话开头 — 记事本写满时删头部，放在开头的内容反而最后才被删

Mechanism 06 / 17

Token：
记事本的计量单位，
也是计费单位

Token 是 AI 处理文本的最小单位。

中文：1 个汉字 ≈ 1.5-2 个 Token
英文：1 个单词 ≈ 1-2 个 Token
代码：1 行代码 ≈ 10-30 个 Token

为什么要知道 Token？

1. 它决定你能输入多少内容
上下文窗口的「128K Token」就是说你最多能输入约 6-8 万字中文。

2. 它决定你要花多少钱
API 调用按 Token 计费。输入 + 输出的 Token 数越多，花费越高。

实际例子

输入：「请帮我写一篇关于 AI 的文章」
约 15 个 Token

输出：AI 生成了 800 字的文章
约 1200 个 Token

这次对话总共消耗：
15（输入）+ 1200（输出）= 1215 Token

成本参考（2026 年 5 月）

豆包 / DeepSeek — 免费额度足够日常使用
GPT-4o — 1M Token 输入约 ¥35，输出约 ¥105
Claude Sonnet 4 — 1M Token 输入约 ¥21，输出约 ¥105

Infrastructure 07 / 17

API Key + Base URL + 中转平台：
下节课的三把钥匙

下节课我们要开始实操——安装工具、配置 API。在那之前，你需要理解这三个概念的关系。

Infrastructure 08 / 17

API Key：
你的身份证

API Key 是一串密钥，用来证明「这个请求是你发的」。

长这样：
sk-1234567890abcdefghijklmnopqrstuvwxyz

每个 API Key 绑定一个账号，用来计费和限流。

从哪里获取？
• OpenAI 官网 → API Keys 页面
• DeepSeek 官网 → 开放平台
• 豆包（字节跳动）→ 火山引擎控制台
• 中转平台 → 注册后获取

安全提醒

不要泄露 — API Key 等于你的钱包密码，别发到公开的 GitHub / 论坛
定期轮换 — 如果怀疑泄露，立即在官网删除旧 Key，生成新的
设置额度 — 在官网设置每月消费上限，防止意外超支

常见错误：
把 API Key 直接写在代码里，然后把代码上传到 GitHub——几分钟内就会被爬虫扫到，你的额度会被刷光。

Infrastructure 09 / 17

Base URL：
请求发往哪里

Base URL 是 API 的服务器地址。你的工具会把请求发到这个地址。

官方 Base URL：
• OpenAI: https://api.openai.com/v1
• DeepSeek: https://api.deepseek.com
• 豆包: https://ark.cn-beijing.volces.com/api/v3

为什么要知道 Base URL？

因为下节课你要配置工具时，需要填两个东西：
1. API Key（身份证）
2. Base URL（服务器地址）

中转平台的 Base URL

如果你用的是中转平台（下一页会讲），Base URL 会变成中转平台的地址：

示例：
• 中转平台: https://api.haiyawl.com/

记住这个逻辑

官方 API — Base URL 指向官方服务器
中转平台 — Base URL 指向中转服务器，中转服务器再转发给官方

Strategy 10 / 17

模型选择：先用快的，不满意再升级

不同模型有不同的速度、成本、能力。选模型的原则：先用快的便宜的，不满意再换贵的强的。

Infrastructure 11 / 17

中转平台：
解决网络和支付问题

中转平台是什么？

一个中间服务器，帮你转发请求给 OpenAI / Anthropic 等官方 API。

为什么需要中转平台？

1. 网络问题 — OpenAI 官方 API 在国内访问不稳定
2. 支付问题 — 官方只支持国际信用卡，中转平台支持支付宝/微信
3. 整合多家 — 一个 API Key 可以调用多家模型（OpenAI、Claude、Gemini）

推荐中转平台

海崖API
• 网址: https://api.haiyawl.com/
• 支持多家模型，国内访问稳定
• 支持支付宝/微信充值

选择建议

新手 — 先用豆包/DeepSeek 官方（免费额度够用）
需要 GPT-4/Claude — 用海崖API中转平台

Practical Skills

六个实用技巧：
让 AI 输出更稳

接下来是 6 个立刻能用的技巧，
帮你提升 AI 输出的稳定性和质量。

12 / 17

Tips 1-2 13 / 17

技巧 1：用「你是...」开头定角色

为什么有效？
AI 会根据角色调整语气、专业度、输出风格。

✓ 好的例子：
「你是一个有 10 年经验的产品经理，帮我分析这个需求的可行性。」

✗ 不好的例子：
「帮我分析这个需求的可行性。」

技巧 2：用「输出格式：...」固定结构

为什么有效？
明确格式能让 AI 输出更规整，方便你后续处理。

✓ 好的例子：
「输出格式：
1. 问题描述（50字以内）
2. 解决方案（3条，每条100字）
3. 风险提示（2条）」

✗ 不好的例子：
「给我一些解决方案。」

Tips 3-4 14 / 17

技巧 3：用「先...再...最后...」拆步骤

为什么有效？
复杂任务一次性做容易出错，拆成步骤让 AI 逐步推理。

✓ 好的例子：
「先列出这篇文章的 3 个核心观点，
再针对每个观点写 100 字的反驳，
最后总结你的立场。」

✗ 不好的例子：
「帮我反驳这篇文章。」

技巧 4：用「参考这个例子」给样本

为什么有效？
一个好例子胜过 100 句描述。AI 会模仿例子的风格和结构。

✓ 好的例子：
「参考这个例子写一段产品介绍：

[贴一段你满意的文案]

保持这种语气和节奏，但内容换成我们的产品。」

✗ 不好的例子：
「写得活泼一点、专业一点、有趣一点。」

Tips 5-6 15 / 17

技巧 5：用「不要...」明确禁区

为什么有效？
AI 的默认输出经常有你不想要的东西（比如客套话、重复内容）。明确说「不要」能避免。

✓ 好的例子：
「写一段产品介绍，
不要用「领先」「创新」「赋能」这类词，
不要写客套的开头和结尾，
直接进入正题。」

✗ 不好的例子：
「写一段产品介绍，要真实一点。」

技巧 6：用「如果不确定就说不知道」防止胡编

为什么有效？
AI 有时会为了「完成任务」而编造不存在的信息。这句话能降低胡编概率。

✓ 好的例子：
「帮我查一下 2025 年中国 AI 市场规模的数据。
如果你不确定或者没有可靠来源，就直接说「我不知道」，不要猜测。」

✗ 不好的例子：
「帮我查一下 2025 年中国 AI 市场规模的数据。」
（AI 可能会编造一个看起来很专业的数字）

Capability 16 / 17

多模态速览：
有时候发图比说话有效

多模态 = AI 不只能处理文字，还能处理图片、语音、视频。

典型场景：

• 看图回答 — 上传一张图，问「这是什么」「图里有几个人」
• OCR 提取文字 — 拍一张纸质文档，让 AI 提取文字
• 代码 Debug — 截图报错信息，让 AI 分析问题
• 设计反馈 — 上传设计稿，让 AI 给改进建议

支持多模态的模型

模型	支持能力
GPT-4o	文字 + 图片 + 语音
Claude Sonnet 4	文字 + 图片
Gemini 2.0 Flash	文字 + 图片 + 语音 + 视频
豆包	文字 + 图片

实用建议

能发图就别打字 — 描述一个复杂界面要 200 字，截图只要 1 秒
图片质量影响识别 — 模糊、歪斜、光线差的图片识别率低
隐私注意 — 上传的图片会被 AI 处理，别传敏感信息

总结：今天学了什么

1. Prompt 的本质
给机器发指令，不是跟人聊天。指令越精确，输出越符合预期。

2. 四个升级方向
模糊→精准、加角色、分步骤、给示例。

3. 上下文窗口
AI 的记事本有大小限制，写满了会从头删。重要任务开新对话。

4. Token
计量单位和计费单位。1 个汉字 ≈ 1.5-2 个 Token。

5. API 三要素
API Key（身份证）+ Base URL（服务器地址）+ 中转平台（可选）。

6. 六个实用技巧
定角色、固定格式、拆步骤、给样本、明确禁区、防止胡编。

下节课预告：
安装配置 OpenClaw，接入 QQ/飞书/微信，
把今天学的东西真正用起来。

17 / 17