mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4mobile wallpaper 5mobile wallpaper 6
5232 字
15 分钟
AI 工具入门使用指南:从小白到了解

这是一篇面向技术读者的 AI 工具入门指南,帮助你建立对 AI 工具生态的系统认知。

目录#


第一章:什么是 AI?#

1.1 AI 的日常生活例子#

AI(人工智能) 这个词听起来很高大上,但其实我们每天都在用:

场景AI 应用
和 Siri 对话语音助手 AI
淘宝客服机器人智能客服 AI
抖音推荐视频推荐算法 AI
拍照自动识别人脸计算机视觉 AI

💡 简单理解:AI 就是让计算机能够”像人一样思考和做事”的技术。

1.2 我们说的”AI”到底指什么?#

平时聊天时说”我在用 AI”,大多数情况下指的是 LLM(大语言模型)——一种能理解和生成文字的 AI 系统。

最常见的 LLM 产品:

产品名开发公司特点
ChatGPTOpenAI最早流行,功能全面
ClaudeAnthropic擅长写作、代码分析
GeminiGoogle集成 Google 全家桶
DeepSeek深度求索国产开源,性能强劲

第二章:LLM 与大语言模型#

2.1 什么是 LLM?#

LLM = Large Language Model(大语言模型)

你可以把 LLM 想象成一个”读遍了整个互联网所有文字”的超级大脑。它见过的文字越多,理解能力和生成能力就越强。

2.2 模型 vs 产品:为什么总是分不清?#

层面说明例子
模型(Model)底层技术本身GPT-5.4、Claude 4.6、Gemini 3.1
产品(Product)面向用户的应用ChatGPT、Claude App、Gemini App

💡 类比:模型是”发动机”,产品是”整车”。你可以用同款发动机造出不同的车。

2.3 主流 LLM 模型(2026年3月最新)#

模型发布时间擅长领域上下文长度费用
GPT-5.42026年3月5日全能型,编程能力强1M tokens付费订阅
GPT-5.4 Pro2026年3月5日复杂任务1M tokens付费订阅
Claude 4.6 Sonnet2026年2月17日日常使用、性价比200K tokens付费订阅
Claude 4.6 Opus2026年2月5日复杂推理、超长任务200K tokens付费订阅
Gemini 3.1 Pro2026年2月19日长文本、多模态1M tokens部分免费
Gemini 3.1 Flash-Lite2026年3月4日快速响应1M tokens极便宜
DeepSeek V32026年1月推理、代码、中文128K tokens开源免费

⚠️ 版本注意:AI 模型迭代很快,GPT-4o、Claude 3.5 这些已经是”旧版本”了。实际使用中请以各厂商官网最新信息为准。


第三章:API 是什么?#

3.1 用餐厅理解 API#

想象你去餐厅吃饭:

  1. 你(客户端)想吃东西
  2. 你跟服务员说要点什么
  3. 服务员去厨房(后台系统)告诉厨师
  4. 厨师做好菜,服务员端回来给你

API(Application Programming Interface) 就是这个”服务员”——它是客户端和后台系统之间的传话人。

3.2 为什么 AI 需要 API?#

直接用网页版的 AI vs 通过 API 调用:

对比项网页版API 调用
操作方式手动点击程序自动
批量处理
集成到自己的应用
稳定性一般
费用订阅制按量计费

3.3 API Key 是什么?#

API Key = 身份证号

每个想用 AI API 的人都必须先申请一个 API Key,相当于在系统里注册你的身份。这样系统才知道是谁在使用、该收谁的钱。

⚠️ 安全提醒:API Key 等同于你的账号密码,不要泄露给他人!

API Key 安全最佳实践#

做法说明
❌ 禁止硬编码不要把 API Key 直接写在代码里,否则提交到 Git 后全网可见
✅ 环境变量将 Key 存储在环境变量中,代码运行时读取
✅ 配置文件单独的配置文件中管理,并加入 .gitignore
✅ 密钥轮换定期更换 API Key,减少泄露风险
✅ 最小权限只给需要的应用授权,不要一个 Key 通用

💡 实操建议:在 Cherry Studio、Cursor 等工具中配置 API Key 时,直接粘贴即可(工具会自动加密存储),但在自己开发的应用中务必使用环境变量方式。


第四章:AI 工具的两大类别#

AI 工具可以分成两大类别:

类别特点本质
模型聚合类帮你切换不同模型你指挥,AI 回答
Agent 类能自主完成任务你说目标,AI 自己动手

模型聚合类(Poe、Cherry Studio):

  • 主要功能是让你切换不同 AI 模型对话
  • 你问一句,它答一句,不会自己执行操作

Agent 类(Cursor、Manus、Claude Code):

  • 可以自主规划、执行任务
  • 不仅是问答,而是帮你完成任务

第五章:模型聚合类工具#

模型聚合类工具的核心价值是:让你不用在多个平台之间切换,一个界面用多个 AI 模型。

5.1 Poe —— 老牌模型聚合平台#

项目说明
是什么Quora 开发的 AI 聚合平台
支持模型GPT-5、Claude 4、Gemini、Llama 等 100+ 模型
平台Web / iOS / Android
定价免费 / 付费 $19.99/月

核心特点#

特点说明
模型全面聚合了主流模型,可快速切换
机器人创建可创建自定义 Bot
多端同步手机、电脑数据同步
收藏夹保存喜欢的 Bot

💡 适合场景:想要在一个地方用遍主流 AI 模型,不想注册多个账号。

5.2 Cherry Studio —— 国产多模型客户端#

项目说明
是什么国产开源的多模型桌面客户端
支持模型OpenAI、Claude、Gemini、DeepSeek 等 100+ 模型
平台Windows / Mac / Linux
定价免费开源
下载地址cherry-ai.com

核心特点#

特点说明
开源免费完全免费,无使用限制
内置助手30+ 行业智能助手
知识库支持本地知识库搭建
多 API 支持可对接 OpenAI、Claude、DeepSeek 等
联网搜索支持实时联网功能

支持的模型类型#

类型代表模型
OpenAI 系列GPT-5.4、GPT-4o
Anthropic 系列Claude 4.6、Claude 3.5
Google 系列Gemini 3.1 Pro
国产模型DeepSeek V3、通义千问、文心一言
本地模型通过 Ollama 支持本地部署

💡 适合场景:国内用户,想要免费、多模型、支持自定义 API。

Cherry Studio 快速配置(以硅基流动为例)#

Step 1:获取 API Key

  1. 注册硅基流动账号:cloud.siliconflow.cn(点击注册时填入邀请码可额外获赠额度)
  2. 完成实名认证(必需)
  3. 在「API 密钥」页面新建密钥,复制生成的 Key

Step 2:配置 Cherry Studio

  1. 打开 Cherry Studio,点击左下角「设置」
  2. 进入「模型服务」,选择「硅基流动」
  3. 粘贴 API 密钥,点击「检查」验证连接
  4. 连接成功后在聊天界面选择模型即可使用

Step 3:搭建知识库(可选)

  1. 点击左侧「知识库」按钮,新建知识库
  2. 选择嵌入模型(如 BAAI/bge-m3
  3. 添加文件/网址/目录等数据源
  4. 在聊天界面选择知识库后即可基于知识库问答

💡 提示:国内还推荐使用「硅基流动」和「火山引擎」,配置方式类似,注册后获取 Key 填入即可。

5.3 其他聚合类工具#

工具特点
ChatHub浏览器插件形式,支持多模型对比
monica浏览器插件,侧重辅助写作
Sider浏览器插件,多模型切换

5.4 模型聚合类工具对比#

工具平台模型数量免费特色
PoeWeb/App100+机器人创建
Cherry Studio桌面端100+知识库、国产友好
ChatHub浏览器插件多个多模型对比

⚠️ 时效性提醒:模型聚合平台支持的模型列表、定价、功能都在快速迭代。建议以各平台官网最新公告为准。


第六章:Agent 智能体#

6.1 什么是 Agent?#

Agent(智能体) 是能够自主完成多步骤任务的 AI 系统。

普通 AI 对话 vs Agent:

对比项普通 AI 对话Agent 智能体
交互方式你问一句,它答一句你说目标,它自主完成
任务分解你自己拆解AI 自动拆解
执行步骤一次性完成分步骤执行,可反馈调整
工具使用✅(可调用搜索、代码等工具)

6.2 Agent 类工具分类#

Agent 类工具可以按使用方式分成三类:

分类特点代表工具
现成 Agent 工具下载安装就能用Cursor、Windsurf、Claude Code、Codex CLI、Copilot
Bot 构建平台在上面创建自己的 BotCoze、Dify
通用 Agent 产品直接帮你完成任务Manus、Genspark

⚠️ 时效性提醒:Agent 工具的功能、定价、模型支持变化很快,强烈建议查看各工具官网获取最新信息。

6.3 现成 Agent 工具#

这类工具下载安装就能用,帮你完成特定任务,通常是编程或任务执行类工具。

Cursor —— 当前最火的 AI IDE#

项目说明
是什么专为 AI 辅助编程打造的 IDE
底层基于 VS Code 修改
支持模型GPT-5.4、Claude 4、Gemini、自定义 API
定价Free / Pro $20/月(内置 API 额度)/ 也可接自定义 API
下载地址cursor.sh

Windsurf —— OpenAI 收购的 AI IDE#

项目说明
是什么Codeium 出品的 AI IDE
母公司已被 OpenAI 收购(2025年5月)
支持模型GPT-4o、Claude 3.5、Codeium 自研模型
定价Free / Pro 付费
特色Wave 13 + SWE-1.5 模型

Claude Code —— Anthropic 官方 CLI 工具#

项目说明
是什么Claude 的命令行 Agent 工具
开发公司Anthropic
支持模型Claude 4.6 系列(需要自己提供 API)
定价免费,需自备 Anthropic API 或第三方 API

OpenAI Codex CLI —— 命令行编程智能体#

项目说明
是什么OpenAI 开源的命令行 Agent
支持模型GPT-5.4、o3、o4-mini(需要自己提供 API)
定价免费开源,需自备 OpenAI API 或第三方 API
特色MCP 协议支持,工具链集成

GitHub Copilot —— 老牌 AI 编程助手#

项目说明
是什么深度集成在 VS Code 等 IDE 中的 AI 助手
开发公司Microsoft + OpenAI
支持模型GPT-4(微软调优)
定价$10/月(包月制,内置额度,不用另买 API)

Trae —— 字节跳动国产 AI IDE#

项目说明
是什么字节跳动推出的国产 AI 原生 IDE
开发公司字节跳动
支持模型Claude 3.5、GPT-4o(国内版:豆包、DeepSeek)
定价基础版永久免费,内置模型可用
特色原生中文支持,SOLO 模式(AI 主导开发),国内无需 VPN
下载地址trae.com.cn(国内版)/ trae.ai(国际版)

💡 适合场景:国内开发者首选,完全免费,支持中文问答和代码注释。 ⚠️ 注意:Trae 与 Cursor/Windsurf 定位相似但各有优势。Trae 国内版可直接使用,其他两者需 VPN。

Cursor 快速配置#

Step 1:下载安装

  1. 访问 cursor.sh,下载对应系统的安装包
  2. 安装后首次启动,选择主题和快捷键方案

Step 2:配置自定义 API(可选)

  1. 点击左下角「Settings」→「Models」
  2. 在「OpenAI API Key」处填入你的 API Key
  3. 如使用第三方中转 API,同时配置 API Host 地址
  4. 点击「Verify」验证连接

Step 3:基础使用

  • Ctrl/Cmd + L:打开 AI 对话
  • Ctrl/Cmd + I:打开 Composer(代码生成)
  • Tab:接受 AI 代码补全建议

6.4 Bot 构建平台#

这类平台让你自己搭建 Agent,可以定制行为、发布给别人用。

Coze —— 字节跳动的智能体平台#

项目说明
是什么一站式 AI Bot 开发平台
开发公司字节跳动
国内版coze.cn(无需 VPN)
特点可视化编排工作流,内置免费 Bot 可直接用
费用平台免费,内置 Bot 有免费额度,也可接自定义 API
官网coze.cn(国内版)/ coze.com(国际版)

Coze 快速搭建 Bot#

Step 1:创建 Bot

  1. 登录 coze.cn,点击「创建 Bot」
  2. 填写 Bot 名称和功能介绍
  3. 上传或让 AI 生成图标

Step 2:配置 Bot

  1. 选择大语言模型(如豆包、通义千问、DeepSeek 等)
  2. 编写「人设与回复逻辑」(即 Prompt)
  3. 可添加插件,知识库、数据库等扩展能力

Step 3:调试与发布

  1. 在右侧「预览与调试」区测试回复效果
  2. 设置开场白和预置问题
  3. 点击「发布」,选择发布平台(豆包、飞书等)

Dify —— 开源 Agent 平台#

项目说明
是什么开源的 LLM 应用开发平台
特点可自部署,完全可控
难度需要技术背景
费用开源免费,但需要自己部署和运维

6.5 通用 Agent 产品#

这类是直接帮你完成任务的产品,你只需要说目标,它自己完成。

Manus —— 全球首款通用 Agent#

项目说明
是什么通用型 Agent 产品
开发公司Monica(已于2025年12月加入 Meta)
特点能自主完成各类复杂任务
定价邀请制,付费

💡 能做什么:筛选简历、分析股票、生成 PPT 等,直接帮你完成任务。

Genspark —— AI 搜索 + Agent#

项目说明
是什么AI 搜索 + Agent 平台
开发公司MainFunc(前百度高管创立)
主要功能AI Search、AI Agent
定价注册送 10000 金币,月送约 150 金币

6.6 Agent 横向对比#

工具分类费用国内可用
Cursor现成工具Free / $20/月(内置额度)需 VPN
Windsurf现成工具Free / 付费需 VPN
Claude Code现成工具需自备 API需 VPN
Codex CLI现成工具免费(需自备 API)需 VPN
Copilot现成工具$10/月包月需 VPN
Trae现成工具免费✅(国内版)
CozeBot 构建平台免费(有内置 Bot)✅(coze.cn)
DifyBot 构建平台开源免费自部署
Manus通用 Agent付费需 VPN
Genspark通用 Agent免费金币需 VPN

6.7 Agent 的核心能力#

一个真正的 Agent 通常具备:

能力说明
任务分解把大目标拆成小步骤
工具调用使用搜索、代码执行等工具
自我反思检查结果是否正确
记忆保持记住之前的操作上下文
多轮迭代尝试、失败、再尝试

第七章:常见问题 FAQ#

Q8:常见问题与故障排查#

问题现象可能原因解决方案
API 连接失败API Key 错误或过期检查 Key 是否正确,尝试重新生成
显示”配额不足”免费额度用完或达到限制充值或等待下月额度重置
网络连接超时网络不稳定或被拦截检查网络,换用国内平台 API
模型响应很慢服务器负载高或网络问题错峰使用,或换用其他模型
Cherry Studio 连接失败API 地址填写错误确认平台地址,如硅基流动为 api.siliconflow.cn
Cursor 无法验证 API中转 API 地址或格式不对确认 API Host 地址格式是否正确

⚠️ 遇到问题先检查:API Key 是否正确 → 网络是否稳定 → 平台是否正常运营 → 配额是否充足

Q1:模型聚合类和 Agent 类有什么区别?#

对比模型聚合类Agent 类
本质切换模型对话自主完成任务
交互你问,AI 答你说目标,AI 自己动手
工具Poe、Cherry StudioCursor、Manus

Q2:现成 Agent 工具选哪个?#

选择场景
Cursor想要完整 AI 开发体验,支持多模型
Windsurf想要类似 Cursor 的替代方案
Trae国内用户,想要原生中文支持,完全免费
Claude Code喜欢用终端,CLI 操作
Copilot已经在用 VS Code,不想换工具
Codex CLI想要免费开源方案

Q3:Manus 和 Genspark 是什么?#

工具是什么能做什么
Manus通用 Agent直接帮你完成任务,如筛选简历、分析股票
GensparkAI 搜索 + Agent专注信息研究和搜索

Q4:Coze 和 Dify 有什么区别?#

对比CozeDify
部署云端可自部署
难度低,可视化高,需技术背景
国内可用✅(coze.cn)需要自己部署

Q5:这些工具的费用是多少?#

工具费用
Poe免费 / $19.99/月
Cherry Studio免费
CursorFree / $20/月
WindsurfFree / 付费
Trae免费
Claude CodeAPI 费用
Copilot$10/月
Genspark免费金币

Q6:API Key 怎么获取?#

类型平台地址国内可用
官方(需 VPN)OpenAIplatform.openai.com需 VPN
官方(需 VPN)Anthropicconsole.anthropic.com需 VPN
官方(部分可用)Googleaistudio.google.com部分可用
国内平台硅基流动cloud.siliconflow.cn✅ 直接用
国内平台火山引擎console.volcengine.com✅ 直接用
国内平台DeepSeek 官网https://api.deepseek.com/v1✅ 直接用
国内平台阿里云百炼bailian.console.aliyun.com✅ 直接用
国内平台百度智能云千帆千帆控制台✅ 直接用
第三方中转DeerAPI 等需自行搜索✅ 国内可用

免费额度汇总#

平台免费额度说明
硅基流动注册送 2000 万 Tokens + 实名送 16 元代金券部分模型免费,DeepSeek-V3 极便宜
DeepSeek 官网新用户赠送额度适合测试 DeepSeek 全系列
阿里云百炼每个模型 100 万 Tokens通义千问、DeepSeek 全系等
百度智能云千帆每个模型 100 万 TokensERNIE-4.5、DeepSeek 等,3 个月有效期

💡 国内用户推荐:硅基流动和 DeepSeek 官网最推荐,额度多且价格便宜。阿里云百炼和百度千帆各有特色模型可选。

Q7:内地用户怎么访问这些工具?#

工具访问难度方案
Poe需 VPN使用 VPN
Cherry Studio国内可用直接用
Cursor需 VPN使用 VPN
Windsurf需 VPN使用 VPN
Trae国内可用trae.com.cn,直接用
Genspark需 VPN使用 VPN
Coze国内可用coze.cn

总结#

工具选择建议(按需求分类)#

需求推荐工具说明
多模型聊天Poe、Cherry Studio聚合多个模型,一个界面切换
AI 编程(国内)Trae国产免费,原生中文
AI 编程(需 VPN)Cursor、Windsurf功能全面,社区活跃
终端操作Claude Code、Codex CLI命令行极客风格
不换 IDECopilotVS Code 插件形式
通用 AgentManus、Genspark直接帮你完成任务
搭建自己的 BotCoze(国内)/ Dify可视化编排 / 自部署

入门组合推荐#

场景推荐组合费用
国内用户入门Cherry Studio + 硅基流动 API免费
国内 AI 编程Trae(内置模型)免费
进阶编程Cursor + 自定义 APIFree / $20/月
快速搭建 BotCoze(coze.cn)免费

后续学习路径#

  1. Day 1:下载 Cherry Studio,配置硅基流动 API,体验多模型切换
  2. Day 2:尝试 Trae,用中文让 AI 帮你写个小工具
  3. Day 3:去 Coze 搭一个自己的 Bot,发布到豆包
  4. 后续:根据需求深入学习 Cursor / Agent 模式

参考资料#


如果觉得有帮助,欢迎在评论区交流心得!

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

AI 工具入门使用指南:从小白到了解
https://bayunmoyu.com/posts/ai-guide/
作者
八云墨玉
发布于
2026-03-30
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时

封面
Sample Song
Sample Artist
封面
Sample Song
Sample Artist
0:00 / 0:00