Codex 项目实战训练营:把 AI 编程变成可展示的业务资产
这不是一份普通操作手册,而是一套直播带练的交付路线。学员会跟着你从环境、提示、验证到发布,一步一步做出能展示、能复盘、能继续卖服务的 Codex 项目。
Codex 是什么
Codex 是 OpenAI 的编码智能体。它不只是回答问题,还能在你授权的范围内读取文件、修改代码、运行命令、做代码审查、整理资料、生成报告,并把结果留在你当前项目里。
对新手来说,最重要的理解是:Codex 不是一次性问答工具,更像一个需要上下文、规则和验收标准的队友。你给它的目标越清楚,它能检查自己工作的机会越多,结果就越稳定。
选择入口:App、CLI、IDE、Web
Codex 现在有多个使用入口。你不需要全部掌握,先选一个最贴近你当前工作的入口即可。
| 入口 | 适合谁 | 最常见用法 |
|---|---|---|
| Codex App | 想在桌面里管理多个线程、项目、自动化和改动审查的人。 | 本地项目协作、并行线程、工作树、浏览器预览、提交前审查。 |
| Codex CLI | 喜欢终端、脚本和命令行工作流的人。 | 运行 codex 进入交互式 TUI,或用 codex exec 做脚本化任务。 |
| IDE Extension | 主要在 VS Code、Cursor、Windsurf、JetBrains 系列 IDE 中写代码的人。 | 把打开文件、选中文本、当前项目直接交给 Codex 处理。 |
| Codex Web / Cloud | 想把任务委托到云端、并行跑、从 GitHub 开 PR 的团队。 | 连接 GitHub 后,让 Codex 在独立云环境里处理任务并产出 PR。 |
准备 3 样东西
一个 ChatGPT 账号或 API Key
使用 ChatGPT 账号登录通常最省心。不同计划包含的 Codex 权益、速率限制和可用功能会变,具体以官方帮助中心和定价页为准。
一个明确的项目文件夹
Codex 本地线程会围绕当前项目工作。新手最好先建一个练习目录,确认它只改你允许它改的文件。
一条能验证的任务
不要只说“帮我优化”。改成“把首页标题改成 X,保证移动端不换行溢出,最后打开页面检查”。
安装与登录
如果你使用 Codex App,下载并安装 Windows 或 macOS 版本,打开后登录 ChatGPT 账号,选择一个项目文件夹,然后发送第一条消息。App 适合新手,因为它把线程、文件改动、审查面板和自动化放在同一个地方。
如果你使用 CLI,官方文档给出的 npm 安装方式如下:
npm i -g @openai/codex
codex
Windows 用户可以在 PowerShell 中原生运行 Codex;如果你需要 Linux 原生工具链,也可以用 WSL2。第一次运行时按提示用 ChatGPT 账号或 API Key 登录。
第一条成功任务
学 Codex 的第一步不是背命令,而是跑通一个完整闭环:描述目标,让它读项目,让它做最小修改,让它验证,再让它汇报结果。
请先查看当前文件夹结构,判断这是一个什么项目。然后创建一个简单的
index.html 教程页,页面包含标题、三个步骤、一个代码块和资料来源区域。完成后请检查文件是否存在,并说明我应该如何打开它。
这条消息之所以适合新手,是因为它包含了目标、上下文探索、具体产物、验收动作和交付说明。你能清楚看见 Codex 是否真的做完了。
完整实操课:从打开 Codex 到交付结果
这一课是一条从进入 Codex、选择环境、连接仓库、发起任务、查看执行日志、处理结果到复盘修正的完整实操路线。用户照着做完后,应当知道每个界面解决什么问题、应该检查什么、失败时从哪里回退。
打开 Codex 首页,理解产品入口
先让学员看到 Codex 的主界面:顶部是产品与账号入口,中间是开始任务区域,周围是项目、线程或示例入口。
- 讲清楚 Codex 能做代码修改、解释、审查、运行命令。
- 强调它会围绕工作区文件行动,不是普通聊天窗口。
创建或选择一个工作区
引导学员选择本地项目文件夹或连接仓库。新手建议先用练习目录,避免一开始就把真实项目交给 Codex 大改。
- 确认目录里有可识别的入口文件、README 或 package 配置。
- 如果是空目录,也要明确要生成什么文件。
设置环境与权限
环境、命令输出和配置区域是理解“安全边界”的重点:Codex 能不能联网、能不能写文件、需要不需要审批,都会影响执行方式。
- 新手用默认权限即可,先理解每次审批意味着什么。
- 团队项目要先读项目里的 AGENTS.md 和权限策略。
写第一条任务提示
不要让学员只输入“帮我做个网站”。这一课要示范一条完整提示:目标、上下文、约束和验收标准一起写。
- 目标:做一个 Codex 中文教程页面。
- 约束:参考文档站布局,左侧目录,中间正文,右侧页内目录。
- 验收:文件可打开,移动端不乱,最后说明资料来源。
让 Codex 先读项目再计划
计划、日志和步骤区域是 Codex 的执行轨迹。学员要学会先看计划,而不是急着接受代码。
- 检查它有没有读到正确文件。
- 检查计划是否覆盖设计、内容、验证三个部分。
观察命令输出和中间结果
当 Codex 运行命令或读取文件时,终端输出不是噪音,而是证据。课程要教学生看 exit code、错误信息、缺失依赖和测试结果。
- 成功输出要能对应到任务目标。
- 失败输出要先定位原因,再决定是否改提示或改配置。
查看文件改动和差异
代码、文件和结果区域用来训练“不要盲接收改动”。学员要知道新增了哪些文件、改了哪些段落、有没有越界改动。
- 看新增文件是否和目标一致。
- 看是否修改了不相关配置、锁文件或敏感文件。
用浏览器验证界面
对页面类任务,必须打开浏览器看结果。课程里要检查桌面视口、移动端视口、长页面滚动、目录点击和搜索框交互。
- 桌面端检查三栏布局是否稳定。
- 移动端检查侧栏是否自然下沉,文字是否溢出。
失败时如何追问
如果页面空白、命令报错、链接打不开,不要重新开一个模糊任务。直接把错误贴回同一线程,让 Codex 基于现场继续排查。
- 给它完整报错,而不是只说“不行”。
- 要求先定位根因,再做最小修复。
把好用的要求沉淀进 AGENTS.md
当你发现某些提醒每次都要说,就把它写成项目规则。例如“页面改动后必须浏览器验证”“中文教程不要堆术语”“引用资料要列链接”。
- 全局规则适合个人习惯。
- 项目规则适合团队约定和特定目录。
把稳定任务做成可复用流程
当一个流程反复出现,就适合讲 Skills、MCP 和自动化:先手动跑通,再封装,再定期运行。
- Skills 适合固定流程和模板。
- MCP 适合接外部资料、浏览器、设计稿或内部系统。
- Automations 适合已经稳定的重复任务。
交付总结:改动、验证、风险
每节课最后都要让学员看到标准交付格式。Codex 不只要说“完成了”,还要交代它改了什么、跑了什么检查、哪些地方没能验证。
- 改动:列文件和核心内容。
- 验证:列命令、浏览器检查结果。
- 风险:列未覆盖、依赖外部变化、需要人工补充的内容。
请学员选择一个空文件夹,发出一条完整任务提示,让 Codex 创建一个单页教程;完成后检查文件、打开页面验证,然后把好用的要求写进
AGENTS.md。
Codex 国内站使用教程
这一节讲国内用户如何用第三方国内站跑通 Codex:先确认入口和服务规则,再完成注册、订阅、客户端安装、CC-Switch 接入,最后用一个小任务验证配置是否可用。
适合被网络、手机号、官方支付或模型权限卡住,但想先体验 Codex 编程 Agent 和图像能力的用户。
先用空目录和小任务验证流程,不要一开始连接公司仓库、主力账号或长期 Key。
能登录、能生成 API Key、能在客户端发起任务、能看到结果和用量,就算第一阶段跑通。
注册、订阅与下载
打开入口并注册
示例登录入口:codex.maynor1024.live/login。如果你在国外网络环境,也可以尝试 codex.chatgpt-plus.top/login。打开后先确认域名、HTTPS 状态、登录方式和服务说明。
选择套餐或充值
购买入口示例:maynorai.jichiyun.sbs/buy/30。购买前看清楚按量、包月、每日额度、支持模型、退款和售后规则。
下载客户端
Mac 可下载 Codex.dmg;Windows 优先使用微软商店,也可按课程提供的安装包方式安装。下载来源变化时,以当前可访问页面为准。
CC-Switch 接入
新建 API Key
在国内站后台找到 API Key 管理页,新建一个专门给 Codex 使用的 Key。建议给它单独命名,方便以后停用或更换。
填写 URL 和 Key
打开 CC-Switch,把国内站提供的接口地址和 API Key 填进去。保存前检查 URL、Key、空格和换行,复制错一个字符都会导致鉴权失败。
选择模型
代码任务把模型名设置为 gpt-5.5;图像任务使用 GPTimage2 对应入口或模型配置。模型名称以站点后台实际显示为准。
| 能力 | 适合任务 |
|---|---|
| GPT-5.5 | 代码生成、项目重构、复杂调试、自动化脚本、把多个开发步骤串成 Agent 工作流。 |
| GPTimage2 | 公众号配图、小红书封面、海报草图、网站视觉素材和内容创作者的图片需求。 |
第一次国内站任务
第一次不要直接让 Codex 改真实项目。建一个空文件夹,明确告诉它要做什么、不要碰什么、怎么验证。任务越小,越容易判断国内站、Key、模型和客户端是否配置正确。
帮我修改首页文案
帮我整理 README
帮我加一个英文版页面
帮我修复样式问题
帮我把项目推送到 GitHub
确认账号和额度
发任务前先看账号是否已登录、套餐或余额是否正常、模型是否可用。额度和计费信息只看当前后台,不要记死教程里的旧数字。
- 确认当前使用的是测试目录。
- 确认没有上传敏感文件或长期凭据。
写清楚任务提示
国内站也要按“目标、上下文、约束、完成标准”来写。不要只写“帮我做一个网站”,否则模型很难判断边界。
- 目标:生成一个 Codex 入门教程页。
- 约束:单文件 HTML,不读取账号、Key、余额等敏感信息。
- 完成:说明生成文件、打开方式和验证结果。
观察执行过程
执行时重点看三件事:任务有没有开始、有没有报错、有没有消耗额度。报错时保留完整错误文字,后续排查比只描述“失败了”更有效。
- 鉴权失败:优先检查 URL、Key 和模型名。
- 额度失败:检查套餐、余额或每日限制。
检查生成结果
如果任务生成了文件,先检查文件名和内容是否符合要求,再打开页面或运行验证命令。不要只看模型回复“完成了”。
- 页面类任务:打开 HTML 或预览地址。
- 代码类任务:运行最相关的测试、构建或命令。
把可复用要求保存下来
如果某些要求每次都要说,比如“不要输出 API Key”“先说明改动范围”“最后列验证结果”,就写进项目的 AGENTS.md 或自己的提示词模板里。
- 固定流程写成模板。
- 安全要求写成项目规则。
国内站常见问题
不是。它是第三方入口,适合解决国内访问和支付门槛。官方权益、限制和模型能力仍以 OpenAI 官方页面为准。
课程入口主打降低注册门槛,但具体验证规则可能随服务调整。遇到变化时,以当前页面提示为准。
不建议一开始就处理公司私有代码。先用公开示例或练习目录跑通,确认服务条款、隐私规则和团队要求后再决定。
按顺序查:账号状态、套餐余额、API Key、接口 URL、模型名称、客户端配置、任务提示和当前网络。
我正在用一个空目录练习 Codex。请先说明你能访问和修改哪些内容,再创建一个单文件中文教程页。页面包含标题、三个步骤、一个代码块和资料来源。不要读取或输出任何账号、API Key、余额、付款信息或私有仓库内容。完成后说明文件位置、打开方式和验证结果。
Codex 指令保姆级教程
这个话题整理自 Oldeng 的 X 文章。它的核心提醒很实用:Codex 不是单纯聊天机器人,更像坐在项目目录里的 AI 编程同事。普通 prompt 是让它干活,斜杠指令则是管理它怎么工作。
普通 prompt = 让 Codex 干什么活,斜杠指令 = 管理 Codex 这个工具。指令必须放在输入开头;忘了有哪些指令,就先输入 / 看本机列表。
先记一句话
普通 prompt = 让 Codex 干什么活,斜杠指令 = 管理 Codex 这个工具。指令必须放在输入开头;忘了有哪些指令,就先输入 / 看本机列表。
新手先掌握这 10 条
/init:让 Codex 认识项目
第一次进入项目先生成或完善 AGENTS.md,把启动命令、测试命令、禁止修改目录和项目规矩写清楚。
/status:确认当前状态
查看模型、权限、目录、上下文等信息。担心改错目录、模型没切对、权限不确定时先看它。
/model:选择合适模型
改文案、小函数解释用快模型;大型重构、复杂 bug、陌生代码库分析、安全敏感改动用强模型。
/permissions:控制能做什么
新手、生产项目、老项目或没有 git 的目录,先保守授权。等你熟悉它的行为,再逐步放开。
/plan:大任务先想清楚
重构、迁移、性能优化、多文件修改和风险不确定任务,先让它读上下文、拆风险、出最小方案。
/mention:点名文件
只想分析某个报错文件、组件或配置时,直接把文件给它,避免它在整个项目里过度搜索。
/diff:看真实改动
Codex 的总结可能漏细节,diff 不会。每次改完先看新增、删除、未跟踪文件和实际代码变化。
/review:切到审查视角
提交前让它检查 bug、行为回归、缺测试、边界条件和安全风险。推荐先 /diff 再 /review。
/compact:压缩长对话
聊久了会慢、会贵、上下文会乱。压缩前可以明确要求保留结论、已改文件、剩余 bug 和测试失败信息。
/resume:继续历史任务
跨天开发、大项目迁移、长时间 debug、分阶段任务,回来后从历史会话继续,不用重新交代全部上下文。
/side 和 /fork 别混
| 指令 | 适合场景 | 不要拿来做什么 |
|---|---|---|
/side |
临时问一句、检查方案风险、解释概念,不想污染主线。 | 复杂多轮讨论、长期保存实验路线、认真实现另一套方案。 |
/fork |
开一条新路线,比较两个架构,保留主线同时试另一种实现。 | 只是问一个小判断,或者没有能力区分主线和实验线时乱开分支。 |
第一次用 Codex,照这个顺序走
进入项目并初始化
运行 codex 后先用 /init,把项目规则写入 AGENTS.md。
确认状态再读项目
用 /status 看当前目录和权限,然后要求它先读结构、启动命令、测试命令和危险目录,不要直接改。
大任务先计划
用 /plan 描述问题,让它定位相关文件并给最小改动方案。你确认后再让它实现。
改完必须验收
先 /diff 看真实改动,再 /review 做提交前审查,最后运行项目测试或打开页面检查。
直接可复制的提示
/plan 帮我修复登录页提交后 loading 状态不消失的问题。
先定位相关文件,给出最小改动方案,不要直接改代码。
按方案实现,保持改动尽量小。
/diff
/review
/ 后显示的列表为准。
第 04 章不是资料目录,是直播课的核心成交资产
这一章把 6 个可展示项目拆成学员能跟做的交付链路。每个项目都要讲清目标、提示词、执行、验收和复盘,让观众感觉买到的是一套项目生产系统,而不是几条操作步骤。
操控浏览器:让 Codex 帮你看页面、点页面、验页面
这个项目适合做成第一篇实战文章:目标不是讲浏览器概念,而是让学员看到 Codex 如何打开本地页面、检查按钮、验证画面、定位布局问题,并把发现转成可执行修改。
实战任务
打开一个本地网页,检查导航、表单、移动端布局和页面状态,最后输出问题清单和修复建议。
交付物
一份可复用提示词、一份页面验证记录、一个“浏览器检查完成”的验收清单。
询盘外贸独立站:从产品展示到表单线索
这篇文章把 Codex 当成外贸站搭建助手:先确定产品、客户国家、卖点和询盘字段,再生成首页、产品区、信任背书、FAQ、联系表单和移动端布局。重点是让页面服务于询盘,不做空泛展示。
一人公司微信小程序:把业务入口做轻
一人公司不适合一开始做复杂系统。这篇文章可以演示如何用 Codex 规划小程序页面:服务介绍、预约咨询、案例展示、资料领取、客服入口和后台数据结构。先做能获客和承接咨询的版本。
适合业务
咨询、培训、本地服务、设计交付、AI 自动化服务、轻量电商预约。
Codex 工作
拆页面、写组件、生成示例数据、整理发布前检查项。
个人网站:把你是谁、能做什么、怎么联系你讲清楚
个人网站项目适合用来练“从模糊需求到完整页面”。文章可以让学员准备个人定位、作品、服务、社交链接和联系方式,然后让 Codex 生成一个简洁可信的单页网站。
重点不是炫技,而是让访问者在一分钟内明白你的专业方向、代表作品和下一步联系动作。
产品宣传视频:从卖点到脚本、分镜和成片素材
这篇文章展示 Codex 如何辅助做视频前期:提炼产品卖点、写 30 秒脚本、拆分镜、生成字幕文案、列素材清单,再把这些内容整理成可交给剪辑工具或视频生成工具的制作说明。
PPT:把想法整理成能讲的演示稿
PPT 项目适合教用户把散乱资料交给 Codex 整理成结构化表达。文章可以覆盖:确定听众、提炼标题、搭建 8 到 12 页大纲、写每页讲稿、生成视觉建议,并检查逻辑断点。
输入
主题、听众、演讲时长、已有资料、希望对方听完采取的动作。
输出
PPT 大纲、逐页文案、演讲备注、配图建议和最终检查清单。
Codex 终极实战:本地化 Agent 超级应用
如果你同时在用 ChatGPT、Claude、Claude Code 或 Codex,最容易卡住的问题不是“哪个更强”,而是什么时候该用哪个。ChatGPT 和 Claude 更像云端对话工具,适合讨论、提问、改写和推理;Codex 更像能进入本地工作区的 AI Agent,适合处理文件、生成交付物、调用工具、控制浏览器和电脑。
Codex 终极实战:Agent 超级应用上手手册
Codex 看起来像 Claude Code,因为它也能围绕代码和项目工作;它也像 ChatGPT,因为你可以开对话。但它最重要的定位是本地化 Agent 超级应用:上传、读取、生成和修改的文件都围绕你的电脑展开。这个差异让它能做很多普通聊天窗口不适合做的事,比如生成落地页、制作动态图形视频、开发小应用、整理 Excel 和 Word 文档、创建演示文稿,甚至把结果继续导入 Canva。
这篇手册按原文逻辑梳理 Codex 的核心能力:完整的文件访问权限、Project 管理文件、agents.md 和 memories 记忆系统、插件生态、Skill 系统、GPT Image 图像生成、浏览器控制和电脑控制、自动化,以及研究预览功能 Chronicle。重点不是堆概念,而是理解每个能力在工作流里的位置。
能力 1:完整的文件访问权限
Codex 的第一个关键能力,是它能在授权范围内访问本地文件。ChatGPT 的文件通常存在云端对话里,Codex 则围绕你的电脑和项目目录工作。也就是说,它不只是“读一个附件”,而是可以找到文件夹、读取一批文件、生成新文件,并把产物留在你的本地目录里。
真实案例:自动处理 60 张收据
Downloads 文件夹里有一个“receipts to process”文件夹,里面有 60 张收据照片。用户让 Codex 分析这些收据,在 Excel 表格里整理交易类型和其他模式。
Codex 做了什么
它找到文件夹,对 53 张收据做 OCR,提取文本,给交易分类,然后在本地电脑上创建了一个 Excel 工作簿。
产物长什么样
Excel 里有总支出、收据类别汇总、支付方式汇总、月度趋势图。这个文件可以直接打开、编辑和分享。
为什么这很重要
它说明 Codex 不是只会回答“怎么做”,而是可以真的去处理你电脑里的资料,并输出一个可继续使用的文件。
用 Project 管理文件
既然 Codex 的文件都落在电脑上,就需要用 Project 管理。直接创建 Chat 时,对话会显示在侧边栏,但不一定归入一个具体项目;创建 Project 时,它会连接到你电脑上的一个文件夹。以后 Agent 在这个项目对话中创建的文档、脚本、表格或页面,都会更自然地留在这个项目文件夹里。
能力 2:持久化记忆,agents.md 记偏好,memories 记过程
Codex 有两类记忆。第一类是手动记忆,常见载体是 agents.md。你可以告诉 Agent 以后遇到某类任务要遵守什么风格、流程或限制,它会把这些偏好写进去。比如你喜欢某种落地页结构,可以让它记住:以后没有指定样式时默认使用这种版式,文本多时要加目录。
第二类是自动记忆,常见位置是 memories 文件夹。它记录 Agent 做过的任务和过程经验,随着时间自动优化。这个文件夹可以观察,但不建议手动修改。简单说,agents.md 是你主动写给 Codex 的规则,memories 是 Codex 自动积累的过程记录。
能力 4:Skill 系统,把工作流程沉淀成 SOP
Skill 系统是 Codex 最值得重视的能力之一。你可以把 Skill 理解成可复用的工作流程配方:每次 Agent 使用某个 Skill,都会按里面的说明执行同一套流程。它不是普通提示词,而是能被反复调用、持续优化的 SOP。
方式 1:提示词转技能
直接让 Codex 创建一个技能,比如 brand deal analysis。这样速度快,但因为没有真实迭代,质量可能比较粗。
方式 2:手动工作流程法
先让 Codex 完成一次任务,来回修改到满意,再说“我对这个输出满意了,把它变成一个技能”。这种方式更可靠。
原文里的例子是品牌合作邮件整理。先让 Codex 把品牌合作邮件整理成电子表格,表格按优先级做颜色标记,等输出质量满意后,再沉淀成 brand deal researcher。以后按斜杠键调用这个 Skill,就能复用同样的研究和整理流程。
Skill 也可以持续优化。每次使用技能,如果你发现某种格式更好、某个字段应该固定出现、某个插件应该一起调用,就可以让 Codex 更新这个 Skill。长期看,Skill 是把一次好结果变成稳定生产力的关键。
能力 3:插件生态,用 @ 调用外部工具
插件生态让 Codex 不只停留在本地文件夹里。插件是可安装、可重用的包,可以把 Codex 连接到 Gmail、Notion、Slack 等外部工具和工作流程。调用方式通常是用 @ 符号提及插件。
Gmail 插件案例
创建 Brand Deals 项目,让 Codex 查看过去两周邮件,找出所有付费推广、赞助、品牌合作机会,做研究并整理成表格和笔记。
Notion 插件案例
让 Codex 读取你过去写过的脚本,再按你的表达风格生成新脚本。它不只是拿资料,而是把外部内容转进当前工作流。
能力 5:GPT Image 直接生成图片
Codex 内置 GPT Image,可以直接在项目里生成图片。原文的例子是产品照片:用户创建 content 项目,上传一张毛衣图片,然后要求生成 5 张不同国籍模特穿着毛衣的产品照片,其中有单人照、三人照和五人照。生成结果会直接存储在 content 项目文件夹里。
能力 6:浏览器控制和电脑控制
Codex 可以像人一样控制浏览器和电脑。一个案例是用 @computer use 打开 Canva,创建 Canva 演示文稿,并把 5 张图片分别放进 5 页幻灯片。另一个案例是用 @browser use 自动测试网页应用:打开页面、点击开始按钮、滚动、选择测验、测试侧边栏,确认按钮和导航都能正常工作。
能力 7:自动化,把任务变成定时任务
当一个任务可以重复执行,就可以变成自动化。比如前面创建了品牌合作分析 Skill,就可以让 Codex 每周五上午 9 点运行一次:扫描 Gmail 里的付费推广、赞助和品牌合作邮件,更新品牌合作表格。自动化页面里可以看到运行时间、状态、上次运行时间,也可以随时编辑。
补充能力:Chronicle 实时监控屏幕上下文
Chronicle 是一个研究预览功能,需要在设置中手动开启。它会持续记录屏幕,从你最近打开的页面、演示文稿或工作内容里提取上下文。比如你打开了一个 Codex 视觉演示文稿,它可以根据屏幕内容建议补充“Codex 超级应用地图”“提示词文件的完整控制循环图”“Chronicle 演示幻灯片”等内容。
最后的判断
Codex 不是“更好的 ChatGPT”。ChatGPT 是云端对话工具,适合问问题、讨论思路、改写文本;Codex 是本地化 Agent 超级应用,适合处理本地文件、构建可复用工作流程、控制浏览器和电脑,并把成果留在你的项目里。如果只是偶尔问问题,用 ChatGPT 就够了;如果要把 AI 接进真实工作流,Codex 才是主要工具。
一句话安装 Hermes Agent,微信全能秘书
这一篇基于刘小排的文章《一句话安装Hermes Agent,从此享有全能秘书》整理。文章的核心不是讲一个复杂部署教程,而是展示 Codex 可以直接帮你安装和配置 Hermes Agent,并通过微信 Clawdbot 变成一个能处理微信消息的个人秘书。
Hermes Agent 是什么
Hermes 是一个更适合大多数人使用的通用 Agent。原文把它和小龙虾 OpenClaw 做了对比:OpenClaw 更像某个具体方向的工具,Hermes 则更像可以长期陪伴、处理多类任务的全能秘书。它的关键特点是发挥稳定、记忆能力强、能够自我进化。
文章里的典型场景是微信消息管理。亦仁问 Hermes:“刘小排最近一周都说过啥?”Hermes 可以把共同微信群里刘小排说过的话总结出来。这说明它不只是一个聊天机器人,而是能围绕真实信息源做读取、总结和提醒的 Agent。
一句话安装 Hermes Agent
文章强调:安装 Hermes 并不难,关键是先准备好前提条件,然后把安装、配置、测试交给 Codex。
前提条件
需要配置好海外的网络环境;已经安装 Codex;并且购买了 ChatGPT Plus/Pro 套餐。
Codex 设置
在电脑上随便建一个文件夹,在 Codex 中选中这个文件夹;权限选择完全访问权限,模型选择 GPT-5.5 xhigh。
原文给出的核心提示词是:
在当前文件夹安装Hermes Agent,
让它使用我系统中的codex的GPT-5.5 xhigh模型
然后配置好,测试通过,并且让我扫码就可以直接绑定微信Clawdbot
发出这条指令后,Codex 会在当前文件夹里完成 Hermes 的安装、配置和测试。原文提到整个过程大概需要 10 分钟,完成后会出现扫码绑定界面。
扫码绑定微信 Clawdbot
Hermes 安装完成后,下一步是用微信扫码绑定 Clawdbot。绑定后,它就可以作为微信里的 Agent 入口使用。原文还提到,微信 Clawdbot 可以改头像、改名字,所以它可以伪装成一个更自然的微信联系人形态。
绑定之后,可以直接问 Hermes:“我有哪些重要的微信消息需要回复和关注?”这类问题体现的是它作为微信全能秘书的价值:不是替你泛泛聊天,而是帮你从消息流里找到重点,整理需要处理的事项。
文章最后也提醒,读取和总结微信消息存在一定风险,不适合大范围公开传播。这个项目真正要理解的是:Codex 不只是写代码工具,它可以成为安装、配置和测试其他 Agent 的入口;而 Hermes 则把 Agent 能力延伸到微信消息管理场景里。
提示词模板
让 Codex 解释项目
请先阅读当前项目结构和关键文件,然后用中文说明:
1. 这个项目是做什么的。
2. 主要入口文件在哪里。
3. 本地运行、构建、测试命令分别是什么。
4. 新手继续开发时最需要注意的 3 件事。
让 Codex 修 bug
现象:描述 bug 如何出现。
复现:列出具体步骤和输入。
期望:说明正确行为。
约束:请先定位根因,不要大范围重构。
完成:修复后运行相关测试,并说明为什么这个修复覆盖了复现路径。
让 Codex 做教程内容
请基于官方文档和当前项目内容,整理一篇中文教程。
要求:
- 先给目录,再写正文。
- 每一节都要有“做什么、为什么、怎么验证”。
- 把不确定或会随时间变化的信息标注为“以官方页面为准”。
- 最后列出资料来源链接。
常见问题
我不会写代码,可以用 Codex 吗?
可以,但要从小任务开始。让 Codex 解释文件、生成简单页面、整理表格、写教程,比一上来让它重构大型系统更合适。
Codex 会不会乱改我的文件?
本地工作时它会在当前项目和权限范围内行动。新手应该使用练习目录、版本控制、默认审批和沙箱设置;在最终接受改动前查看 diff。
什么时候用 Cloud,什么时候用 Local?
本地适合你要立刻看文件、运行本机工具、检查页面的任务。Cloud 适合委托后台任务、并行尝试、从 GitHub 仓库开 PR 的任务。
教程里要不要写模型价格和限额?
可以写入口和查询方法,但具体价格、限额、包含计划变化很快,页面中应提示以官方定价页和帮助中心为准。
调研来源
这一版内容优先整合官方资料,再补充开源仓库信息。后续你加入自己的实操经验时,可以把“官方事实”和“个人经验”分开标注。
- OpenAI Developers: Codex web / cloud
- OpenAI Developers: Codex app
- OpenAI Developers: Codex CLI
- OpenAI Developers: Codex IDE extension
- OpenAI Developers: Codex prompting
- OpenAI Developers: Codex best practices
- OpenAI Developers: AGENTS.md
- OpenAI Developers: Model Context Protocol
- OpenAI Help Center: Using Codex with your ChatGPT plan
- GitHub: openai/codex
- 飞书云文档:Codex 中国站使用教程
- Oldeng:Codex 指令保姆级教程