Content OS 技术架构文档
本文档描述何庆(heqing@farsthink.com)的 AI 内容生成系统的完整技术架构。 版本:v1.0 | 日期:2026-04-30 | 维护者:Hermes Agent
一、系统概述
Content OS 是一套以 Hermes Agent 为核心调度层的 AI 内容生产流水线。
它的目标很直接:把一个模糊的问题,变成一篇高质量的公众号文章,中间经过多角色对抗辩论、多写手并行创作、资深编辑审校,全流程无需人工介入。
目前已稳定运行,完成 Q003 到 Q030 累计十余篇定稿,覆盖「老实人困境」「短视频」「AI与真相」「独立个体」等主题。
二、系统架构(分层视图)
┌─────────────────────────────────────────────────────────────┐
│ 调度层:Hermes (CEO) │
│ 理解意图 → 拆解任务 → 调度Agent → 质量验收 │
└─────────────────────────────────────────────────────────────┘
│
┌─────────────────────────────────────────────────────────────┐
│ 触发层:Trigger Box │
│ inbox (待评分) → bank (精选) → cron每小时整点扫描 │
│ 8种触发类型:问题/台词/感受/事件/剧集/新闻/历史/场景 │
└─────────────────────────────────────────────────────────────┘
│
┌─────────────────────────────────────────────────────────────┐
│ Stage 1:鲶鱼激活的对抗辩论层 │
│ │
│ 组1 ──并行── 组2 鲶鱼(轮值) │
│ 芒格 vs 曾国藩 → 老喻/塔勒布/李诞/ │
│ 达里奥 vs 塔勒布 张雪峰/咪蒙 │
│ │ │
│ 强制对抗 → 找共同盲区 → 输出分歧结论 │
└─────────────────────────────────────────────────────────────┘
│
┌─────────────────────────────────────────────────────────────┐
│ Stage 2:多写手并行创作层 │
│ │
│ 苏小暖 ──情绪共鸣──→ 初稿 ──┐ │
│ 老 陈 ──认知深度──→ 初稿 ──┼──→ 老周审校 → 定稿1(最佳) │
│ 老 高 ──高管真相──→ 初稿 ──┤ │
│ 卡兹克 ──AI圈视角──→ 初稿 ──┴──→ 直接保留 → 定稿2(独立) │
│ │
│ 4个写手全部并行,各自独立,互不等待 │
└─────────────────────────────────────────────────────────────┘
│
┌─────────────────────────────────────────────────────────────┐
│ Stage 3:咪蒙爆款标题层 │
│ 8种标题类型 + 40+公式 + 985篇标题语料 │
│ 生成3个备选标题,供发布前选用 │
└─────────────────────────────────────────────────────────────┘
│
┌─────────────────────────────────────────────────────────────┐
│ 产出层:定稿仓库 │
│ │
│ 定稿/ ← 老周宣布的最佳稿 + 审校报告 │
│ 定稿2/ ← 卡兹克版,无论评分如何保留 │
│ materials/ ← Stage1产出(辩论素材) │
│ writers/tmp/ ← Stage2初稿(各写手目录) │
└─────────────────────────────────────────────────────────────┘
三、核心模块详解
3.1 调度层:Hermes Agent
Hermes 是整个系统的 CEO 和总操盘手。
它的职责不是埋头写代码,而是:
- 理解用户真正的意图(区分表面需求和本质需求)
- 把模糊目标变成清晰战略(定方向、定优先级)
- 拆解任务并调度合适的 Agent 执行
- 控制交付质量(什么是真的完成,什么是假完成)
- 守住用户的认知主权(帮用户看清局势,而不是替用户做决定)
在 Content OS 里,Hermes 的具体工作是:
- 读取 bank.md 找到待触发问题
- 计算鲶鱼轮值
- 调度多组辩论并行执行
- 收集辩论素材后分发给4个写手
- 汇总初稿交给老周审校
- 把最佳稿移制定稿目录
- 更新 bank 状态
3.2 触发层:Trigger Box
Trigger Box 是统一的输入入口,取代了早期的 question-box。
8种触发类型:
| 类型 | 说明 | 典型信号 |
|---|---|---|
| 01-问题 | 有明确疑问句的核心问题 | "为什么..." "要不要..." |
| 02-台词 | 有张力的对话/引用 | 某人的一句话引发思考 |
| 03-感受 | 情绪触发点 | "我感到..." "让人难受的是..." |
| 04-事件 | 新闻/热点事件 | 东方甄选F4离职 |
| 05-剧集 | 影视内容触发的思考 | 某部剧的某个场景 |
| 06-新闻 | 时事类 | 行业动态 |
| 07-历史 | 历史事件 | 某个历史人物决策 |
| 08-场景 | 真实场景片段 | "我见过最xx的人..." |
流转机制:
inbox.md (新素材) → 评分 → bank.md (精选) → cron每小时扫描 → 流水线
bank.md 里的每条问题包含:
- Q编号(唯一标识)
- 问题正文
- 触发类型
- 触发角色(决定4智者组合)
- 状态(📋待触发 / ✅已触发)
- 可选:鲶鱼字段(手动指定覆盖轮值)
3.3 Stage 1:鲶鱼激活的对抗辩论层
这是整个流水线质量最高的节点,也是最有特色的设计。
为什么需要对抗辩论?
内容工厂的核心假设是:真正有价值的不是素材本身,而是智者之间产生的分歧点。这个分歧就是文章的骨架和张力所在。
如果4个智者各自亮完观点就结束,输出的只是"四段读后感",写手照着素材写出来的也是综述感,没有内在张力。
结构设计(v2.1+):
Step 1: 组1辩论(芒格 + 曾国藩)
Step 2: 组2辩论(达里奥 + 塔勒布)
↓ 并行执行,不放一个prompt里
Step 3: 鲶鱼反驳(Q%5轮值,至少反驳2个观点)
↓
合并输出:核心分歧结论 + 文章骨架建议
鲶鱼池(5人轮值):
Q%5 = 0 → 老喻(概率算法、人生算法)
Q%5 = 1 → 塔勒布(反脆弱、风险杠精)
Q%5 = 2 → 李诞(嘴毒解构、荒诞现实)
Q%5 = 3 → 张雪峰(教育现实主义)
Q%5 = 4 → 咪蒙(情绪传播、爆款直觉)
bank.md 可手动指定 鲶鱼:字段覆盖轮值。
鲶鱼的核心价值:不是打倒某个人,而是找到"所有人都在讨论但没人说透"的那层窗户纸。
实战教训(Q030):老喻发现"所有人讨论'是否展示',没人讨论'何时展示'"——这个共同盲区被三个写手全部当核心论点写,效果极好。
3.4 Stage 2:多写手并行层
4个写手,各有分工:
| 写手 | 定位 | 风格 | 字数 |
|---|---|---|---|
| 苏小暖 | 情绪共鸣型 | 前记者,画面感,共情强 | 1800-2500 |
| 老陈 | 认知深度型 | 前杂志编辑,框架感,反直觉 | 2000-2800 |
| 老高 | 高管真相型 | 前百度CMO,权力视角,刺 | 1500-2200 |
| 卡兹克 | AI圈洞察型 | 数字生命卡兹克,圈内视角,自嘲幽默 | 3000-6000 |
并行机制:4个写手同时开工,互不等待。每批最多3个并发(delegate_task 默认限制)。
卡兹克的独立通道:卡兹克的稿子不参与老周评分竞争,无论评分如何直接保留为「定稿2」。原因:卡兹克的读者是AI从业者,有自己独立的价值维度,和通用公众号稿的评价体系不同。
3.5 审校层:老周
老周,52岁前《十月》《三联》首席编辑,内容工厂的「总编室」。
职责:
- 审校苏小暖/老陈/老高三篇初稿
- 宣布本轮最佳稿
- 检查虚构引用(这是 v2.2.1 新增的专项审查)
- 对卡兹克稿提供技术准确性点评(仅供参考,不参与竞争)
虚构引用专项:所有「XX(名人)说:...」格式的引用必须可查证。典型要警惕的模式:
- 「芒格说:展示功劳是一种逆向激励」(疑似虚构)
- 「曾国藩说:沉默是金」(后人附会,非原文)
3.6 咪蒙爆款标题层
基于985篇咪蒙标题分析蒸馏出的标题操作系统。
8种标题类型:
| 类型 | 占比 | 典型公式 |
|---|---|---|
| 二元撕裂型 | 最高效 | 「有钱人喜欢丑女人」 |
| 第一人称共鸣型 | 情绪刚需 | 「我就是那个985废物」 |
| 疑问挑衅型 | 引发好奇 | 「凭什么xx?」 |
| 数字刺激型 | 信息暗示 | 「3个技巧,99%的人不知道」 |
| 极端情绪型 | 情绪引爆 | 「终于有人敢说了」 |
| 热点嫁接型 | 蹭流量 | 「xx事件告诉我们...」 |
| 身份标签型 | 圈层认同 | 「985学霸才知道的真相」 |
| 反常识颠覆型 | 认知冲突 | 「努力反而是毒药」 |
核心发现(反直觉):顶级爆款64%是纯陈述句,感叹句是辅助钩子而非主力。
3.7 产出层:定稿仓库
/mnt/d/hqking/
├── trigger-box/
│ ├── bank.md ← 精选问题库
│ ├── inbox.md ← 待评分素材
│ └── archive.md ← 已触发归档
├── materials/ ← Stage1产出(辩论素材)
├── writers/
│ ├── tmp/suxiaonuan/ ← 苏小暖初稿
│ ├── tmp/laochen/ ← 老陈初稿
│ ├── tmp/laogao/ ← 老高初稿
│ ├── tmp/khazix/ ← 卡兹克初稿
│ ├── editorial/ ← 老周审校稿
│ ├── 定稿/ ← 最佳定稿 + 审校报告
│ └── 定稿2/ ← 卡兹克版(独立保留)
└── question-box/
└── factory.log ← 流水线运行日志
四、安装与启动
4.1 环境要求
- 系统:WSL(Windows Subsystem for Linux)或 Linux
- Hermes Agent:v0.10.0+
- Python:3.11+
- uv:包管理器
- API Key:MiniMax CN API(配置在
~/.hermes/.env)
4.2 安装步骤
Step 1:克隆 skills 仓库
skills 仓库托管在 GitHub + Gitee 双平台:
# GitHub
git clone git@github.com:wuqing1982/hermes-skills.git ~/.hermes/skills/skills
# 或 Gitee(国内更快)
git clone git@gitee.com:hqking22/hermes-skills.git ~/.hermes/skills/skills
Step 2:安装核心依赖
skills 目录结构:
~/.hermes/skills/skills/
├── content-factory/ ← 核心流水线skill
├── khazix-writer/ ← 卡兹克写手skill
├── mimeng-skill/ ← 咪蒙内容方法论
├── mimeng-title-skill/ ← 咪蒙爆款标题
├── perspective/ ← 智者人物profile
│ ├── munger-perspective/
│ ├── taleb-perspective/
│ ├── zeng-guofan-skill/
│ ├── dalio-principles-skill/
│ └── ...
└── senior-editor/ ← 老周审校skill
Step 3:配置 API Key
# 编辑环境变量
nano ~/.hermes/.env
# 添加:MINIMAX_CN_API_KEY=sk-cp-xxxxxStep 4:配置定时任务(可选)
每小时整点自动扫描 bank 并触发流水线:
# 查看当前cron
cronjob list
# 创建新job
cronjob create \
--name "Content Factory Cron" \
--schedule "0 * * * *" \
--prompt "执行Content Factory流水线。读取/mnt/d/hqking/trigger-box/bank.md,找到第一个📋待触发的问题,跑完整流水线(Stage1辩论→Stage2写手→Stage3标题→定稿→bank状态更新)。完成后汇报结果。" \
--skills content-factory
4.3 手动启动流水线
两种方式:
方式1:Hermes 对话触发
用户:跑流水线
Hermes:读取bank.md → 找到待触发问题 → 调度Stage1 → Stage2 → Stage3
方式2:直接执行
# 找到待触发问题
# bank.md 中状态为「📋待触发」的第一条
# 手动跑Stage1(辩论)
# 调用 delegate_task 并行执行组1+组2辩论
# 手动跑Stage2(写手)
# 调用 delegate_task 并行执行4写手
# 手动跑Stage3(审校+标题)
# 调用老周审校 skill五、运转机制
5.1 完整流水线时序
用户/定时触发
│
▼
Hermes 读取 bank.md
│ 找到第一个📋待触发问题
▼
计算 Q%5 确定鲶鱼轮值
│
├──▶ Stage1-A: 组1辩论(芒格+曾国藩)
├──▶ Stage1-B: 组2辩论(达里奥+塔勒布)
│ ↓ 并行,约5分钟
├──▶ Stage1-C: 鲶鱼反驳(至少2个观点)
│ ↓ 约2分钟
▼
合并辩论素材(核心分歧+骨架建议)
│
├──▶ 写手1: 苏小暖 ──并行── 写手2: 老陈
├──▶ 写手3: 老高 ──并行── 写手4: 卡兹克
│ ↓ 约8分钟
▼
老周审校(前3篇) + 卡兹克直接定稿2
│
▼
移制定稿/ + 更新bank状态 + 咪蒙标题
│
▼
流水线完成
总耗时:约 20-30 分钟(视素材复杂度)
5.2 质量控制机制
三层质量门:
L1 硬性规则:禁用词扫描、禁用标点扫描、结构性套话扫描
- 执行者:各写手在提交前自检
L2 风格一致性:开头检查、节奏检查、口语化检查
- 执行者:卡兹克使用四层自检体系
L3 资深编辑审校:老周逐篇审查,标注错误,宣布最佳
- 执行者:老周(52岁前首席编辑)
虚构引用专项:逐篇检查名人引用是否可查证
- 执行者:老周(v2.2.1+ 新增)
六、核心优势
6.1 对抗性辩论设计
大多数 AI 内容系统是"单源输入 → 单篇输出"。Content OS 的差异在于强制产生分歧,通过两组辩论 + 鲶鱼反驳,逼出智者之间的真正张力。
这个分歧张力就是文章的骨架。没有对抗,就没有张力;没有张力,文章就平。
6.2 多写手并行竞争
4个写手同时写同一个主题,最终只选最佳——这是竞争性创作。老周不是帮写手改稿,而是裁判,选出本轮最优秀的篇目。
卡兹克的独立通道设计也很有价值:AI从业者这个细分读者群,和通用公众号的读者需求完全不同,独立通道保护了这种独特性。
6.3 鲶鱼轮值机制
Q%5 轮值 + bank 手动覆盖,这个设计兼顾了自动化和灵活性。自动化保证不会忘记哪个鲶鱼该上场,手动覆盖让运营者可以在关键时刻指定特定角色。
6.4 智者的真实画像
不是通用大模型随机生成的"智者观点",而是用真实著作、访谈、演讲蒸馏出的人物 Skill。芒格就是芒格,塔勒布就是塔勒布,有自己的认知框架、表达方式和决策启发式。
这是系统的护城河——素材质量的上限由智者 Skill 的深度决定。
6.5 完整的产出追踪
bank.md 状态管理 + factory.log 日志,让运营者随时知道:
- 哪些问题跑过了,哪些还没跑
- 每篇定稿的产出路径
- 流水线的运行历史
七、劣势与风险
7.1 辩论层容易退化
这是目前系统最脆弱的环节。设计上要求"芒格质疑曾国藩的某个前提",但实际执行中,子 agent 倾向于"各自亮完观点就结束"。
退化模式:4个角色的发言变成"四段独立读后感",没有真实交锋。
判断标准:检查素材文件里有没有芒格直接反驳另一方的对话结构。如果只有各段独立发言,说明退化发生了,需要重来。
修复方向:
- P1(轻量):强制输出"核心分歧结论"作为验收标准
- P2(中等):按话题类型动态分组而不是固定分组
- P3(重量):两两对话三轮,强制产生分歧
7.2 虚构引用风险
这是最隐蔽的质量风险。写手在创作时可能无意中捏造名人语录,比如编一句"芒格说:展示功劳是一种逆向激励"——这句话听起来很有道理,但芒格从来没说过。
v2.2.1 已经加了专项审查,但这仍然需要老周高度警觉。
7.3 Token 成本较高
一次完整流水线大约需要:
- Stage1 辩论:~20000 tokens
- Stage2 4写手:~80000 tokens
- Stage3 审校:~30000 tokens
- 合计:~130000 tokens / 每次
每月跑30次,Token消耗约390万。这在可接受范围内,但需要关注成本控制。
7.4 老周的单点瓶颈
老周是整个流水线的唯一审校节点。如果老周的判断有偏差,或者老周因故缺席,整个流水线就停摆。
可以考虑:
- 多审校 Agent 并行(不同审校者竞争)
- 建立老周的评判标准手册,减少主观偏差
7.5 热点响应延迟
每小时扫描 bank,但 bank 是手动维护的。如果出现突发热点,需要人工把问题丢进 inbox → 评分 → bank 才能触发流水线。
热点抓取目前没有自动化,是待开发的功能。
八、对系统的理解
Content OS 是什么,不是什么
Content OS 是工具,不是替代者。
它的定位不是"取代人写文章",而是"把人从重复性创作中解放出来",专注于真正的决策和判断。
系统最核心的价值不在于"4个写手并行",而在于对抗性辩论层——那才是真正的差异化所在。素材里的分歧张力,需要通过对抗性辩论才能被挖掘出来。
没有对抗辩论的流水线,就只是"多个人帮我写",而不是"系统帮我思考"。
设计哲学
系统的设计哲学是:让噪音变成信号,让模糊变成框架,让碎片变成张力。
- Trigger Box 把各种形态的输入(问题/台词/事件/感受)统一成标准格式
- 4智者对抗辩论把杂乱的观点变成有骨架的分歧结论
- 多写手竞争把"写得差不多"变成"写得最好"
- 老周审校把"写完就发"变成"值得发布"
每一步都在做减法——去掉噪音,保留信号。
系统的局限
AI 内容工厂的核心局限在于:它擅长组合,不擅长创造;擅长执行,不擅长判断。
对抗性辩论能逼出张力,但张力的方向还是要靠人把握。 多写手能并行创作,但写什么角度还是要靠人决策。 老周能选出最佳稿,但最佳的标准还是要靠人定义。
Content OS 是强大的执行机器,但判断力永远在人的那端。
九、未来发展方向
9.1 辩论层的强化
方向A:强制收敛机制
不是让4个角色自由辩论,而是在适当时候强制收敛。比如:
- 第一轮:各自亮立场
- 第二轮:两两碰撞(强制)
- 第三轮:收敛到"最多人认同的反对意见"
- 鲶鱼:指出所有人的共同盲区
方向B:动态分组
不是固定(芒格+曾国藩 / 达里奥+塔勒布),而是根据问题类型动态选择组合。
问题涉及风险/不确定性 → 优先选塔勒布 + 老喻 问题涉及长期决策 → 优先选芒格 + 曾国藩 问题涉及组织管理 → 优先选段永平 + 达里奥
方向C:鲶鱼的 AI 评审
对鲶鱼的输出跑一次 LLM 评审:这段反驳是否真的产生了新张力?如果鲶鱼只是在重复已有的观点,降低其权重或要求重来。
9.2 热点自动抓取
目前是手动往 inbox 丢素材。未来可以:
微博热榜 API → 关键词过滤 → 自动生成选题候选 →
inbox自动评分 → 高分自动进bank → 触发流水线
这个功能有实操价值,但需要处理:
- 热点保鲜期短(2-4小时),流水线20-30分钟偏慢
- 自动选题质量不稳定,需要人工审核
9.3 公众号发布自动化
流水线最后一公里:定稿 → 草稿箱 → 发布。
目前是半自动(Playwright 脚本待开发)。这环打通后,整个流水线才算真正闭环。
9.4 素材库的扩展
目前 bank.md 有23个精选问题,素材库还很薄。
扩展方向:
- 按领域分类(职场/情感/认知/商业/科技)
- 按难度分级(简单观点型/复杂辩论型/深度分析型)
- 按受众分类(打工人/创业者/AI从业者/学生)
9.5 读者反馈闭环
目前流水线是单向的:bank → 流水线 → 定稿 → 发布。没有反馈。
可以建立读者反馈追踪:
- 哪篇定稿阅读量最高
- 哪篇评论最多
- 读者在讨论什么
这些数据可以反过来影响 bank 的选题权重——让系统越跑越懂什么选题值得做。
9.6 语音入口
目前的入口是 Hermes 对话或 cronjob 定时。可以加一个语音入口:
用户发一段语音 → Whisper 转文字 → 自动解析意图 → 丢进 inbox
这让 Content OS 的入口从"打字"变成"说话",降低使用门槛。
十、附录
A. 核心文件索引
| 文件 | 说明 |
|---|---|
~/.hermes/skills/skills/content-factory/SKILL.md |
核心流水线skill(v2.3) |
~/.hermes/skills/skills/khazix-writer/SKILL.md |
卡兹克写手skill |
~/.hermes/skills/skills/mimeng-skill/SKILL.md |
咪蒙内容方法论 |
~/.hermes/skills/skills/mimeng-title-skill/SKILL.md |
咪蒙爆款标题 |
/mnt/d/hqking/trigger-box/bank.md |
精选问题库 |
/mnt/d/hqking/trigger-box/inbox.md |
待评分素材 |
/mnt/d/hqking/writers/定稿/ |
最佳定稿目录 |
/mnt/d/hqking/writers/定稿2/ |
卡兹克版定稿 |
/mnt/d/hqking/question-box/factory.log |
流水线运行日志 |
B. 流水线版本历史
| 版本 | 日期 | 关键变更 |
|---|---|---|
| v1.0 | 2026-04-25 | 初版,4写手并行 |
| v2.0 | 2026-04-27 | 引入鲶鱼层,4智者2组辩论 |
| v2.1 | 2026-04-28 | 鲶鱼轮值表,bank手动覆盖,强制反驳2个观点 |
| v2.2 | 2026-04-29 | 卡兹克写手加入,定稿2独立通道 |
| v2.2.1 | 2026-04-30 | 虚构名人语录禁止令,老周专项审查 |
| v2.3 | 2026-04-30 | 老周审校4篇(含卡兹克技术点评),Step编号重排 |
C. 相关人物 Skill 清单
| 人物 | Skill路径 | 核心标签 |
|---|---|---|
| 查理·芒格 | perspective/munger-perspective/ | 格栅理论、误判心理学 |
| 曾国藩 | zeng-guofan-skill/ | 长期主义、拙诚 |
| 达里奥 | dalio-principles-skill/ | 极度透明、创意择优 |
| 塔勒布 | taleb-perspective/ | 反脆弱、杠铃策略 |
| 老喻 | guduliandnao-skill/ | 概率算法、人生算法 |
| 李诞 | li-dan-perspective/ | 嘴毒解构、荒诞现实 |
| 张雪峰 | zhangxuefeng-perspective/ | 教育现实、底层逻辑 |
| 咪蒙 | mimeng-skill/ | 情绪三角、替你说出口 |
| 卡兹克 | khazix-writer/ | AI圈洞察、圈内视角 |
文档版本:v1.0 最后更新:2026-04-30 维护者:Hermes Agent (heqing@farsthink.com)