AI BOOKCLUB · 05.25
2026 · MAY
RYAN / emma_pc LOG
水映工作室
致 / AI 讀書會的朋友們
Three Things I Built This Month

這個月在 emma_pc 上,
幹了三件事

一張 7900 XT、一個 Open Design daemon、一個 Codex 訂閱。
每件事都有一個差點翻車的故事——這份分享就是把那些坑記下來。
AI BOOKCLUB · RYAN
00 OVERVIEW一頁懂
00 /One-Page Summary

三件事,都跟「省」有關。

省 GPU、省工程時間、省 API 費。每件事都附一個踩到的雷,因為翻車的部分才是真的有資訊量。

01

換卡 + 本機 LLM stack

7900 XT 20GB + RAM 64GB;ROCm 7.2.3 + llama.cpp HIP + gpu-gate 互斥。SeedVR / LTX-Video 翻車。


Qwen 3.6-27B 本機跑、ComfyUI Qwen Image Edit 穩定生圖。

02

Open Design 整合進 Emma

132 skill × 150 design system;TG / LINE / Web 都能遠端生 prototype / deck / image。


agent 試了三套才挑對;兩個 env var 不設整套就壞掉。

03

Codex 訂閱白嫖

ChatGPT Plus 內含 Codex CLI;走 OAuth 把 gpt-image-2 變成 零邊際成本


Gemini API 砍剩 techfreestyle 排程;視覺 / 摘要 / 繪圖全轉 Codex。

02 / 0800 — OVERVIEW
AI BOOKCLUB · RYAN
01 GPU STACK換卡的真正理由
01 /AMD 7900 XT + ComfyUI + llama.cpp

不是「我想跑大 LLM」,
是「三個都要同時跑」。

LLM 推論、ComfyUI 影像、Open WebUI 三個前端——一張卡分時用,但中間不能互相搶 VRAM 搞 crash。

硬體

  • GPU:RX 3060 12GBRX 7900 XT 20GB
  • RAM:32GB → 64GB(GGUF mmap 要吃)

軟體 stack

  • ROCm 7.2.3 + llama.cpp HIP,本機跑 Qwen 3.6-27B
  • gpu-gate:ComfyUI ↔ LLM ↔ OpenWebUI 三向互斥 reverse proxy(idle 時放閒,有人來就排隊)
  • 對外走 Tailscale,所有東西在 /home/ryan/gpu-gate/
03 / 0801 — GPU STACK
AI BOOKCLUB · RYAN
01 GPU STACK影像生成 × ROCm 不平等條約
01.5 /Image works, Video doesn't

影像OK,
video diffusion 還沒成熟。

ROCm 7.x 對 image 類 model 已經夠用,但 video 類 model(LTX、SeedVR、Wan i2v)只要 layer 用到 ROCm 沒實作好的 kernel,就會直接 page fault 整張卡 hang。

穩定堆疊(可上 production)

  • ComfyUI + Qwen Image Edit 2511 GGUF + Lightning LoRA
  • Wan 2.2 i2v:能跑但慢,做 client 演示夠
  • Chroma Art:藝術風格 OK
04 / 0801 — GPU STACK
AI BOOKCLUB · RYAN
02 OPEN DESIGNOSS 版 Claude Design
02 /Open Design × Emma

用任意 coding agent
生指定 design system 風格的 prototype。

nexu-io/open-design—— Claude Design 的 open-source 替代品。內建 132 個 skill × 150 個 design system(Linear、Stripe、Vercel、Notion、Apple HIG、Tesla、Raycast、Supabase…),調 coding agent CLI 生 deck / prototype / image。

部署

Source~/open-design/
Data~/open-design-data/
RuntimeNode 24 via nvm(別跟 Emma v22 共用)
Port127.0.0.1:7456
URLdesign.emma-ai.net(CF Tunnel + Access OTP)
05 / 0802 — OPEN DESIGN
AI BOOKCLUB · RYAN
02 OPEN DESIGN翻三次 agent 才挑對
02.5 /Agent evolution + landmines

agent 試了三套,
第三個才成功

claude(Claude MAX)
token 燒太快——一個 prototype 直接吃掉一整天的額度
放棄
codex(gpt-5.5)
bwrap sandbox 在 Ubuntu 24.04 寫不了檔
放棄
gemini(gemini-3-pro-preview)
走 Google 訂閱 quota,可用
採用 ✓
06 / 0802 — OPEN DESIGN
AI BOOKCLUB · RYAN
03 COST用訂閱 vs 用 API
03 /Codex subscription > API spend

ChatGPT Plus 裡的 Codex CLI
用 OAuth 變 零成本生圖

原本視覺 / 繪圖 / 摘要靠 Gemini API key 一個月燒幾百塊。發現 Codex CLI 可以走 ChatGPT 訂閱 OAuth 後,邊際 cost 變 0。直接把流量挪過去。

Emma 內怎麼接

ImageGenerator({ model: "gpt-image-2", ... })
由 Codex OAuth 代呼,回 png → PIL 壓 WebP → 寫進 ~/emma/uploads/。website-builder skill 直接拿來當 hero / section 圖。

07 / 0803 — COST
AI BOOKCLUB · RYAN
04 NEXT下個月想做的
04 /What's next

三條線繼續走,
每條都有明確等待點

GPU STACK

等 ROCm 7.3 / PyTorch ROCm 2.6+

看 SeedVR / video diffusion 能不能在 7900 XT 翻身。沒翻就買 4090 / 5090(最後手段)。

OPEN DESIGN

客戶情境 × design system 表

把「客戶類型→預設 design system」做成 lookup,免得每次都要手動選 Linear / Stripe / Apple。

CODEX

榨乾訂閱

探索 Codex CLI 跑 batch summarize / structured extraction,把更多 Emma backend 任務搬過去。


CONTACT

Ryan / 水映工作室 · [email protected]

AI 讀書會分享 · 2026.05.25
換卡  · agent 翻車  · API 費 → $0
08 / 0804 — NEXT