Contents

9Router: Cứu cánh cho dev khi AI coding ngày càng đắt đỏ

9Router: Cứu cánh cho dev khi AI coding ngày càng đắt đỏ

Mở đầu: Vì sao “mùa hè AI” đang làm ví tiền của bạn khóc thét?

Mấy tháng gần đây, làng AI coding có mấy cái tin không vui:

  • GitHub Copilot âm thầm đổi cách tính — giờ không còn unlimited completions như xưa.
  • Claude Max ra mắt với giá $200/tháng. Đúng — hai trăm đô. Một người bạn của mình đăng ký xong tháng đầu, thấy bill, thề không dám mở Claude Code nữa.
  • Token burn — model càng ngày càng thông minh, càng ngốn nhiều context. Tool_result từ git diff, grep -r, tree tưởng vô hại nhưng khi LLM nhai thì token mới “hoảng”.

Đi làm ở công ty thì có AI tools xịn xò, nhưng về nhà tự mày mò side project, pet project — $200/tháng là nửa tháng tiền ăn rồi (với dân Việt Nam).

Mình cũng loay hoay tìm cách: chạy local model? Chậm. OpenRouter? Cũng tiền. Chuyển qua dùng Gemini free? LLM không familiar với codebase Python/Go của bạn.

Cho đến khi mình tìm thấy 9Router.


9Router là gì? — Cái “tổng đài” cho AI coding tools của bạn

Hãy tưởng tượng thế này: bạn có Claude Code ($200/tháng) nhưng ít khi dùng hết quota, lại có GitHub Copilot (đi làm được trả), thêm vài cái API key DeepSeek, Gemini còn dư. Mỗi tool một endpoint, mỗi provider một cấu hình, quota hết thì chết.

9Router là cái switchboard ngồi giữa, nhận request từ tools của bạn và tự động routing qua provider phù hợp.

Cài một lần:

npm install -g 9router
9router

Xong. Dashboard mở ra ở http://localhost:20128/dashboard. Tools của bạn trỏ vào http://localhost:20128/v1 — xong phim.

Giao diện OpenAI-compatible, nên gần như tool AI coding nào cũng chơi được: Claude Code, Codex, Cursor, Cline, Copilot (qua MITM bridge).

3-Tier Fallback — Đẳng cấp

Đây là cái làm mình “bái phục” nhất. 9Router chia providers thành 3 tầng:

Tier Ví dụ Chi phí
🥇 Subscription Claude Code, OpenAI Codex, GitHub Copilot Đã trả tiền rồi, xài tối đa
🥈 Cheap GLM ($0.60/1M), MiniMax ($0.20/1M), Kimi ($9/tháng) Rẻ như cho
🥉 FREE iFlow, Qwen, Kiro, OpenCode $0 (có rate limit nhưng đủ xài lặt vặt)

Khi bạn dùng Claude Code, request thường đi qua Tier 1 (subscription). Nếu Claude hết quota → tự động rớt xuống Tier 2 (GLM $0.60) hoặc Tier 3 (FREE). Zero downtime, zero config lại.


Tính toán chi phí — Nỗi đau định lượng

Mình thử làm phép tính cho dev Việt Nam điển hình (như mình):

Cách 1: Subscription riêng lẻ

  • Claude Pro: $20/tháng — unlimited? Không, có giới hạn ngầm.
  • Claude Max: $200/tháng — xài nhiều thì mới “đáng”.
  • GitHub Copilot: $10-39/tháng.
  • Tổng: $30-250/tháng 😱

Cách 2: 9Router + FREE tier

  • 9Router: Free, open-source.
  • Claude Code subscription (đã có sẵn qua công ty hoặc cá nhân): Dùng hết quota thì thôi.
  • Fallback qua FREE providers: Qwen, Kiro, iFlow — dùng cho task đơn giản (grep code, giải thích function, viết unit test).
  • DeepSeek API key: $0.14/1M tokens (chỉ dùng khi cần model mạnh).
  • Tổng thực tế: $0-5/tháng ngoài subscription có sẵn.

RTK Token Saver — “Nén” input của bạn thêm 20-40%

9Router có một tính năng rất “đỉnh” là RTK (Real-Time Token compression). Nó tự động nén nội dung tool_result — những thứ như output của git diff, ls -la, grep, tree — trước khi gửi lên LLM.

Hãy tưởng tượng bạn code một feature lớn, Claude Code phải đọc 47K tokens output từ git diff. RTK nén xuống còn 28K tokens. Cùng context, cùng câu trả lời, cùng kết quả — nhưng chỉ trả tiền cho 28K tokens thay vì 47K.

Con số ấn tượng từ trang chủ 9Router:

  • Input compression: −20–40% tokens
  • Caveman Mode (nén output, 5 cường độ): −65% tokens

Caveman Mode hoạt động kiểu inject system prompt bảo LLM trả lời ngắn gọn hơn: thay vì viết một đoạn dài dòng, nó chỉ trả kết quả dạng telegraphic. “Why use many token when few do trick” 🗿


Setup thực chiến — Từ local đến VPS

Cài local — 2 phút

# Cài global
npm install -g 9router

# Chạy
9router

Sau đó mở http://localhost:20128/dashboard, add provider keys. Có mấy providers FREE như iFlow, Kiro, OpenCode không cần key gì cả — OAuth browser cookie là chạy.

Docker trên VPS — Cho cả team xài

Vì 9Router chạy local default, nếu muốn expose cho cả team hoặc dùng từ máy khác, deploy bằng Docker:

docker run -d \
  --name 9router \
  -p 20128:20128 \
  -v "$HOME/.9router:/app/data" \
  -e DATA_DIR=/app/data \
  decolua/9router:latest

Muốn secure hơn thì chạy sau reverse proxy (Nginx/Caddy) với HTTPS + basic auth.

Lưu ý: Nếu expose ra internet, nhớ thêm authentication. 9Router dashboard mặc định không có auth — đừng dại mở thẳng ra ngoài.

Tích hợp với Claude Code

# Trong project của bạn
claude --proxy http://localhost:20128/v1 --api-key <key-tu-dashboard>

Hoặc config trong file ~/.claude/settings.json:

{
  "proxyUrl": "http://localhost:20128/v1",
  "apiKey": "..."
}

Claude Code sẽ gửi request qua 9Router thay vì gọi thẳng Anthropic. 9Router tự động route, fallback, và nén token.


Cảnh báo — Không có bữa trưa miễn phí

Viết vậy thôi chứ mình không bán 9Router đâu. Có vài điểm cần lưu ý:

⚠️ Latency

  • FREE tier hay có rate limit và latency cao hơn
  • Route fallback có thể mất 1-2 giây để switch
  • Nếu đang pair programming realtime, subscription vẫn là lựa chọn tốt hơn

⚠️ Trust & Security

  • FREE providers là từ Trung Quốc (iFlow, Qwen) — code của bạn đi qua server họ
  • Với task nhạy cảm (production credentials, source code closed-source) — nên restrict chỉ dùng subscription tier
  • 9Router chạy local, nhưng khi dùng FREE tier thì request vẫn ra internet

⚠️ Model Quality

  • FREE model không thể ngang Claude Sonnet 4 hay GPT-4o
  • Dùng cho task đơn giản (refactor nhỏ, viết test, grep code) là ổn
  • Task phức tạp (architecture, debugging lớn) — nên set sticky route về subscription

⚠️ Vendor Lock-in?

  • 9Router open-source (MIT), không lock-in
  • Toàn bộ config local, muốn bỏ thì xóa, tools của bạn trỏ thẳng lại provider gốc

Mình nghĩ gì về 9Router?

Điểm mạnh:

  • Mã nguồn mở, community 13K★ GitHub
  • Cài trong 2 phút, zero config với hầu hết tools
  • RTK token saver thực sự hiệu quả — tiết kiệm 20-40%
  • Quản lý tập trung — một dashboard coi tất cả provider
  • Multi-account, round-robin, auto failover

Điểm yếu:

  • Dashboard chưa có auth mặc định
  • FREE tier providers chủ yếu Trung Quốc (dân tech còn tranh cãi về privacy)
  • RTK còn beta, thỉnh thoảng bạn cần tắt nếu output bị lỗi format
  • Cache và persistence còn manual (dùng Docker volume)

Ai nên dùng?

  • 🟢 Dev solo / freelancer muốn tiết kiệm chi phí
  • 🟢 Team nhỏ (3-10 người) muốn shared AI gateway
  • 🟢 Người muốn thử Claude Code / Codex mà không muốn commit $200/tháng
  • 🟡 Team enterprise — nên có security review trước
  • 🔴 Dân security-sensitive, code defense/fintech — không nên dùng FREE tier

Kết luận

9Router không phải là silver bullet, nhưng với dân dev Việt Nam — nơi $200/tháng là to tiền — nó là một cứu cánh.

Thay vì phải chọn giữa “dùng AI coding tốn quá” và “không dùng thì thua thiệt”, bạn có thể:

  1. Dùng subscription Claude Code có sẵn cho task chính
  2. Config 9Router fallback cho khi hết quota
  3. Bật RTK + Caveman Mode để giảm token burn thêm 20-65%
  4. Setup Docker trên VPS cho cả team dùng chung
  5. (Bonus: nếu dùng OpenClaw hay tool nào OpenAI-compatible, chỉ cần config base URL là chạy)

Mình đang chạy setup này được 2 tuần. Tiền AI coding tháng này của mình: $0 ngoài subscription. Mà không miss bất kỳ task nào vì rate limit.

Thế mới thấy: đôi khi không phải mua thêm, mà là routing thông minh hơn. 🦞


Tài liệu tham khảo