Từ Claude Code đến Hermes Agent: Hành trình tìm con AI agent không 'quên' mình mỗi sáng

2026-06-27 2613 từ 13 phút

Nội dung

Sáng thứ Hai, mình mở Claude Code lên, gõ claude trong terminal, chờ 3 giây loading rồi nhận ra: nó chả nhớ gì cả.

Không biết project này dùng Gin hay Fiber. Không biết validation layer viết ở đâu. Không biết convention đặt tên file thế nào. Cái PR đang làm dở tuần trước — nó nhìn như tờ giấy trắng. Cay vcl 💀

Claude Code xịn thật — model xịn, tool coverage ngon, viết code nhanh. Nhưng mỗi lần mở session mới là mỗi lần mình phải giải thích lại từ đầu. “Dùng Go nhé, Gin framework nhé, gRPC nhé, repository pattern nhé.” Nó gật đầu rồi 3 tiếng sau tự ý đổi GetMenuByID thành fetchMenuByID — phá toang convention PascalCase của Go. Cảm giác như mỗi sáng đi làm lại phải train lại thực tập sinh vậy.

Session amnesia — cái bệnh chung của mọi AI agent

Mấy tháng trước mình xài Claude Code khá nhiều. Code chạy nhanh, debug ổn, nhưng cái vấn đề dai dẳng nhất là session amnesia — cứ mở session mới là reset toàn bộ context.

Mình thử OpenClaw vì nghe bảo tool coverage rộng, support nhiều provider. Cũng ngon thật — một câu lệnh chạy được Claude, Gemini, OpenAI, đủ thứ. Nhưng stateless vô cùng. Mỗi session là một phiên giao dịch riêng biệt, không có learning loop, không có memory. Làm xong task thì thôi, không đọng lại gì.

Rồi mình tìm ra Claude-Mem — plugin giúp Claude Code nhớ context. Cũng khá ổn: nó hook vào tool calls, compress observation, lưu vào SQLite, inject lại vào session sau. Mình viết hẳn bài deep dive về nó đấy. Nhưng mà bản chất vẫn là plugin — một workaround, không phải architecture native.

Cái mình cần là một agent mà memory là built-in, không phải gắn thêm.

AI agent thực sự hữu ích cần gì?

Nghĩ kỹ lại, mình nhận ra một AI agent để mình trust giao việc daily cần 3 thứ:

1. Nhớ context giữa các session.
Không phải kiểu “à tôi nhớ bạn tên Luân” — mà là nhớ project structure, tech stack, conventions, decisions. Nhớ cái bug lần trước đã fix thế nào để lần sau đừng mắc lại.

2. Tự động hoá được task lặp lại.
Mỗi sáng search AI news, viết blog, gửi lên Zalo — mình không muốn ngồi chờ chat từng câu. Cần cái cronjob tự động chạy, tự deliver kết quả.

3. Học từ sai lầm.
Code như bò, nhưng lần sau đừng code tiếp kiểu bò nữa. Một agent giỏi không phải là nó không bao giờ sai, mà là nó biết ghi nhớ cái sai và tự điều chỉnh.

Hầu hết agent hiện tại chỉ làm được cái đầu tiên ở mức cơ bản. Codex, Cursor, Copilot — đều editor-centric, gắn liền với IDE, không có lifecycle ngoài editing session.

Phát hiện Hermes Agent

Một tối cuối tuần, mình lướt GitHub thấy cái repo NousResearch/hermes-agent với 204k stars. Open source. MIT license. Mò vào đọc docs, thấy ngay dòng này:

“The only agent with a built-in learning loop — it creates skills from experience, improves them during use, nudges itself to persist knowledge, and builds a deepening model of who you are across sessions.”

Đọc xong câu đấy là mình biết đây là thứ mình đang tìm.

204k stars, 36.6k forks, 13K commits, 1,557 contributors — con số không phải dạng vừa. Mà mình ngạc nhiên vì sao cộng đồng AI Việt Nam ít nhắc tới Hermes nhỉ? Trong khi bọn mình cứ loay hoay xài Claude Code, Copilot với Cursor.

Hermes Agent khác gì?

Mình xài Hermes được tầm 2 tháng rồi, ~20K requests/tháng, ~502M input tokens, ~9.2M output tokens. Đây là những điểm khác biệt mình đúc kết được:

1. Memory là native, không phải plugin

Hermes dùng Honcho cho user modeling — không chỉ lưu cái bạn nói mà xây dựng model hành vi của bạn qua thời gian. Kèm FTS5 session search với LLM summarization: gõ hermes session search "cái vụ rate limiting delivery service" là nó tìm lại được context cũ từ 2 tháng trước.

Không phải kiểu “inject hết history vào context” tốn token. Nó dùng progressive disclosure — giống L1/L2/L3 cache. Tìm index nhanh (50 token), timeline (~200 token), chỉ fetch full detail khi cần (~1000 token). Mình đã nói kỹ cái pattern này trong bài Claude-Mem, Hermes làm y hệt nhưng built-in thẳng vào core 🦞

2. Skills — procedural memory

Đây là điểm mình thích nhất. Sau một task phức tạp, Hermes có thể tự động tạo skill. Skill là một unit kiến thức có thể: tái sử dụng, cải thiện qua từng lần dùng, share lên agentskills.io.

Ví dụ: hồi mới xài, mình nhờ Hermes viết blog post kiểu “research → propose outline → write → review → publish Hugo”. Lần đầu nó làm hơi lúng túng — quên generate caption cho ảnh, quên set front matter tags. Mình góp ý. Lần sau nó tự nhớ, không cần nhắc.

Về sau mình export cái workflow đó thành skill blog-writer-v2. Giờ muốn viết blog mình chỉ cần nói “chạy blog-writer-v2 với topic X” là nó tự research trên web, propose outline, hỏi mình approve rồi chạy toàn bộ pipeline. 5-gate review — viết xong tự review lại 5 lần trước khi publish. Auto caption. Auto commit Hugo. 🔥

3. Cron built-in — không cần hệ thống ngoài

Hermes có built-in cron scheduler với natural language scheduling. hermes cron create là xong.

hermes cron create \
  --name "daily-ai-digest" \
  --schedule "every day at 7:00 AM" \
  --skill "ai-digest" \
  --params '{"topics": ["LLM", "agent", "open-source"]}'

Cronjob chạy, Hermes search web → tổng hợp → viết blog → gửi lên Zalo. Mình không cần làm gì. Sáng 7h dậy thấy có post mới trên blog với notification trên Zalo. Tự động 100%.

4. Multi-platform gateway — một process, 20+ platforms

CLI, Telegram, Zalo, Discord, Slack, WhatsApp, Signal, Matrix, Email, SMS… tất cả chạy chung một process. Cái này hay vì:

Tin nhắn trên Zalo và Telegram đều chung session — mình hỏi trên Telegram, trả lời trên Zalo vẫn được
Cronjob deliver kết quả ra Zalo group, Telegram channel, email cùng lúc
Voice memo transcription tự động (gửi audio lên Zalo → Hermes transcribe → xử lý)

5. Delegation — spawn sub-agent độc lập

Task phức tạp cần nhiều bước xử lý song song? Hermes spawn sub-agent với isolated context. Một thằng research, một thằng implement, một thằng review. Code review PR đi kèm github-pr-workflow skill + delegate_task — spawn sub-agent ra review code thay vì làm tuần tự.

6. Model-agnostic — 20+ providers

Nous Portal, OpenRouter, NovitaAI, NVIDIA NIM, Xiaomi MiMo, Kimi, MiniMax, Hugging Face, OpenAI… đổi model không cần config lại agent.

7. 5 sandbox backends

Local, Docker, SSH, Singularity, Modal. Chạy ở đâu cũng được. Mình deploy trên một con VPS $5/tháng + serverless Modal cho task nặng.

Web UI — browser xài, khỏi terminal

Tháng 6/2026 này Hermes ra mắt Web UI (Desktop) — native app cho macOS, Windows, Linux. Electron-based, nhưng chạy mượt hơn mong đợi.

Cái hay: chung session với CLI và gateway. Nghĩa là sáng mình chat với Hermes trên terminal để code. Trưa ngồi uống café mở Web UI trên iPad vẫn thấy nguyên cái hội thoại lúc sáng. Streaming tool output — thấy agent đang làm gì real-time. Preview pane cho file ảnh, markdown, code diff.

File browser tích hợp sẵn — không cần gõ ls với cd nữa nếu chỉ muốn xem thử cấu trúc project. Voice I/O cũng có, nhưng mình chưa xài nhiều.

Trước giờ mình sống trong terminal, nhưng phải công nhận: có cái Web UI cho mấy tác vụ đơn giản (đọc báo, check cron status, xem log) vẫn tiện hơn. Đỡ phải nhớ command syntax.

Real usecases — Hermes trong đời sống dev hàng ngày

1. Blog automation (blog-writer-v2 skill)

Mô tả ở trên rồi. Bottom line: từ idea → publish mất 15 phút thay vì 1-2 tiếng. Skill tự review 5 gate: grammar, technical accuracy, SEO, structure, final polish. Auto publish Hugo + auto caption.

# Ví dụ config skill blog-writer-v2 (rút gọn)
name: blog-writer-v2
description: "Viết blog post cho blog.luandnh.com, publish Hugo"
steps:
  - research topic using web_search
  - propose outline → ask user approval
  - write full post with front matter
  - review: 5-gate pipeline
  - generate caption for images
  - hugo commit + push
delivery:
  - zalo: notify after publish
  - telegram: send summary link

2. AI Daily Digest

Cronjob chạy 7h sáng mỗi ngày:

Search Google + ArXiv + Hacker News cho AI news mới nhất (LLM, agent, open-source tooling)
Tổng hợp thành blog post ngắn (500-700 từ)
Commit lên Hugo blog → publish
Gửi link + summary lên Zalo cá nhân và group Telegram
Lưu archive vào ~/brain/daily-digest/

Tự động 100%. Mình chỉ việc đọc. Nếu có post nào hay, mình bảo Hermes “viết deep dive cho cái paper này” là nó research tiếp.

3. Personal DMS (Digital Memory System)

Lâu lâu mình có mấy ý tưởng, link hay, cảm xúc… kiểu brain dump. Trước mình ghi vào Notes app rồi… không bao giờ mở lại. Giờ mình gửi Hermes qua Zalo: “lưu cái này vào brain”. Nó tự classify:

~/brain/Life/ — chuyện cá nhân, cảm xúc, reflection
~/brain/Work/ — tech decisions, architecture notes, meeting recap
~/brain/Study/ — papers đã đọc, course notes, key learnings
~/brain/Research/ — AI ideas, experiments, findings
~/brain/Misc/ — còn lại

Tag + timestamp tự động. Search bằng FTS5. Mình hay bảo “Hermes, search trong brain cái vụ Kafka vs RabbitMQ mình đã note tháng trước” — 2 giây là ra.

4. Multi-platform messaging

Mình xài Zalo là chính (VNmese dev community). Nhưng Hermes cũng chạy Telegram, Pushover với Web UI. Zalo DM + group đều được. Có hôm mình đi làm quên check Telegram, Hermes nhắn qua Zalo luôn. Cùng session, khỏi kể lại.

5. Memory & Context

Sau 2 tháng, Hermes biết:

Tech stack của mình: Go, Gin, gRPC, PostgreSQL, Redis, Docker
Blog config: Hugo theme, domain, deploy workflow
Lịch họp: team standup 9h30 sáng, 1-2-1 chiều thứ Năm
Địa chỉ nhà, sở thích cafe, giờ làm việc thường lệ

Không cần nói lại. Mỗi lần cài con agent mới, đây là thứ mệt nhất — giải thích lại cuộc đời mình. Với Hermes, làm một lần, nhớ mãi.

6. Skills ecosystem

Hiện tại mình có ~20 skills, không chỉ blog-writer-v2:

github-pr-workflow — clone PR, review code, comment, auto-fix minor, request changes cho major
deploy-check — pre-deploy checklist: test pass? migration safe? rollback plan?
daily-triage — sáng mở Hermes check: email quan trọng? PR cần review? issue cần respond?
code-review-go — specialized review skill cho Go project, check convention, error handling, context propagation

Mỗi skill tự cải thiện. Nếu một skill gặp pitfall (làm sai, thiếu bước), Hermes có thể tự patch skill đó. Không cần mình can thiệp.

7. Code review & PR

Mình xài github-pr-workflow skill kết hợp delegate_task. Khi có PR mới, sub-agent được spawn ra:

Clone code về sandbox riêng
Chạy go vet, golangci-lint
Review diff, comment từng vấn đề
Fix minor trực tiếp, request changes cho major
Cập nhật PR status

Sub-agent isolated, không ảnh hưởng session chính. PR xong thì clean.

Setup thực tế — $10/tháng xài đủ 13 models

Đùa chứ không phải quảng cáo đâu. Mình xài OpenCode GO ($10/tháng) cho Hermes, access 13 models. Config đơn giản:

# Provider setup
hermes config set provider opencode-go
hermes config set opencode_go.api_key "sk-go-xxx"

# Chọn model mặc định
hermes config set model opencode-go/deepseek-v4-flash

Chiến lược model của mình:

Task	Model	Lý do
Chat nhanh, debug	DeepSeek V4 Flash	Rẻ ($0.28/output), nhanh, ~158K req/tháng
Viết code, implement	MiniMax M3	90% chất lượng Tier S, giá bằng 1/6
Planning, review	Qwen3.7 Max	GPQA Diamond 92.4%, reasoning sâu
Code phức tạp, critical	GLM-5.2	SWE-bench Pro 62.1, best overall coder

DeepSeek V4 Flash là chân ái cho task nhẹ — giá rẻ, tốc độ cao. Mỗi tháng mình tốn ~$10, xài thoải mái ~500M input tokens. GLM-5.2 cho task quan trọng, tốn token hơn nhưng quality xịn.

Mình có giải thích chi tiết trong bài OpenCode GO models guide rồi. Ai đọc bài đó rồi chắc biết mình không phải dạng quảng cáo vô tội vạ 😬

Skill system workflow:

# Install skill từ agentskills.io
hermes skill install blog-writer-v2

# Load skill vào session hiện tại
hermes skill load blog-writer-v2

# Xài skill
/blog-writer-v2 topic="Từ Claude Code đến Hermes Agent"

# Xem trạng thái skill
hermes skill list
hermes skill inspect blog-writer-v2 --verbose

# Cron với skill
hermes cron create \
  --name "weekly-review" \
  --schedule "every Sunday at 10:00 PM" \
  --skill "code-review-go" \
  --params '{"repo": "my-project", "days": 7}'

3 bài học sau 2 tháng sống chung với Hermes

1. AI agent không cần hoàn hảo — cần CONSISTENT

Ngày đầu xài Hermes, nó cũng code như bò nhiều chỗ. Quên convention, viết sai pattern. Nhưng vì nó có memory, lần sau nó tự sửa. Mỗi lần feedback là một lần skill được cải thiện. Có cái agent làm đúng ngay từ đầu rồi lần sau lại quên — vô dụng.

Consistency beat perfection. Always.

2. Memory + skills > model power

GLM-5.2 với context trắng thua DeepSeek V4 Flash có skill + memory. Model mạnh mà không có context cũ, không có reusable skill, thì mỗi lần vẫn phải thinking từ zero. Có skill + memory, model yếu hơn nhưng output ổn định hơn.

Mình thà xài DeepSeek V4 Flash với Hermes còn hơn Claude 4 Sonnet với terminal trần.

3. Tự động hoá cần trust, trust đến từ consistency

Hồi đầu mình trust Hermes chạy cron auto publish blog không? Không. Mình xem từng bước. Nhưng sau ~50 lần nó chạy đúng, không lỗi, có lỗi cũng tự report, mình bắt đầu trust. Giờ AI Daily Digest chạy 3 tuần không cần mình động tay.

Trust không đến từ việc AI tuyên bố “tôi đáng tin cậy”. Trust đến từ việc nó làm đúng nhiều lần đến mức bạn ngừng kiểm tra.

Điểm trừ? Cũng có vài cái

Không có tool nào perfect cả:

Learning curve ban đầu: Skill system cần thời gian để hiểu. Mình mất ~1 tuần để làm quen cách viết skill, cách debug skill fail.
Gateway setup hơi rườm: Zalo gateway setup cần vài bước config token, webhook. Không khó nhưng đọc doc kỹ.
Memory đôi khi quá conservative: Thỉnh thoảng nó không dám ghi nhớ thứ lẽ ra nên nhớ. Cần nhắc /learn manual.
Web UI còn non: Mới 06/2026, còn bug nhỏ. Dùng được nhưng chưa ngon bằng terminal.

Nhưng overall, trade-off vẫn lời.

Nói gọn lại

Hermes Agent là con agent đầu tiên mình xài mà không phải kể lại cuộc đời mình mỗi sáng. Nó có memory, có skills tự cải thiện, có cron chạy background, có gateway multi-platform, và giờ có Web UI để xài trên browser.

Mình không nói đây là agent tốt nhất cho mọi người. Nhưng nếu bạn cũng mệt mỏi với cảnh mỗi sáng mở agent lên và nó nhìn bạn như người lạ — thử Hermes xem.

GitHub: NousResearch/hermes-agent
Docs: hermes-agent.nousresearch.com/docs
Install: curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

Bạn đang xài con agent nào? Claude Code? Codex? Hay vẫn trust đôi tay trần? Vô comment kể mình nghe với 🦞🔥

Bài viết là trải nghiệm cá nhân. Mình không có affiliate với Hermes hay Nous Research, cũng không được trả tiền để viết bài này. Mình trả $10/tháng OpenCode GO từ túi mình, code chạy trên con VPS $5 của mình. Nếu thấy hay thì share giùm, nếu thấy sai thì comment mình sửa.