/images/avatar.webp

Luân Dương

Agent = Model + Harness: Đừng mang động cơ F1 lắp vào xe bus không phanh

Hồi cuối năm ngoái, mình có tự chế một con bot chạy ngầm để tự động đọc menu của các đối tác quán ăn gửi về dưới dạng PDF/Excel, rồi parse qua struct Go để nạp vào DB của hệ thống Menu Service.

Logic rất đơn giản: đọc file -> nhét vào prompt -> gọi API GPT-4 -> nhận JSON -> parse vào struct -> save. Mình tự tin chạy thử. 3 ngày đầu chạy ngon lành. Đến ngày thứ 4, một quán gửi cái file PDF thực đơn dài 15 trang, scan mờ căm và cấu trúc lộn xộn.

AI trong production 2026: Ford rehire kỹ sư, Zuck thừa nhận, và cái kết không ai ngờ

“That would produce a high-quality product” - Câu nói đắt giá nhất của Ford trong năm 2026

“Mistakenly we thought that by just introducing artificial intelligence and ingesting the design requirements that we had, that that would produce a high-quality product.”

Câu này không phải của một startup non trẻ. Không phải của một founder trên Twitter. Mà là Charles Poon - VP vehicle hardware engineering của Ford. Một trong những tập đoàn sản xuất lớn nhất thế giới, tồn tại hơn 120 năm.

LeanCTX: Cỗ máy context engineering cho AI agent - không chỉ là nén token

Mở đầu: cái ngày mình nhận ra mình đang đổ xăng máy bay cho con Wave

Chuyện là thế này.

Hồi Q1 năm nay, team mình chạy Claude Code trên một cái Go monorepo tầm 500 files. Service mesh, multi-module, dependency chồng chéo. Mỗi lần Claude cần hiểu một module - ví dụ cái auth package - nó đọc full file. Rồi nó đọc thêm 3-4 file liên quan. 50 files sau, context window đầy nghẹt.

Headroom vs Aphrodite: Cuộc chiến nén context - LLM của bạn đang đốt 90% token vào rác

80 đô một bookmark

Hồi tháng 4, mình đang ngồi debug cái trace sao service menu bắn ra 500. Claude Code chạy, gửi cái stack trace vào, load file service, rồi gửi file gateway, rồi gửi thêm DB schema. 3 giây sau - bing - nó trả lời. Đọc xong mình chỉ biết ngồi im.

Mỗi lần mình gọi Claude Code, nó đọc lại toàn bộ output từ command trước. Cái log build 150 dòng? Đọc. Cái git diff 42 dòng? Đọc. Cái snapshot browser 342 element? Cũng đọc nốt. Thế mà không biết bao nhiêu phần trăm trong số đó là output nó tự viết ra, tự trả về, rồi tự đọc lại trong lần gọi tiếp theo.

77.5k stars chỉ với một ý tưởng: bắt AI agent nói chuyện như người tiền sử

77.5k stars chỉ với một ý tưởng: bắt AI agent nói chuyện như người tiền sử

⛏️ “Why use many token when few do trick.”


Cái bookmark 80 đô

Hồi tháng 4 vừa rồi, mình đang xào mấy cái PR cho vụ refactor service layer ở chỗ làm. Mỗi lần chạy Claude Code để review hay generate một đoạn code, output nó trả về toàn:

Từ Claude Code đến Hermes Agent: Hành trình tìm con AI agent không 'quên' mình mỗi sáng

Sáng thứ Hai, mình mở Claude Code lên, gõ claude trong terminal, chờ 3 giây loading rồi nhận ra: nó chả nhớ gì cả.

Không biết project này dùng Gin hay Fiber. Không biết validation layer viết ở đâu. Không biết convention đặt tên file thế nào. Cái PR đang làm dở tuần trước - nó nhìn như tờ giấy trắng. Cay vcl 💀

Claude Code xịn thật - model xịn, tool coverage ngon, viết code nhanh. Nhưng mỗi lần mở session mới là mỗi lần mình phải giải thích lại từ đầu. “Dùng Go nhé, Gin framework nhé, gRPC nhé, repository pattern nhé.” Nó gật đầu rồi 3 tiếng sau tự ý đổi GetMenuByID thành fetchMenuByID - phá toang convention PascalCase của Go. Cảm giác như mỗi sáng đi làm lại phải train lại thực tập sinh vậy.