Headroom vs Aphrodite: Cuộc chiến nén context — LLM của bạn đang đốt 90% token vào rác
80 đô một bookmark
Hồi tháng 4, mình đang ngồi debug cái trace sao service menu bắn ra 500. Claude Code chạy, gửi cái stack trace vào, load file service, rồi gửi file gateway, rồi gửi thêm DB schema. 3 giây sau — bing — nó trả lời. Đọc xong mình chỉ biết ngồi im.
Mỗi lần mình gọi Claude Code, nó đọc lại toàn bộ output từ command trước. Cái log build 150 dòng? Đọc. Cái git diff 42 dòng? Đọc. Cái snapshot browser 342 element? Cũng đọc nốt. Thế mà không biết bao nhiêu phần trăm trong số đó là output nó tự viết ra, tự trả về, rồi tự đọc lại trong lần gọi tiếp theo.





