Hermes Agent lộ điểm vỡ tool-call khi chạy MiniMax qua NVIDIA API - Open Source

Điểm nổi bật

Stars: Hermes Agent đang ở vùng khoảng 63.7k stars và vẫn thuộc nhóm repo agent nóng trên GitHub.
Ngôn ngữ: Python.
Tính năng chính 1: issue mới mô tả lỗi model sinh các tool call bất hợp lệ như read_fileread_file, terminalterminal, search_filessearch_files.
Tính năng chính 2: lỗi xảy ra trong bối cảnh chạy qua NVIDIA API với model minimaxai/minimax-m2.7, cho thấy tính tương thích provider-model không phải chuyện hiển nhiên.
Tính năng chính 3: đây là loại lỗi orchestration rất đáng theo dõi vì nó chạm đúng vùng an toàn của agent có quyền truy cập terminal và file system.

Biểu đồ

flowchart LR A[Model qua NVIDIA API] --> B[Hermes Agent] B --> C[Tool call parsing] C --> D[Chuoi tool call loi] D --> E[Reconnect va hanh vi khong on dinh] E --> F[Can chuan hoa va phong ve orchestration]

Tóm tắt

Một issue mới trên Hermes Agent mô tả tình huống khá nhạy cảm: cùng một model MiniMax-M2.7 trả lời bình thường khi gọi trực tiếp qua NVIDIA API, nhưng khi đi qua Hermes Agent thì liên tục sinh các tool call lỗi, ghép tên tool thành chuỗi bất hợp lệ như read_fileread_file hay terminalterminal. Đây không chỉ là bug tích hợp đơn giản, mà là dấu hiệu cho thấy lớp orchestration của agent còn rất dễ tổn thương khi mỗi provider và model có cách biểu diễn tool use hơi khác nhau.

Với một framework agent hỗ trợ terminal, file ops và chạy trên nhiều kênh nhắn tin, loại lỗi này đáng chú ý hơn mức “khó dùng”. Nếu parser không đủ chặt, hệ thống có thể rơi vào trạng thái hành vi lặp, reconnect hoặc thực thi ngoài ý muốn. Nói cách khác, đây là bug mang màu sắc reliability và safety cùng lúc.

Chi tiết

Issue #8259 ghi nhận một khác biệt quan trọng giữa hai lớp tích hợp. Ở lớp API gốc, MiniMax-M2.7 trả lời đúng kiểu chat completion thông thường. Nhưng khi gắn vào Hermes Agent, hành vi tool calling trở nên méo mó, với các chuỗi bị lặp tên công cụ như read_fileread_file, read_fileread_fileread_fileread_file, terminalterminal và search_filessearch_files. Điều này gợi ý rằng vấn đề có thể không nằm ở model thuần túy, mà ở ranh giới chuyển đổi giữa định dạng trả lời của provider và schema công cụ mà agent kỳ vọng.

Đây là một điểm rất quan trọng đối với các hệ thống agent thực chiến. Nhiều đội ngũ đang giả định rằng nếu một model “hỗ trợ tool use” thì chỉ cần cắm vào framework là xong. Nhưng thực tế mỗi provider, mỗi gateway, thậm chí mỗi model family có thể khác ở naming, tokenization, chuỗi JSON, hoặc cách sinh nhiều tool call liên tiếp. Chỉ cần parser bên agent rộng tay quá mức hoặc thiếu canonicalization, đầu ra có thể rơi vào trạng thái không dự đoán được. Với agent có quyền đọc file và chạy terminal, chuyện đó không thể xem là bug nhỏ.

Issue cũng cho thấy một hệ quả vận hành khác: khi tool call không hợp lệ lặp đi lặp lại, agent bắt đầu reconnect do timeout và phát sinh hành vi khó đoán. Về mặt sản phẩm, điều này làm xói mòn niềm tin người dùng vì agent trông như đang “mất kiểm soát”. Về mặt kỹ thuật, nó thúc ép framework phải có lớp chuẩn hóa nghiêm ngặt hơn, bao gồm validate schema đầu ra, chặn chuỗi công cụ bất hợp lệ, degrade an toàn khi provider trả dữ liệu lỗi và log đủ rõ để truy vết.

Điểm đáng chú ý là Hermes Agent đang được cộng đồng quan tâm mạnh, nên những issue kiểu này có giá trị vượt lên một bug report riêng lẻ. Nó nhắc cả thị trường agent rằng khả năng mở rộng nhiều provider không chỉ là checkbox sản phẩm. Mỗi connector mới đều kéo theo một bề mặt rủi ro mới ở lớp orchestration. Trong giai đoạn AI agents tiến gần môi trường production, độ chắc của parser và policy an toàn có thể trở thành lợi thế cạnh tranh quan trọng không kém chất lượng model.

Điểm nổi bật

Biểu đồ

Tóm tắt

Chi tiết

Nguồn