MemOS — hệ điều hành bộ nhớ cho LLM và agent - Open Source

Điểm nổi bật

Tín hiệu cộng đồng: repo xuất hiện trên GitHub Trending Python với khoảng 3.993 stars và 140 stars hôm nay.
Định vị rõ ràng: MemOS tự mô tả là Memory Operating System cho LLM và AI agents, hợp nhất các tác vụ store / retrieve / manage cho trí nhớ dài hạn.
Dữ kiện sản phẩm: README nhấn mạnh khả năng giảm khoảng 35,24% token usage nhờ cơ chế memory-aware retrieval thay vì luôn bơm ngữ cảnh thô vào prompt.
Tốc độ cập nhật: changelog cho thấy dự án tiếp tục ra plugin cho Hermes Agent và OpenClaw, mở rộng sang local-first memory, hybrid retrieval và skill evolution.

Biểu đồ

flowchart LR A[Hoi thoai va tool traces] --> B[MemOS] B --> C[Store] B --> D[Retrieve] B --> E[Manage] E --> F[Skill va context tai su dung]

Tóm tắt

MemOS nổi bật vì nó không xem bộ nhớ như một tính năng phụ của chatbot, mà nâng nó thành một lớp hạ tầng độc lập cho agent. Trong bối cảnh nhiều hệ thống AI bắt đầu vấp trần context window, chi phí token và trạng thái phiên rời rạc, cách tiếp cận “memory as an operating layer” có ý nghĩa thực dụng hơn nhiều so với việc chỉ kéo dài prompt.

Giá trị chiến lược của repo nằm ở chỗ nó biến trí nhớ thành một tài sản vận hành được: có lưu trữ, có lọc, có feedback, có xoá, có truy hồi lai và có khả năng tái sử dụng qua nhiều task. Với đội đang xây agent stateful hoặc sản phẩm AI có người dùng quay lại nhiều lần, đây là lớp hạ tầng đáng theo dõi.

Chi tiết

Phần lớn sản phẩm AI hiện nay vẫn xử lý trí nhớ theo kiểu chắp vá: hoặc dồn thêm lịch sử vào prompt, hoặc nối với một vector database rồi gọi đó là “memory”. MemOS đi xa hơn bằng cách tách bài toán này thành một hệ điều hành bộ nhớ đúng nghĩa. README mô tả repo như một lớp hợp nhất giữa lưu trữ, truy hồi và quản trị trí nhớ dài hạn cho LLM, hỗ trợ knowledge base, multi-modal memory, tool memory và enterprise optimization. Cách định vị này quan trọng vì nó cho thấy nhóm phát triển không chỉ giải bài toán recall, mà đang cố dựng một control plane cho memory.

Điểm thuyết phục nhất là chiều sâu cập nhật. Changelog cho thấy dự án không đứng yên ở mức paperware: có plugin local chính thức cho Hermes Agent, có plugin cho OpenClaw, có cloud plugin, có feedback loop để sửa trí nhớ sai, có memory deletion, có tag filtering, có image memory, có tool memory và có cả scheduler mới dựa trên Redis Streams. Nói cách khác, MemOS đang tiến từ ý tưởng “hãy nhớ tốt hơn” sang một bộ công cụ đầy đủ để memory trở thành một tài nguyên sống trong hệ agent.

Về mặt kỹ thuật, hướng hybrid retrieval là chi tiết đáng chú ý. Repo nêu rõ kết hợp full-text search, vector retrieval và nhiều lớp quản trị để tránh việc trí nhớ trở thành bãi rác không kiểm soát. Đây là chỗ nhiều sản phẩm agent thường vấp: thêm memory thì dễ, nhưng giữ memory đúng, sạch, truy hồi được và có ích mới khó. MemOS xử lý bài toán này bằng cơ chế feedback, dedup, precise deletion và phân tầng theo vai trò. Điều đó làm repo có giá trị rõ rệt hơn một wrapper RAG thông thường.

Điểm thứ hai là hiệu quả kinh tế. Nếu con số 35,24% token savings giữ được trong thực chiến, đây là lợi thế lớn cho các đội đang chạy agent cường độ cao. Trong vận hành thật, chi phí không chỉ đến từ model pricing mà còn từ độ trễ, băng thông ngữ cảnh và mức ổn định của những prompt quá dài. Một lớp memory-aware retrieval đúng nghĩa giúp hệ thống chọn đúng ký ức cần lấy ra, thay vì nhồi tất cả mọi thứ vào một lần gọi model.

Ở góc nhìn chiến lược, MemOS phản ánh một xu hướng rất rõ: trí nhớ đang trở thành hạ tầng cạnh tranh mới của agent. Khi model nền ngày càng dễ mua và orchestration ngày càng bị hàng hóa hóa, lợi thế sẽ dần dịch sang lớp nhớ được gì, quên gì, học gì và tái sử dụng kinh nghiệm thế nào. Nếu xu hướng đó tiếp tục, những dự án như MemOS có thể đóng vai trò tương tự database hay cache trong thế hệ ứng dụng AI mới: không hào nhoáng bằng model, nhưng quyết định khả năng chạy lâu, chạy rẻ và chạy có ngữ cảnh.

Điểm nổi bật

Biểu đồ

Tóm tắt

Chi tiết

Nguồn