Điểm nổi bật
- Tín hiệu mới: dự án xuất hiện trên Show HN khoảng 3 giờ trước với 9 points và 7 comments, xác nhận đây là tín hiệu mới trong cửa sổ slot.
- Khác biệt kiến trúc: mỗi agent có Space riêng trong cùng một browser, tách khỏi tab của người dùng nhưng vẫn dùng được login và cookie thật.
- Cơ chế điều khiển: thay vì CLI call liên tiếp, agent gọi trực tiếp các JavaScript tool functions như snapshot, fill, click, navigate, capture.
- Hiệu quả công bố: nhóm phát triển nói cách tiếp cận này giúp workflow phức tạp chạy nhanh hơn tới 2,5 lần với ít tool call và ít token hơn.
Biểu đồ
Tóm tắt
ego lite đáng chú ý vì nó thay đổi framing của browser agent. Phần lớn thị trường hiện nay xem browser automation là thư viện hoặc service phụ trợ mà agent phải “lái” từ bên ngoài. ego lite đảo ngược logic đó: chính browser trở thành sản phẩm trung tâm, còn agent CLI chỉ là lớp điều khiển cắm vào. Điều này giải quyết trực diện hai điểm đau lớn nhất là login friction và va chạm tab với người dùng.
Show HN đi kèm phản hồi ban đầu cũng cho thấy dự án chạm đúng nhu cầu thật. Người dùng quan tâm không chỉ việc agent có click được không, mà còn việc có thể giữ tài khoản thật, mở nhiều phiên song song và không chiếm chuột hay tab đang dùng. Với các workflow sales, research, scraping hay ops, đây là hướng rất thực dụng.
Chi tiết
README của ego lite nói khá rõ dự án không muốn trở thành một browser automation framework kiểu cũ. Vấn đề mà nhóm phát triển nhắm tới là khoảng cách giữa demo browser agent và trải nghiệm làm việc thật. Trong hầu hết giải pháp hiện nay, agent phải điều khiển một browser tách biệt, đăng nhập lại từ đầu, hoặc tệ hơn là cướp chính tab người dùng đang mở. Điều này khiến những bài toán nghe có vẻ đơn giản như theo dõi tài khoản xã hội, thao tác CRM, ứng tuyển việc làm hay thu thập dữ liệu web trở nên khó dùng ở môi trường thực.
ego lite chọn kiến trúc “one browser, many spaces”. Người dùng vẫn có browser riêng để duyệt web như bình thường, trong khi mỗi agent được cấp một Space độc lập để xử lý task nền. Điểm mạnh của mô hình này là nó tách bề mặt tương tác thay vì nhân bản cả môi trường. Agent không tranh chuột, không phá tab, nhưng vẫn có thể kế thừa cookie, extension, bookmark và login đã được migrate từ Chrome. Đây là lợi thế thực dụng rất lớn so với các framework chỉ điều khiển một browser vô danh qua CDP hoặc Playwright.
Một chi tiết khác đáng chú ý là ego-browser không ép agent đi qua vòng lặp CLI tool-call quá hạt mịn. Thay vào đó, repo mô tả việc bọc capability thành JavaScript functions chạy ngay trong trang: snapshot, fill, click, wait, navigate, capture. Điều này quan trọng vì với model text, mỗi vòng “gọi công cụ → đọc kết quả → gọi tiếp” đều tốn token và tăng độ mong manh. Cách tiếp cận code-first giúp agent gom nhiều thao tác thành một nhịp hành động, lý giải cho claim nhanh hơn tới 2,5 lần trên các bài benchmark phức tạp.
Show HN thread cũng củng cố luận điểm này. Các bình luận xoay quanh việc Space concept giúp agent có không gian riêng nhưng vẫn giữ credential, cũng như việc dùng JavaScript thay vì CLI command lẻ có thể giảm độ ì và tăng hiệu suất. Dù thread còn sớm, phản hồi cho thấy cộng đồng đang dịch chuyển từ câu hỏi “browser agent có làm được không” sang “nó có đủ tốt cho workflow hàng ngày không”. ego lite trả lời trực diện bằng một sản phẩm browser-first.
Rủi ro nằm ở chỗ dự án hiện mới hỗ trợ macOS và phần browser chính là một download riêng biệt, trong khi repo GitHub phát hành lớp integration và tài liệu nhiều hơn là toàn bộ browser engine. Dù vậy, với tư duy thiết kế xoay quanh shared browser, parallel spaces và local data, ego lite là tín hiệu đáng theo dõi cho lớp hạ tầng browser-agent thế hệ mới.