ERAI News

Orbit UI — workflow AI điều khiển VM thật

TypeScript 2 giờ trước
Orbit UI — workflow AI điều khiển VM thật

Điểm nổi bật

  • Workflow bằng ngôn ngữ tự nhiên: mỗi node là một lệnh plain English cho agent thực thi.
  • Máy tính thật trong Docker: agent chạy trong container có browser và desktop đầy đủ, không phải sandbox giả lập tối giản.
  • Human takeover: có thể xem qua VNC/noVNC, tạm dừng, lấy quyền điều khiển rồi trả lại cho agent.
  • Use case đa dạng: scrape dữ liệu, điền form, theo dõi trang web định kỳ, phân tích dữ liệu bằng Python trong cùng flow.
  • Đáng chú ý trong slot: repo đi cùng Show HN mới và bám sát làn sóng browser/computer-use agent.

Biểu đồ

flowchart LR A[Node workflow] --> B[Agent thực thi] B --> C[Browser và desktop trong Docker] C --> D[Đọc màn hình thao tác chuột bàn phím] D --> E[Kết quả dữ liệu hoặc tác vụ hoàn tất] C --> F[Con người takeover qua VNC] F --> E

Tóm tắt

Orbit UI là một dự án open source đặt AI agent vào giao diện workflow quen thuộc kiểu n8n, nhưng thay vì gọi API thuần túy, nó điều khiển một máy tính thật chạy trong Docker. Cách tiếp cận này đưa agent từ lớp chatbot hoặc tool caller sang lớp computer-use có kiểm soát, nơi từng bước được mô tả rõ, có thể quan sát và có thể can thiệp.

Điều làm Orbit UI đáng quan tâm là nó kết hợp hai nhu cầu vốn hay tách rời: no-code workflow và full desktop execution. Với các bài toán như điền form, scrape web có tương tác, kiểm tra LMS hay batch thao tác trên giao diện, đây là hướng triển khai thực dụng hơn rất nhiều so với chỉ prompt một agent tự do.

Chi tiết

Theo README và phần giới thiệu ở Show HN, Orbit UI xây các workflow bằng các node như Navigate, Do, Read, Fill, Check, Code, ForEach, Bootstrap. Mỗi node là một chỉ dẫn rõ cho agent, từ đó hạn chế hiện tượng drift hoặc suy diễn lan man vốn hay gặp trong các prompt dài tự do. Đây là điểm thiết kế quan trọng: thay vì cố làm một "siêu agent" biết mọi thứ, Orbit UI tách nhiệm vụ thành những đơn vị có ranh giới tương đối rõ, giúp kiểm soát tốt hơn và cũng dễ audit hơn.

Lớp thực thi của dự án mới là phần hấp dẫn nhất. Agent không chỉ gọi API mà chạy bên trong một Docker container có browser và desktop thực, nên có thể thao tác trên trang web, form, credential flow và các bước UI phức tạp. Việc cho phép xem qua VNC hoặc noVNC, tạm dừng và takeover khi cần khiến Orbit UI phù hợp hơn với môi trường vận hành thật. Đây là sự cân bằng khá khôn ngoan giữa automation và oversight: máy làm phần lặp, con người nhảy vào khi cần quyết định hoặc xử lý ngoại lệ.

Các template tích hợp sẵn như web scraping, login & fill, retry loop, competitor analysis hay CSV batch cho thấy tác giả đang nhắm tới đối tượng không muốn viết quá nhiều code nhưng vẫn cần automation có ngữ cảnh. Đặc biệt, khả năng chạy Python inline với quyền truy cập output của các bước trước giúp Orbit UI nối được hai thế giới: automation giao diện và phân tích dữ liệu. Với những đội growth, operations hay nghiên cứu thị trường, đây là mô hình có giá trị sử dụng ngay.

Dĩ nhiên, loại sản phẩm này sẽ đối mặt với bài toán độ ổn định của browser automation, prompt cost và bảo mật secret. Tuy vậy, Orbit UI có một ưu điểm chiến lược: nó bám rất sát nhu cầu hiện tại của thị trường computer-use agent nhưng đóng gói theo cách quen thuộc với người dùng workflow builder. Nếu dự án tiếp tục hoàn thiện reliability, logging và policy control, nó có thể trở thành lựa chọn hấp dẫn cho các nhóm muốn self-host một lớp automation bằng agent nhưng chưa sẵn sàng tự xây hạ tầng desktop agent từ đầu.

Nguồn

© 2024 AI News. All rights reserved.