ERAI News

XDOF gọi vốn 70 triệu USD để biến dữ liệu robot thành hạ tầng mới của AI

ERAI-hnt286 ERAI-hnt286 2 giờ trước
Nguồn: TechCrunch
XDOF gọi vốn 70 triệu USD để biến dữ liệu robot thành hạ tầng mới của AI

Điểm nổi bật

  • 70 triệu USD vốn mới: XDOF ra khỏi stealth với vòng gọi vốn do Thrive Capital, Spark Capital, a16z, Lux và WndrCo hậu thuẫn.
  • 20 khách hàng đã trả tiền: startup cho biết đang làm việc với khoảng 20 khách hàng, gồm cả frontier AI labs.
  • Khoảng 60 nhân sự: công ty đã xây đội ngũ khá lớn chỉ để giải bài toán dữ liệu cho robotics.
  • Bộ dữ liệu ABC quy mô lớn: hợp tác cùng UC Berkeley để phát hành 130.000 trajectory, 300 giờ mô phỏng và 100 giờ đánh giá.
  • Dịch chuyển lao động dữ liệu: video công nhân giá rẻ và dữ liệu web bị xem là không đủ chất lượng cho thế hệ “physical AI”.

Biểu đồ

flowchart LR A[Physical AI bung no] --> B[Nhu cau du lieu robot] B --> C[Teleoperation] B --> D[Data cleaning] B --> E[Annotation] C --> F[Mo hinh robot tot hon] F --> G[Nghe thu thap du lieu doi vai]

Tóm tắt

XDOF là một dấu hiệu rõ rằng khi AI chuyển từ ngôn ngữ sang thế giới vật lý, những ngành nghề bị tác động không còn chỉ là content hay văn phòng. Bài toán mới nằm ở cách thu thập, làm sạch và gắn nhãn dữ liệu cho robot. Thay vì lấy từ web hoặc video đại trà, AI vật lý cần dữ liệu được tạo ra qua teleoperation, qua sensor chuyên biệt và qua pipeline kiểm soát chất lượng nghiêm ngặt hơn nhiều.

Đó là lý do câu chuyện XDOF đáng đọc dưới góc nhìn lao động. Một lớp việc làm mới đang hình thành quanh “robot data ops”, nhưng đồng thời nó cũng làm giảm giá trị của những kiểu thu thập dữ liệu rẻ, ít cấu trúc từng đủ tốt cho nhiều bài toán AI đời đầu.

Chi tiết

Nếu làn sóng LLM làm cả thị trường quen với ý tưởng “dữ liệu đã có sẵn trên Internet”, thì bài viết về XDOF cho thấy AI vật lý đang phá vỡ giả định đó. Theo TechCrunch, XDOF vừa ra khỏi stealth với 70 triệu USD và đã có khoảng 20 khách hàng, trong đó có các frontier lab. Luận điểm trung tâm của startup khá sắc: nút thắt tiếp theo của AI không phải thêm model hay thêm chip, mà là vòng lặp dữ liệu đủ tốt để dạy máy móc tương tác với thế giới thật.

Điều này có ý nghĩa trực tiếp với câu chuyện ngành nghề bị AI ảnh hưởng. Với robot, dữ liệu không thể chỉ là video YouTube hay footage do gig worker quay ngẫu nhiên. CEO Philipp Wu nói thẳng loại dữ liệu đó vừa độ trung thực thấp vừa khó gắn với vật lý thực. Nghĩa là những hình thức “thu thập dữ liệu giá rẻ” từng hữu ích cho AI thị giác và ngôn ngữ sẽ mất dần vai trò trung tâm khi thị trường chuyển sang physical AI. Thay vào đó, nổi lên một lớp việc làm kỹ thuật hơn: teleoperation để tạo thao tác mẫu, vận hành cảm biến, kiểm lỗi dữ liệu, dựng benchmark và thiết kế pipeline annotation cho robot.

Nguồn gốc của XDOF cũng minh họa cho sự thay đổi này. Wu và đồng sáng lập Fred Shentu từng phát triển GELLO, một hệ thống teleoperation chi phí thấp cho phép con người điều khiển cánh tay robot để sinh dữ liệu huấn luyện. Từ bài toán học thuật, họ nhìn ra nhu cầu thương mại: nếu các lab lớn đang tái khởi động robotics, họ sẽ không thể chờ dữ liệu xuất hiện tự nhiên như cách Internet từng làm với văn bản. Họ phải chủ động “sản xuất” dữ liệu.

Tầm quan trọng của dữ liệu thể hiện rất rõ trong bộ ABC mà XDOF đang cùng UC Berkeley phát hành: 130.000 trajectory thao tác robot, 300 giờ mô phỏng và 100 giờ đánh giá. Với giới nghiên cứu, đây là tín hiệu rằng robotics đang bước vào giai đoạn công nghiệp hóa dữ liệu giống như LLM từng công nghiệp hóa corpus văn bản. Nhưng với thị trường lao động, nó còn hàm ý một điều khác: các vai trò đứng giữa phần cứng, thao tác tay người và pipeline dữ liệu sẽ tăng giá trị.

Bài toán này có thể kéo theo sự phân hóa trong nhiều nghề. Một số việc lặp lại, ít kỹ năng trong khâu quay dữ liệu hoặc gắn nhãn thô có thể mất giá khi doanh nghiệp đòi dữ liệu giàu ngữ cảnh hơn. Trong khi đó, những vai trò kết hợp hiểu robot, biết thiết kế quy trình thu thập và kiểm định dữ liệu sẽ được săn tìm. Nói ngắn gọn, AI không chỉ thay thế ngành nghề; nó còn tái cấu trúc chính công việc hậu cần phía sau mô hình.

Rủi ro là physical AI hiện vẫn ở giai đoạn đầu, nên không phải mọi khoản đầu tư vào dữ liệu robot đều chắc thắng. Nhưng sự xuất hiện của XDOF cho thấy dòng vốn đã bắt đầu đặt cược rằng cuộc đua AI tiếp theo sẽ không còn diễn ra chủ yếu trên web, mà trong nhà máy, kho bãi và môi trường thao tác vật lý. Khi điều đó xảy ra, bản đồ nghề nghiệp quanh dữ liệu cũng sẽ phải viết lại.

Nguồn

No comments yet. Be the first to leave a reply!

Leave a Reply

Your email address will not be published. Required fields are marked *

© 2024 AI News. All rights reserved.