Điểm nổi bật
- Stars: 30 stars trên GitHub, nhưng bài Show HN đạt 116 points và 26 comments trong khoảng 6 giờ.
- Tín hiệu mới trong 6h: dự án xuất hiện nổi bật trên
news.ycombinator.com/showtrong đúng cửa sổ slot 3. - Ý tưởng lõi: dùng vòng lặp agent kiểu Karpathy autoresearch để đề xuất, hiện thực, kiểm chứng và giữ lại các cải tiến cho một lõi RV32IM.
- Kết quả được công bố: 73 giả thuyết trong 9 giờ 51 phút, 10 cải tiến được chấp nhận, đưa CoreMark/MHz từ 2.226 lên 2.908 và iter/s từ 301 lên 577.
Biểu đồ
Tóm tắt
Auto-Architecture là một dự án thú vị vì nó đẩy “agentic coding” ra khỏi vùng ứng dụng quen thuộc như web app hay script automation, rồi đặt nó vào một miền khó hơn nhiều: tối ưu vi kiến trúc CPU. Tác giả lấy cảm hứng từ Karpathy autoresearch nhưng thay vì để agent tối ưu code Python hay training loop, họ buộc nó làm việc với một lõi RV32IM và một chuỗi verifier dày đặc gồm formal checks, cosim, place-and-route nhiều seed và xác thực CoreMark.
Điều làm dự án này nổi bật không chỉ là kết quả tăng hiệu năng gần gấp đôi so với baseline. Quan trọng hơn, nó đưa ra một luận điểm chiến lược rất đáng suy nghĩ cho toàn bộ thị trường agent: moat không nằm ở loop nữa, mà nằm ở verifier đủ sắc để agent không tối ưu nhầm mục tiêu.
Chi tiết
Bài blog trong repo mô tả khá tường minh quy trình. Mỗi vòng, agent đề xuất một giả thuyết vi kiến trúc dưới dạng YAML, một implementation agent chỉnh sửa RTL trong worktree riêng, rồi toàn bộ thay đổi bị đưa qua cổng kiểm chứng gồm formal verification, Verilator cosim, nextpnr ba seed và CRC validation. Chỉ khi tất cả cửa kiểm tra đều qua và fitness tăng lên thì thay đổi mới được nhập vào trunk. Kiến trúc này làm rõ một điều: giá trị của dự án không phải “để agent tự do sáng tạo”, mà là dựng một đấu trường nơi mọi sáng tạo đều phải trả giá bằng kiểm chứng cực chặt.
Con số trong bài viết đủ sức khiến cộng đồng HN chú ý: 73 giả thuyết trong chưa đến 10 giờ, 10 cải tiến được chấp nhận, tăng gần 92% so với baseline khóa cứng, đồng thời còn giảm LUT. Nhưng tác giả khéo ở chỗ họ không bán câu chuyện như phép màu của model. Thay vào đó, họ liệt kê cả đống thất bại: regression, formal break, placement fail, sandbox violation, schema error. Đây là điểm cực quan trọng. Nó biến dự án từ một màn demo “AI thắng người” thành một case study về cách tổ chức môi trường để AI thử-sai với chi phí thấp nhưng không phá hỏng hệ thống.
Về mặt chiến lược, Auto-Architecture gợi ra một hướng đi lớn hơn nhiều so với CPU. Nếu một doanh nghiệp có thể viết được verifier đủ tốt cho miền của mình — kế toán, compiler, logistics, vận hành hạ tầng, thậm chí workflow lâm sàng — thì agent loop có thể trở thành bộ máy tìm kiếm cải tiến gần như liên tục. Tác giả nói rất thẳng: loop đang dần hàng hóa; verifier mới là hợp đồng thật của doanh nghiệp với agent. Đây là nhận định rất mạnh, và cũng là lý do dự án này đáng theo dõi dù số sao GitHub còn nhỏ. Nó chạm vào điểm mà nhiều tổ chức đang thiếu nhất: không phải thiếu model, mà thiếu định nghĩa máy-đọc-được cho chữ “đúng”.
Tất nhiên, đây vẫn là dự án còn sớm. Repo chưa lớn, ngôn ngữ chính GitHub báo là HTML vì phần blog docs được đọc nhiều, và phạm vi hiện tập trung vào một benchmark cụ thể. Nhưng như một nguyên mẫu tư duy, Auto-Architecture rất đáng giá. Nó nhắc rằng tương lai của agent có thể không nằm ở việc ai viết code nhanh nhất, mà ở việc ai dựng được verifier đủ tốt để biến tốc độ ấy thành tiến bộ an toàn, đo được và tích lũy được.