Category: Tương lai con người & AI

Đánh giá minh bạch trở thành nút thắt mới của agent tự trị
Paper Claw-Eval cho thấy cách chấm điểm chỉ nhìn kết quả cuối cùng có thể bỏ sót 44% vi phạm an toàn và 13% lỗi độ bền, đặt lại câu hỏi nền tảng về cách con người sẽ tin dùng agent tự trị.

Công cụ đánh giá năng lực dạy học của mô hình AI tiếng Việt
DeepEduBench đưa ra một lớp benchmark riêng cho AI tiếng Việt trong giáo dục, chuyển trọng tâm từ trả lời đúng sang giải thích đúng, có tính sư phạm và phù hợp bối cảnh người học.

Teaching a Tiny Model to Prove Hard Theorems
QED-Nano, mô hình 4B tham số hậu huấn luyện cho chứng minh toán học, cho thấy mô hình nhỏ và mở có thể tiến gần hệ đóng nếu pipeline huấn luyện đủ tốt.

Mô hình 4B QED-Nano tiến sát model đóng trong chứng minh toán học khó
Paper QED-Nano cho thấy một mô hình mở 4B tham số có thể tiến sát năng lực của model độc quyền ở bài toán chứng minh hình thức, với chi phí inference thấp hơn đáng kể.
OpenAI mở Safety Fellowship để kéo thêm lực lượng nghiên cứu an toàn AI
OpenAI mở chương trình fellowship 5 tháng cho nhà nghiên cứu an toàn AI, kèm stipend, compute support và đầu ra bắt buộc như paper, benchmark hoặc dataset.

Incompleteness of AI Safety Verification via Kolmogorov Complexity
Paper chỉ ra giới hạn thông tin học của việc kiểm chứng an toàn AI, nhắc rằng không có bộ xác minh hữu hạn nào có thể chứng nhận mọi trường hợp tuân thủ chính sách có độ phức tạp cao.

Hàng loạt tổ chức kêu gọi chặn rác AI trên YouTube Kids
Hơn 200 tổ chức và chuyên gia đề nghị YouTube cấm hoàn toàn nội dung AI chất lượng thấp trên YouTube Kids, mở ra tranh luận lớn về quản trị AI cho trẻ em.

Chatbot xu nịnh - mặt trái của AI
Nghiên cứu từ Stanford cho thấy nhiều chatbot có xu hướng chiều lòng người dùng thay vì phản biện, tạo ra rủi ro mới cho giáo dục, y tế, chính trị và sức khỏe tinh thần.

Gemma 4 mở bằng Apache 2.0, mở rộng đường cho AI mở và agent tại chỗ
Gemma 4 không chỉ mạnh hơn về reasoning và agentic workflow; việc chuyển sang Apache 2.0 cho thấy tương lai AI có thể được kéo gần hơn về phía cộng đồng phát triển và hạ tầng tại chỗ.

Google mở Gemma 4 bằng Apache 2.0, dịch chuyển quyền lực về phía hệ sinh thái phát triển
Gemma 4 không chỉ nhanh hơn; việc chuyển sang Apache 2.0 cho thấy Google đang chấp nhận một mô hình AI mở hơn để mở rộng ảnh hưởng qua cộng đồng phát triển.