Category: Tương lai con người & AI
Anthropic đẩy mạnh guardrail bầu cử khi AI tham gia ngày càng sâu vào không gian công
Anthropic công bố cập nhật về trung lập chính trị, bộ test 600 prompt, banner dẫn nguồn bầu cử và cơ chế web search, cho thấy AI đang được thiết kế như hạ tầng thông tin công dân.
Benchmark cá nhân hóa cho thấy xếp hạng LLM tổng hợp đang lệch khỏi nhu cầu thực
Nghiên cứu từ Đại học Chicago cho thấy xếp hạng LLM dựa trên trung bình toàn bộ người dùng bỏ sót khác biệt sở thích cá nhân rất lớn, gợi ý rằng tương lai đánh giá AI phải chuyển từ benchmark đại trà sang benchmark theo từng kiểu người dùng.

Dữ liệu TEC cho thấy LLM vẫn thua con người trong vòng lặp thử-sai thực tế
Bộ dữ liệu TEC ghi lại 5.370 quỹ đạo thử-sai của 46 người cho thấy khoảng cách lớn giữa LLM và con người ở bài toán điều chỉnh chiến lược sau lỗi thực tế.

Thước đo mới cho agent nghiên cứu AI, không còn chỉ là làm được mà là làm đúng
Nghiên cứu DR3-Eval đề xuất một benchmark mới cho deep research agents, tập trung vào độ chính xác, độ phủ trích dẫn và khả năng theo chỉ dẫn thay vì chỉ nhìn kết quả bề ngoài.
Hyperagents mở đường cho AI tự cải tiến trong bài toán phi lập trình
Nghiên cứu về hyperagents của Meta và các trường đại học gợi ý một hướng mới, nơi agent không chỉ giải bài toán mà còn tự viết lại cách tự cải thiện của chính mình.

TREX tự động hóa vòng đời fine-tuning LLM bằng hệ đa tác nhân
Paper TREX đề xuất hệ đa tác nhân với cây tìm kiếm thử nghiệm để tự động hóa toàn bộ vòng đời fine-tuning LLM trong các bài toán thực tế.

AI phán xét báo chí mở ra một trận địa mới giữa sự thật, quyền lực và whistleblower
Startup Objection dùng nhiều LLM để chấm độ tin cậy báo chí, làm nổi bật câu hỏi nền tảng về việc AI có nên làm trọng tài của sự thật công cộng hay không.
Khung nhìn mới về human agency cảnh báo bad AI sẽ trở thành bad UI trong môi trường rủi ro cao
Một paper mới trên arXiv lập luận rằng khủng hoảng cốt lõi của AI rủi ro cao không phải là niềm tin, mà là sự xói mòn quyền năng tác nhân của con người tại giao diện.

PAL đẩy học AI thích ứng thời gian thực và gợi lại vai trò của nền tảng giáo dục số
PAL đề xuất một nền tảng học tập AI có thể phân tích video bài giảng, đặt câu hỏi động và tạo tóm tắt cá nhân hóa theo phản hồi của người học, đẩy giáo dục số từ cá nhân hóa tĩnh sang hỗ trợ thời gian thực.

Giải thích AI chuyển từ mô tả sang can thiệp thử nghiệm trong vision model
Một nghiên cứu mới cho thấy activation steering có thể biến công cụ giải thích AI từ lớp quan sát thụ động thành công cụ can thiệp để kiểm chứng giả thuyết, nhưng đi kèm rủi ro lan truyền sai lệch và khó tổng quát hóa.