Category: Tương lai con người & AI

Các bài nghiên cứu chuyên sâu về xu thế con người sẽ ra sao với kỷ nguyên AI

Anthropic đẩy mạnh guardrail bầu cử khi AI tham gia ngày càng sâu vào không gian công

Anthropic công bố cập nhật về trung lập chính trị, bộ test 600 prompt, banner dẫn nguồn bầu cử và cơ chế web search, cho thấy AI đang được thiết kế như hạ tầng thông tin công dân.

ERAI-hnt286 lúc 17:10 24 tháng 4, 2026

Tương lai con người & AI

Benchmark cá nhân hóa cho thấy xếp hạng LLM tổng hợp đang lệch khỏi nhu cầu thực

Nghiên cứu từ Đại học Chicago cho thấy xếp hạng LLM dựa trên trung bình toàn bộ người dùng bỏ sót khác biệt sở thích cá nhân rất lớn, gợi ý rằng tương lai đánh giá AI phải chuyển từ benchmark đại trà sang benchmark theo từng kiểu người dùng.

ERAI-hnt286 lúc 05:06 22 tháng 4, 2026

Tương lai con người & AI

Dữ liệu TEC cho thấy LLM vẫn thua con người trong vòng lặp thử-sai thực tế

Bộ dữ liệu TEC ghi lại 5.370 quỹ đạo thử-sai của 46 người cho thấy khoảng cách lớn giữa LLM và con người ở bài toán điều chỉnh chiến lược sau lỗi thực tế.

ERAI-hnt286 lúc 17:03 19 tháng 4, 2026

Tương lai con người & AI

Thước đo mới cho agent nghiên cứu AI, không còn chỉ là làm được mà là làm đúng

Nghiên cứu DR3-Eval đề xuất một benchmark mới cho deep research agents, tập trung vào độ chính xác, độ phủ trích dẫn và khả năng theo chỉ dẫn thay vì chỉ nhìn kết quả bề ngoài.

ERAI-hnt286 lúc 23:07 18 tháng 4, 2026

Tương lai con người & AI

Hyperagents mở đường cho AI tự cải tiến trong bài toán phi lập trình

Nghiên cứu về hyperagents của Meta và các trường đại học gợi ý một hướng mới, nơi agent không chỉ giải bài toán mà còn tự viết lại cách tự cải thiện của chính mình.

ERAI-hnt286 lúc 23:05 16 tháng 4, 2026

Tương lai con người & AI

TREX tự động hóa vòng đời fine-tuning LLM bằng hệ đa tác nhân

Paper TREX đề xuất hệ đa tác nhân với cây tìm kiếm thử nghiệm để tự động hóa toàn bộ vòng đời fine-tuning LLM trong các bài toán thực tế.

ERAI-hnt286 lúc 17:09 16 tháng 4, 2026

Tương lai con người & AI

AI phán xét báo chí mở ra một trận địa mới giữa sự thật, quyền lực và whistleblower

Startup Objection dùng nhiều LLM để chấm độ tin cậy báo chí, làm nổi bật câu hỏi nền tảng về việc AI có nên làm trọng tài của sự thật công cộng hay không.

ERAI-hnt286 lúc 23:10 15 tháng 4, 2026

Tương lai con người & AI

Khung nhìn mới về human agency cảnh báo bad AI sẽ trở thành bad UI trong môi trường rủi ro cao

Một paper mới trên arXiv lập luận rằng khủng hoảng cốt lõi của AI rủi ro cao không phải là niềm tin, mà là sự xói mòn quyền năng tác nhân của con người tại giao diện.

ERAI-hnt286 lúc 17:10 15 tháng 4, 2026

Tương lai con người & AI

PAL đẩy học AI thích ứng thời gian thực và gợi lại vai trò của nền tảng giáo dục số

PAL đề xuất một nền tảng học tập AI có thể phân tích video bài giảng, đặt câu hỏi động và tạo tóm tắt cá nhân hóa theo phản hồi của người học, đẩy giáo dục số từ cá nhân hóa tĩnh sang hỗ trợ thời gian thực.

ERAI-hnt286 lúc 05:07 15 tháng 4, 2026

Tương lai con người & AI

Giải thích AI chuyển từ mô tả sang can thiệp thử nghiệm trong vision model

Một nghiên cứu mới cho thấy activation steering có thể biến công cụ giải thích AI từ lớp quan sát thụ động thành công cụ can thiệp để kiểm chứng giả thuyết, nhưng đi kèm rủi ro lan truyền sai lệch và khó tổng quát hóa.

ERAI-hnt286 lúc 23:04 14 tháng 4, 2026