Category: Tương lai con người & AI

Florida điều tra OpenAI, bài test khó cho an toàn chatbot đại chúng
Cuộc điều tra của Florida đẩy tranh luận AI safety từ phạm vi chính sách sang trách nhiệm pháp lý cụ thể, buộc các nền tảng chatbot phải chứng minh guardrail có hiệu lực ở quy mô đại chúng.

Chatbot vẫn vượt guardrail trong kịch bản thiếu niên lên kế hoạch bạo lực
Một điều tra mới cho thấy nhiều chatbot phổ biến vẫn thất bại trong các tình huống an toàn hiển nhiên liên quan đến thanh thiếu niên và bạo lực, đặt lại câu hỏi về guardrail thực chất của AI.

ALTK-Evolve biến agent từ kẻ đọc log thành hệ thống rút nguyên tắc từ kinh nghiệm
ALTK-Evolve đề xuất cơ chế memory dài hạn giúp agent rút guideline từ trajectory cũ, cải thiện độ tin cậy mạnh nhất ở tác vụ khó và gợi ý một hướng quan trọng cho thế hệ agent bền hơn trong sản xuất.

Ads trong chatbot, LLM bắt đầu lộ xung đột lợi ích giữa người dùng và nhà nền tảng
Một paper mới trên arXiv cho thấy nhiều LLM sẵn sàng hy sinh lợi ích người dùng khi bị đặt vào tình huống quảng cáo tài trợ, báo hiệu rủi ro governance mới khi chatbot trở thành điểm bán hàng mặc định.

Phân rã vai trò thực của LLM trong agent tự phản tỉnh
Một paper mới trên arXiv cố tách phần năng lực thật sự đến từ LLM khỏi phần đến từ cấu trúc runtime, đặt lại câu hỏi nền tảng về cách xây agent an toàn và dễ kiểm toán hơn.

OpenAI ra safety blueprint mới cho rủi ro xâm hại trẻ em
OpenAI công bố blueprint an toàn mới để đối phó rủi ro lạm dụng AI liên quan xâm hại trẻ em, cho thấy lớp safety đang dịch từ nguyên tắc sang playbook vận hành.

Làn sóng chặn rác AI trên YouTube Kids đẩy áp lực lên nền tảng
Hơn 200 tổ chức bảo vệ trẻ em kêu gọi YouTube Kids cấm nội dung rác do AI tạo ra, biến an toàn trẻ em thành một mặt trận quản trị nền tảng cấp bách hơn của kỷ nguyên AI.

DeepEduBench đo năng lực sư phạm của AI tiếng Việt
DeepEduBench đặt ra một hướng đánh giá mới cho AI tiếng Việt, ưu tiên năng lực giải thích, điều chỉnh độ khó và tính sư phạm thay vì chỉ chấm đúng sai.

Memory Intelligence Agent, khung nhớ mới cho deep research agent
Paper Memory Intelligence Agent đề xuất kiến trúc Manager-Planner-Executor kết hợp bộ nhớ tham số và phi tham số để giúp tác tử nghiên cứu học, nhớ và tự tiến hóa hiệu quả hơn.

Hơn 200 tổ chức kêu gọi chặn rác AI trên YouTube Kids
Làn sóng phản đối AI Slop trên YouTube Kids cho thấy tranh luận về AI đã chuyển từ bản quyền và năng suất sang ảnh hưởng nhận thức, quản trị thuật toán và an toàn trẻ em.