Vì sao AI của Google vẫn không thể đánh vần nổi cả từ Google

Điểm nổi bật

00:17:41 UTC ngày 28/05/2026: TechCrunch đăng bài phân tích về việc AI Overview của Google trả lời sai những câu hỏi đánh vần cực cơ bản, nằm đúng khung slot 3.
2 lỗi minh họa rất dễ hiểu: AI nói từ Google có 2 chữ p, và viết sai cả từ journalism lẫn họ của Tổng thống Mỹ.
1 thừa nhận công khai từ Google: hãng nói “đếm trong từ là thách thức đã biết của LLM” và đang tìm cách sửa lỗi cụ thể này.
1 nguyên nhân kiến trúc cốt lõi: LLM xử lý văn bản theo token và vector ngữ nghĩa, không “đọc chữ cái” như con người.
Ý nghĩa chiến lược: khi AI trở thành lớp giao diện chính của tìm kiếm, các lỗi nhỏ kiểu này không còn là chuyện vui, mà là vấn đề niềm tin sản phẩm ở quy mô đại chúng.

Biểu đồ

flowchart LR A[Người dùng hỏi đếm chữ cái] --> B[AI Overview suy luận theo token] B --> C[Trả lời sai chính tả cơ bản] C --> D[Giảm niềm tin vào AI Search] D --> E[Buộc Google sửa mô hình và guardrail]

Tóm tắt

Bài viết của TechCrunch nêu ra một nghịch lý đáng chú ý của làn sóng AI tạo sinh: cùng một hệ thống có thể viết code, tóm tắt tài liệu hay trả lời câu hỏi phức tạp, nhưng lại vấp ở bài toán tưởng như sơ đẳng là đếm chữ cái trong một từ. Với Google, vấn đề này nhạy cảm hơn hẳn vì lỗi xuất hiện ngay trong AI Overview, lớp trả lời đang được đẩy lên trung tâm trải nghiệm tìm kiếm.

Điểm quan trọng nhất không nằm ở việc một chatbot “đùa hỏng”, mà ở chỗ lỗi này phản ánh giới hạn kiến trúc của LLM. Khi AI được đóng gói như giao diện mặc định cho hàng tỷ truy vấn, các sai sót cấp tiểu học có thể làm xói mòn niềm tin người dùng nhanh hơn nhiều so với các lỗi chuyên môn khó kiểm chứng.

Chi tiết

TechCrunch mở bài bằng một ví dụ rất trực diện: hỏi có bao nhiêu chữ p trong từ “Google”, và hệ thống AI của Google trả lời là có hai. Bài viết còn nêu thêm các ví dụ khác như AI Overview khẳng định từ “poop” có đúng một chữ r, hay viết sai từ “journalism” và cả họ của Tổng thống Mỹ. Đây là những lỗi đơn giản đến mức người dùng phổ thông cũng phát hiện ngay, nên tác động truyền thông của chúng lớn hơn nhiều so với các lỗi tinh vi chỉ giới nghiên cứu mới thấy.

Về mặt sản phẩm, thời điểm xảy ra lỗi cũng đáng chú ý. Google vừa đẩy mạnh chiến lược AI-first cho Search, đặt AI Overview và các lớp trả lời tổng hợp vào vị trí nổi bật hơn trong hành trình truy vấn. Điều đó nghĩa là mỗi sai sót không còn nằm ở một chatbot thử nghiệm bên lề, mà xuất hiện ngay tại cửa ngõ thông tin lớn nhất của internet đại chúng. Khi một công cụ được kỳ vọng là “biết hết” lại trượt ở cấp đánh vần, người dùng sẽ tự động đặt câu hỏi ngược lại: vậy những phần tôi khó tự kiểm chứng thì sao?

Google đã phản hồi với TechCrunch rằng đếm trong từ là một thách thức đã biết của LLM và hãng đang sửa lỗi cụ thể này. Câu trả lời đó quan trọng vì nó thừa nhận đây không phải bug giao diện đơn lẻ, mà là vấn đề gắn với bản chất mô hình. Bài viết nhắc lại giải thích quen thuộc của giới nghiên cứu: mô hình ngôn ngữ lớn không xử lý ngôn ngữ theo cách con người nhìn từng chữ cái. Chúng chuyển văn bản thành token rồi thành các biểu diễn số học, từ đó dự đoán phần tiếp theo dựa trên ngữ cảnh xác suất. Vì vậy, với các bài toán cần đếm chính xác ở cấp ký tự, LLM thường yếu hơn trực giác của người dùng.

TechCrunch còn dẫn các ý kiến học thuật cho thấy giới nghiên cứu không quá lạc quan rằng bài toán này sẽ biến mất hoàn toàn chỉ bằng vài bản vá nhỏ. Nếu nền tảng xử lý của mô hình vẫn ưu tiên token và chunk ngữ nghĩa, thì lỗi ở tầng ký tự có thể tiếp tục tái diễn trong những tình huống khác. Nói cách khác, đây là lời nhắc rằng sức mạnh của generative AI không đồng nghĩa với độ chính xác phổ quát.

Ở góc nhìn chiến lược, bài học lớn hơn dành cho doanh nghiệp không phải “AI dở”, mà là “AI phải được đặt vào đúng lớp kiểm soát”. Một hệ thống có thể rất mạnh ở tổng hợp, suy luận hay giao tiếp, nhưng vẫn cần guardrail, kiểm tra hậu kỳ và thiết kế trải nghiệm để người dùng biết lúc nào nên tin, lúc nào nên xác minh lại. Với Google, thách thức không chỉ là sửa câu trả lời về chữ p, mà là bảo vệ niềm tin vào tầm nhìn AI Search khi những lỗi ngớ ngẩn nhất lại là thứ dễ lan truyền nhất.

Nguồn

TechCrunch

Điểm nổi bật

Biểu đồ

Tóm tắt

Chi tiết

Nguồn

Leave a Reply