Mô hình tạo ảnh đang kéo tăng trưởng app AI mạnh hơn cả nâng cấp chatbot

Điểm nổi bật
- 6,5 lần: model ảnh tạo ra lượng tải app mới cao hơn các đợt nâng cấp model chatbot truyền thống.
- 22 triệu+ lượt tải: Gemini tăng thêm trong 28 ngày sau khi tung model ảnh Nano Banana.
- 12 triệu+ lượt cài đặt tăng thêm: ChatGPT ghi nhận sau khi ra mắt GPT-4o image model.
- 70 triệu USD: mức gross consumer spending mà ChatGPT ước tính tạo thêm trong 28 ngày sau đợt ra mắt model ảnh.
- 181.000 USD: doanh thu tiêu dùng ước tính của Gemini trong cùng cửa sổ sau cú hích tải app lớn hơn.
Biểu đồ
Tóm tắt
Dữ liệu mới từ Appfigures cho thấy cuộc đua AI trên mobile đang dịch trọng tâm từ chatbot sang trải nghiệm thị giác. Những đợt tung model tạo ảnh hiện tạo ra cú hích tải app mạnh hơn nhiều so với nâng cấp model hội thoại thuần túy, cho thấy người dùng phổ thông phản ứng nhanh hơn với tính năng “nhìn thấy được ngay” thay vì cải thiện chất lượng trả lời khó cảm nhận tức thì.
Nhưng đây không phải câu chuyện tăng trưởng đơn giản. Lượt tải tăng chưa đồng nghĩa doanh thu tăng. Báo cáo cho thấy chỉ một số ít app, đặc biệt là ChatGPT, thực sự biến được sự tò mò quanh model ảnh thành tiền. Vì vậy, lợi thế sản phẩm mới không còn chỉ nằm ở model tốt, mà ở khả năng thiết kế gói trả phí và hành trình chuyển đổi đủ sắc.
Chi tiết
Bài viết của TechCrunch dựa trên dữ liệu Appfigures đưa ra một tín hiệu rất đáng chú ý cho thị trường AI tiêu dùng. Trong giai đoạn đầu của làn sóng GenAI, mỗi lần OpenAI, Google hay các hãng lớn tung model chatbot mới, thị trường thường xem đó là động lực chính kéo người dùng quay lại hoặc cài mới ứng dụng. Nhưng dữ liệu mới cho thấy cán cân đã đổi. Appfigures kết luận rằng các đợt ra mắt model ảnh hiện tạo ra lượng tải app mới cao hơn khoảng 6,5 lần so với các nâng cấp model hội thoại truyền thống.
Ví dụ rõ nhất là Gemini. Sau khi Google tung Nano Banana và lớp image model liên quan, ứng dụng Gemini ghi nhận thêm hơn 22 triệu lượt tải trong 28 ngày, tức tăng hơn 4 lần so với nền trước đó. ChatGPT cũng có cú hích tương tự khi model ảnh GPT-4o đem lại hơn 12 triệu lượt cài đặt tăng thêm trong vòng 28 ngày. Meta AI với Vibes cũng có thêm khoảng 2,6 triệu lượt tải. Tức là ở lớp hành vi người dùng đại chúng, hình ảnh đang là ngôn ngữ thu hút mạnh hơn văn bản.
Lý do khá rõ. Tính năng tạo ảnh cho phép người dùng nhận giá trị gần như tức thì. Kết quả hiện ra ngay, dễ chia sẻ, dễ lan truyền trên mạng xã hội và dễ tạo cảm giác “wow” hơn một cải tiến tinh vi về logic trả lời. Với app AI, điều đó biến image generation thành cỗ máy hút top-of-funnel hiệu quả. Đây là lý do các hãng đang không chỉ đua model nền mà còn đua các chế độ render, style, chỉnh sửa và workflow sáng tạo trực tiếp trong app.
Tuy nhiên, báo cáo cũng chỉ ra mặt khó hơn của bài toán. Lượt tải tăng mạnh không bảo đảm tạo ra doanh thu tương xứng. Dù Gemini có lượng tải tăng rất lớn, Appfigures chỉ ước tính thêm khoảng 181.000 USD gross consumer spending trong cửa sổ 28 ngày. Meta AI gần như không tạo thêm doanh thu đáng kể. Trong khi đó, ChatGPT mới là bên chuyển được sự chú ý thành tiền, với khoảng 70 triệu USD gross consumer spending tăng thêm sau khi tung model ảnh GPT-4o.
Điều này mang ý nghĩa chiến lược quan trọng. Trong AI tiêu dùng, model ảnh đang trở thành công cụ tăng trưởng, nhưng chỉ những hãng có hệ thống đóng gói, giới hạn tính năng, trả phí theo nhu cầu và thương hiệu đủ mạnh mới khai thác được giá trị kinh tế. Phần còn lại có thể chỉ nhận về lượt cài đặt mang tính thử nghiệm, rồi nhanh chóng rơi rụng.
Với các lãnh đạo sản phẩm, tín hiệu của báo cáo không phải là “mọi app AI phải thêm tạo ảnh bằng mọi giá”. Câu hỏi đúng hơn là liệu trải nghiệm thị giác có giúp mở rộng tệp người dùng, tăng thời gian sử dụng, hay làm rõ giá trị trả phí hay không. Cuộc đua AI mobile vì thế đang bước sang giai đoạn mới: không chỉ ai có chatbot tốt hơn, mà ai biến AI thành trải nghiệm trực quan, dễ thử và có thể kiếm tiền bền hơn.