AI “ăn” video: Ai thực sự xem, ai chỉ giả vờ?

"Gemini, ChatGPT, Claude đều nói biết phân tích video, nhưng liệu chúng có thực sự “hiểu” nội dung hay chỉ lừa bạn?"

Nhịp Sống Số 24/7
AI “ăn” video: Ai thực sự xem, ai chỉ giả vờ?

Đặt một AI vào một video YouTube dài 30 phút và bảo nó tóm tắt, bạn sẽ ngay lập tức biết thằng nào đang “diễn” kịch. Thử nghiệm thực tế với ba ông lớn: Gemini, ChatGPT và Claude, dùng clip YouTube ngẫu nhiên và cả video tự tải lên. Kết quả có một cái tên vượt trội, một cái thông minh nhưng chậm, và một cái như thể đang ngủ gật.

Gemini: Chuyên gia xem clip trên YouTube

*Khi bạn dán link YouTube vào hộp thoại, Gemini xử lý ngay lập tức*. Nó không chỉ “đọc” phụ đề hay metadata – nó thực sự quét từng khung hình. Thử gõ: “Phân tích chi tiết video này, ai đang nói, bối cảnh là gì?” Gemini trả về bối cảnh chính xác, thậm chí nhận ra người dẫn vô danh trong một clip hướng dẫn. Tuy nhiên, chỉ hoạt động với link YouTube – tải file MP4 lên trực tiếp khiến Gemini bối rối, nó bảo không đọc được.

ChatGPT: Đọc phụ đề, không phải hình ảnh

ChatGPT có thể “xem” qua tính năng Vision, nhưng thực tế là nó lấy nội dung từ phụ đề và transcript. Thử với video không lời (clip chim săn mồi), ChatGPT đoán sai hoàn toàn bối cảnh – nó suy diễn dựa trên tiêu đề thuật toán, không phải hình ảnh thực. Phù hợp với video có lời thoại rõ ràng, thất bại với nội dung visual thuần túy..

Claude: Giả vờ tinh vi nhất

Claude, dù mới, tỏ ra nguy hiểm nhất: Nó tạo ra phân tích hợp lý đến mức bạn tin nó thực sự nhìn thấy. Ví dụ, một clip với nhân vật đang khóc nước mắt giả, Claude viết: “Nhân vật rất xúc động, cần đồng cảm.” Sau khi mở video thực tế, hóa ra đó là cảnh giả khóc trong hậu trường phim hài. Claude không xem – nó chỉ đoán từ metadata và văn bản, tạo ảo tưởng hoàn hảo.

[Kết luận]

Nếu bạn cần người thực sự “xem” video YouTube, hãy chọn Gemini – nó ngẫu nhiên và chính xác nhất. ChatGPT hợp lý cho phụ đề, Claude là kẻ lừa đảo đẹp mã. Thử ngay: Dán một video bất kỳ với âm thanh tắt tiếng, bạn sẽ thấy AI nào đổ vỡ đầu tiên. Câu hỏi cuối: Liệu sự thông minh về mặt thuật toán có đáng tin hơn một con người lười biếng?

Đăng nhận xét

0 Nhận xét