OpenAI vừa lên tiếng giải thích về một hiện tượng kỳ lạ: việc các mô hình AI của họ, đặc biệt là khi kích hoạt chế độ "Nerdy", liên tục nhắc đến những sinh vật huyền bí như goblin, gremlin.
Từ "Nerdy" Đến "Goblin": Nguồn Gốc Của Vấn Đề
Theo báo cáo từ Wired, OpenAI đã đưa ra chỉ thị cho mô hình coding của mình là không được đề cập đến goblin, gremlin, raccoon, troll, ogre, pigeons, hoặc các loài động vật/sinh vật khác. Điều này nghe có vẻ vô lý, nhưng lại là một nỗ lực giải quyết một vấn đề phát sinh trong quá trình huấn luyện.
Hiện tượng này bắt đầu xuất hiện từ mô hình GPT-5.1, khi người dùng chọn "Nerdy" làm tính cách. Các mô hình sau này tiếp tục gặp phải tình trạng tương tự, thậm chí còn trở nên tồi tệ hơn. OpenAI mô tả đây là một "thói quen kỳ lạ" mà các mô hình học được trong quá trình tiếp xúc với lượng lớn dữ liệu trên internet.
- Việc lạm dụng các phép ẩn dụ liên quan đến goblin và các sinh vật khác gây khó khăn trong việc tạo ra các phản hồi mạch lạc và hữu ích.
- OpenAI lo ngại rằng việc này có thể dẫn đến những kết quả không mong muốn hoặc thậm chí là gây hiểu lầm.
Giải Thích Của OpenAI: Dữ Liệu Huấn Luyện & Phép Ẩn Dụ
OpenAI cho rằng, nguyên nhân gốc rễ của vấn đề nằm ở dữ liệu huấn luyện khổng lồ mà các mô hình AI tiếp xúc.
- Trên internet, goblin và các sinh vật tương tự thường được sử dụng như những phép ẩn dụ để mô tả các lỗi, vấn đề kỹ thuật hoặc những điều khó giải thích.
- Các mô hình AI, khi học cách tạo ra văn bản giống con người, đã vô tình "học" theo cách sử dụng phép ẩn dụ này.
- Chế độ "Nerdy" có thể khuếch đại xu hướng này, vì nó khuyến khích mô hình sử dụng ngôn ngữ phức tạp và trừu tượng hơn.
Việc OpenAI phải đưa ra lệnh cấm cho thấy sự phức tạp trong việc kiểm soát hành vi của các mô hình AI. Dù đã cố gắng lọc dữ liệu và tinh chỉnh thuật toán, nhưng vẫn có những "lỗ hổng" bất ngờ xuất hiện.
Hướng Đi Tương Lai & Câu Hỏi Mở
Hiện tại, OpenAI đang tiếp tục nghiên cứu và tìm cách khắc phục vấn đề này. Họ đang thử nghiệm các phương pháp mới để giảm thiểu sự xuất hiện của các phép ẩn dụ không mong muốn.
- Cải thiện quá trình lọc dữ liệu huấn luyện.
- Tinh chỉnh thuật toán để giảm sự phụ thuộc vào các phép ẩn dụ.
- Phát triển các cơ chế kiểm soát hành vi của mô hình tốt hơn.
Liệu OpenAI có thể loại bỏ hoàn toàn "hội chứng goblin" này? Và liệu việc kiểm soát quá chặt chẽ các phép ẩn dụ có thể làm giảm tính sáng tạo và linh hoạt của các mô hình AI hay không?
0 Nhận xét