"Bí mật nằm ở cách dữ liệu di chuyển, không phải cách nó được xử lý. XCENA tin rằng tương lai AI phụ thuộc vào một kiến trúc bộ nhớ hoàn toàn khác."

Nhịp Sống Số 24/7
Bỏ 135 triệu USD vào con chip không giống ai: Startup Hàn Quốc đặt cược rằng cổ chai của AI nằm ở bộ...

Khi cả thế giới đang lao vào cuộc đua sản xuất chip AI nhanh hơn, mạnh hơn, một startup Hàn Quốc tên XCENA vừa gây sốc với vòng gọi vốn *$135 triệu USD*. Họ tuyên bố: Nvidia, AMD, tất cả đều đang nhìn nhầm vấn đề. Nút thắt cổ chai thực sự của AI không phải là sức mạnh tính toán (compute), mà là bộ nhớ (memory).

Vấn đề "tường bộ nhớ" trong AI

Các mô hình AI hiện đại như GPT-4 hay Llama 3 tiêu tốn hàng tỷ tham số. Nhưng nghịch lý ở chỗ: bộ xử lý (GPU) ngày càng nhanh, nhưng băng thông bộ nhớ và dung lượng lại không theo kịp. Hãy tưởng tượng bạn có một chiếc siêu xe (GPU mạnh), nhưng đường xá (bộ nhớ) thì chật hẹp và đầy ổ gà. Hậu quả:

- *Thời gian suy luận (inference) chậm* vì chip phải liên tục chờ dữ liệu từ RAM.

- *Tiêu thụ năng lượng khủng khiếp*: Vận chuyển dữ liệu từ chip nhớ đến chip tính toán ngốn điện gấp *100-1000 lần* so với thao tác tính toán.

- *Giới hạn kích thước mô hình*: Bạn không thể "nhồi" một mô hình 1 nghìn tỷ tham số vào VRAM 80GB của GPU H100.

Giải pháp "điên rồ" của XCENA: Không phải SRAM hay DRAM

Thay vì cố gắng chế tạo GPU nhanh hơn, XCENA thiết kế một loại chip nhớ hoàn toàn mới, được tích hợp ngay trên cùng một "tấm silicon" với bộ xử lý. Công nghệ của họ là Compute-in-Memory (CIM) - tính toán ngay trong bộ nhớ. Không cần di chuyển dữ liệu qua lại. Kết quả:

- *Giảm độ trễ xuống gần bằng 0* so với kiến trúc Von Neumann truyền thống.

- *Tiết kiệm năng lượng đến 80%* trong các tác vụ suy luận AI.

- *Mở khóa khả năng chạy các mô hình cực lớn* trên thiết bị biên (edge) hoặc thậm chí trên điện thoại.

Nhà sáng lập của XCENA từng tuyên bố: "Chúng tôi không cạnh tranh với Nvidia. Chúng tôi đang tạo ra một loại chip mà họ sẽ phải mua lại bằng được."

## [Kết luận]

$135 triệu USD từ các quỹ đầu tư mạo hiểm hàng đầu cho thấy giới công nghệ đã chán ngán việc chỉ "xây thêm nhà máy GPU" và bắt đầu tin vào cuộc cách mạng về kiến trúc bộ nhớ. XCENA không hứa hẹn một cỗ máy tính toán "khủng", mà hứa hẹn một hệ thống không còn lãng phí năng lượng và thời gian vào việc chờ đợi dữ liệu. Liệu đây có phải là câu trả lời cho bài toán AI bền vững và có thể chạy mượt trên mọi thiết bị? Hay chỉ là một giấc mơ chip khác? Bạn nghĩ sao: tương lai AI nên nhanh hơn, hay thông minh hơn trong cách sử dụng dữ liệu?