🔍
Chuyên mục: CNTT - Viễn thông

Giải mã kỹ thuật bẻ khóa chip Apple M4: Khai mở 15,8 TFLOPS để huấn luyện AI

1 giờ trước
Bằng cách vượt qua các rào cản phần mềm khắt khe của Apple, một nhà phát triển đã thành công trong việc mở khóa khả năng huấn luyện AI chuyên sâu trên dòng chip M4 với hiệu suất ấn tượng.

Từ trước đến nay, Apple luôn duy trì chính sách kiểm soát chặt chẽ đối với phần cứng của mình. Dòng chip M4 dù sở hữu sức mạnh xử lý trí tuệ nhân tạo (AI) đáng nể, nhưng Neural Engine bên trong thường bị giới hạn ở tác vụ suy luận (inference) – tức là chỉ chạy các mô hình đã được huấn luyện sẵn. Tuy nhiên, một bước đột phá mới từ cộng đồng mã nguồn mở đã thay đổi hoàn toàn cục diện này.

Chip Apple M4.

Khai phá sức mạnh 15,8 TFLOPS bị ẩn giấu

Một nhà phát triển có biệt danh 0x0SojalSec đã thực hiện đảo ngược kỹ thuật (reverse-engineering) thành công Neural Engine của chip M4. Kết quả là mở khóa được 15,8 TFLOPS sức mạnh tính toán vốn bị Apple khóa bằng phần mềm. Đáng chú ý, con số này không chỉ dành cho các tác vụ thông thường mà tập trung trực tiếp vào khả năng huấn luyện AI (AI training).

Thành tựu này cho phép thực hiện các kỹ thuật phức tạp như lan truyền ngược (backpropagation) và huấn luyện mô hình Transformer trực tiếp trên Neural Engine. Đây là điều mà trước đây Apple không cho phép thực hiện trên các thiết bị thương mại như iPad hay Mac sử dụng chip M4, vốn chỉ ưu tiên cho việc thực thi các mô hình nhẹ nhàng.

Vượt qua hệ sinh thái đóng của Apple

Điểm ấn tượng nhất của dự án này là nhà phát triển đã thực hiện hoàn toàn bên ngoài hệ sinh thái chính thức của Apple. Do Apple không cấp quyền truy cập cấp thấp để giao tiếp trực tiếp với Neural Engine cho các tác vụ nâng cao, 0x0SojalSec đã phải tự xây dựng một ngôn ngữ trung gian cho mô hình (Model Intermediate Language) từ con số không.

Giải pháp này cho phép bỏ qua các bộ công cụ tiêu chuẩn như CoreML hay Metal – những công cụ vốn bị Apple giới hạn tính năng. Bằng cách tạo ra một cầu nối phần mềm tùy chỉnh, nhà phát triển có thể ra lệnh trực tiếp cho phần cứng thực hiện các phép toán ma trận phức tạp cần thiết cho việc huấn luyện AI.

Tối ưu hóa độ ổn định và tốc độ xử lý

Việc huấn luyện AI là một quá trình tiêu tốn cực kỳ nhiều tài nguyên và dễ gây mất ổn định hệ thống. Để giải quyết vấn đề này, nhà phát triển đã áp dụng một số kỹ thuật xử lý thông minh:

Cơ chế tự phục hồi: Sử dụng lệnh thực thi đặc biệt để tái khởi động (respawn) các tiến trình nếu chúng bị treo trong giai đoạn huấn luyện cường độ cao, giúp chương trình không bị sập hoàn toàn.
Tối ưu hóa bộ nhớ: Toàn bộ dữ liệu huấn luyện được cấu hình để ghi trực tiếp vào RAM hệ thống thay vì bộ nhớ Flash NAND. Việc tránh sử dụng bộ nhớ lưu trữ tốc độ thấp giúp duy trì băng thông dữ liệu cực cao, đảm bảo quá trình huấn luyện diễn ra mượt mà.

Dưới đây là bảng tóm tắt sự khác biệt giữa khả năng mặc định và khả năng sau khi được mở khóa trên chip M4:

Tương lai của AI trên thiết bị Apple

Mặc dù đây mới chỉ là một dự án nghiên cứu độc lập được chia sẻ trên GitHub, nhưng nó đã chứng minh rằng phần cứng của Apple (Silicon) có tiềm năng vượt xa những gì hãng công bố chính thức. Đối với người dùng iPad Pro hoặc Mac chạy chip M4, thông tin này mở ra triển vọng về việc có thể tự huấn luyện các mô hình ngôn ngữ nhỏ hoặc AI cá nhân hóa ngay trên thiết bị mà không cần phụ thuộc vào máy chủ đám mây trong tương lai.

Tuy nhiên, người dùng cũng cần lưu ý rằng việc can thiệp sâu vào hệ thống như vậy có thể ảnh hưởng đến chính sách bảo hành và độ bền của linh kiện nếu không được kiểm soát nhiệt độ kỹ lưỡng.

Tuệ Nhân
















Home Icon VỀ TRANG CHỦ