Tại sự kiện Computex, Nvidia đã giới thiệu dòng laptop “RTX AI PC” mới từ Asus và MSI. Những chiếc laptop này sẽ được trang bị card đồ họa GeForce RTX 4070, vi xử lý AMD Strix mới nhất và hệ điều hành Windows 11 với khả năng AI PC. Điểm đáng chú ý là Nvidia sẽ tích hợp bộ công cụ RTX AI Toolkit vào tháng 6, cho phép tùy chỉnh, tối ưu hóa và triển khai các mô hình AI như Llama 2 của Meta với hiệu suất cao hơn và yêu cầu VRAM thấp hơn.
Tuy nhiên, Nvidia cũng úp mở về việc các mẫu laptop AI đầu tiên sử dụng chip AMD có thể sẽ chưa được cập nhật các tính năng AI của Microsoft ngay từ đầu. Trên blog của mình, Nvidia cho biết: "Những chiếc PC Windows 11 AI này sẽ nhận được bản cập nhật miễn phí các tính năng Copilot+ PC khi có sẵn". Điều này cho thấy Microsoft có thể chưa sẵn sàng để tung ra Recall và các tính năng Windows AI khác trên chip AMD, hoặc có thể có một khoảng thời gian độc quyền nào đó cho phần cứng Windows on Arm do Qualcomm cung cấp ra mắt vào ngày 18/6.
Mặc dù Microsoft đang tập trung phát triển chip NPU để xử lý các tác vụ AI trên laptop, nhưng Nvidia vẫn tự tin khẳng định GPU của họ mới là lựa chọn tối ưu cho việc chạy các tác vụ AI nặng. Nvidia nhấn mạnh vào thương hiệu “RTX AI laptop”, cho rằng GPU của họ có khả năng xử lý khối lượng công việc AI nặng hơn so với NPU.
Không chỉ dừng lại ở việc tối ưu hóa phần cứng, Nvidia còn hợp tác với Microsoft để phát triển các mô hình AI nền tảng được tích hợp vào Windows 11. Sự hợp tác này sẽ cung cấp cho các nhà phát triển ứng dụng quyền truy cập API dễ dàng vào các mô hình ngôn ngữ nhỏ (SLM) được tăng tốc bằng GPU, cho phép họ tạo ra các ứng dụng AI mạnh mẽ hơn chạy trên Windows Copilot Runtime.
Microsoft đã công bố Windows Copilot Runtime tại sự kiện Build vào tháng trước. Nvidia cho biết, công việc của họ trong việc tăng tốc các mô hình AI bằng GPU RTX sẽ được phát hành bản xem trước cho nhà phát triển vào cuối năm nay. Windows Copilot Runtime được thiết kế để giúp các nhà phát triển dễ dàng thêm các tính năng AI vào ứng dụng của họ, đồng thời dựa vào phần cứng NPU để tăng tốc các tính năng đó, hoặc GPU từ Nvidia trong tương lai gần.
Với hiệu suất xử lý AI lên tới hơn 1.000 TOPS, GPU của Nvidia vượt trội hơn hẳn so với NPU hiện tại (khoảng 40 TOPS). Tuy nhiên, NPU lại có ưu điểm là tiêu thụ ít điện năng hơn, phù hợp với các thiết bị di động như laptop. Trong khi đó, GPU lại phù hợp hơn để xử lý các mô hình AI lớn với hiệu suất cao hơn trên máy tính để bàn, nơi thời lượng pin không phải là vấn đề đáng lo ngại.
Cuộc chiến AI trên PC hứa hẹn sẽ còn nhiều diễn biến hấp dẫn trong thời gian tới, đặc biệt là khi Microsoft đang nắm giữ “chìa khóa” để kích hoạt các trải nghiệm này một cách tự nhiên trong Windows cho Nvidia, AMD, Intel, Qualcomm và nhiều đối tác OEM khác.