Thách thức mới cho Nvidia

Khi giai đoạn đào tạo trôi qua, các công ty chuyển sang đầu tư hệ thống triển khai AI, đòi hỏi sức mạnh và chi phí thấp hơn.

Nvidia trở thành công ty trị giá 2.000 tỷ USD nhờ cung cấp những con chip quan trọng, dùng để huấn luyện các mô hình trí tuệ nhân tạo (AI) phức tạp.

Khi giai đoạn đào tạo trôi qua, các công ty dần chuyển sang mua chip để vận hành mô hình, đặc biệt với những công cụ AI tạo sinh đang được nhiều người sử dụng.

Sự thay đổi trong nhu cầu mua chip AI đã tác động đến Nvidia. Theo Giám đốc Tài chính Colette Kress, hơn 40% hoạt động kinh doanh trung tâm dữ liệu của công ty trong năm 2023 liên quan đến triển khai AI thay vì đào tạo.

Sau thành công với hoạt động bán chip đào tạo mô hình, Nvidia có thể nắm bắt cơ hội khi xu hướng chuyển dịch. Tuy nhiên, công ty này sẽ đối mặt sức cạnh tranh lớn từ đối thủ.

Không cần chip quá mạnh

Những hệ thống dùng để triển khai, vận hành AI được gọi là "suy luận" (inference). Theo WSJ, giai đoạn này không đòi hỏi chip quá mạnh và đắt. Điều đó có thể đe dọa vị thế của Nvidia.

"Có quan điểm cho rằng thị phần của Nvidia sẽ thấp hơn trên thị trường chip suy luận so với huấn luyện", Ben Reitzes, nhà phân tích tại Melius Research, cho biết.

 Nervana NNP-I, mẫu chip dùng cho hệ thống suy luận AI của Intel. Ảnh: CNET.

Nervana NNP-I, mẫu chip dùng cho hệ thống suy luận AI của Intel. Ảnh: CNET.

Nhiều đối thủ của Nvidia tự tin khả năng cạnh tranh khi nhu cầu chip suy luận ngày càng lớn, một trong số đó là Intel.

Với mảng kinh doanh bộ xử lý trung tâm (CPU) cho trung tâm dữ liệu, Intel tin rằng sản phẩm của công ty sẽ được ưa chuộng khi khách hàng muốn giảm chi phí vận hành mô hình AI.

Theo WSJ, một số dòng chip Intel đã được sử dụng rộng rãi trong hệ thống suy luận, vốn không cần những con chip quá mạnh hay đắt tiền như H100 của Nvidia.

"Tính kinh tế của giai đoạn suy luận là tôi không cần hệ thống H100, trị giá 40.000 USD nhưng tốn quá nhiều năng lượng, đòi hỏi mô hinh bảo mật, quản trị và cơ sở hạ tầng mới.

Nếu có thể chạy những mô hình ấy trên chip Intel tiêu chuẩn thì quá dễ lựa chọn", CEO Intel Pat Gelsinger cho biết trong cuộc phỏng vấn vào tháng 12/2023.

Sự khác nhau giữa 2 thị trường

Vivek Arya, nhà phân tích tại Bank of America, cho biết xu hướng chuyển sang suy luận AI là thông tin quan trọng từ báo cáo tài chính của Nvidia.

Khi giai đoạn đầu tư trôi qua, Arya cho rằng nhu cầu kiếm tiền từ AI có thể khiến các công ty tìm chip suy luận. Thị trường này sẽ cạnh tranh hơn so với chip đào tạo AI, nơi Nvidia đang thống trị.

Jensen Huang, CEO Nvidia. Ảnh: Reuters.

Tốc độ phát triển thị trường chip suy luận có thể nhanh hơn ước tính. Đầu năm nay, các nhà phân tích của UBS cho rằng chip suy luận chỉ giúp thúc đẩy 20% thị trường. Thực tế, 40% doanh thu trung tâm dữ liệu của Nvidia đến từ chip suy luận.

"Đó là con số lớn hơn mong đợi", các nhà phân tích cho biết.

Tất nhiên, chip huấn luyện AI vẫn sẽ là thị trường lớn nhất của Nvidia trong tương lai gần. Ở giai đoạn này, các công ty vận hành lượng lớn dữ liệu thông qua mô hình, giúp chúng dự đoán ngôn ngữ và diễn đạt giống con người. Công việc đòi hỏi sức mạnh tính toán lớn, phù hợp với chip đồ họa (GPU) của Nvidia.

Trong khi đó, giai đoạn suy luận diễn ra khi các mô hình được yêu cầu xử lý thông tin mới và phản hồi cho người dùng. Tác vụ này không đòi hỏi nhiều sức mạnh xử lý.

Nắm bắt cơ hội

Ngoài đối thủ lâu đời như Intel hay AMD, nhiều startup cũng muốn tìm kiếm cơ hội cạnh tranh khi xu hướng phát triển AI chuyển sang nhu cầu suy luận.

"Chúng tôi đang chứng kiến nhu cầu suy luận bùng nổ trong năm nay. Mọi người nhận ra hơn 80% chi phí sẽ dành cho suy luận, và tôi cần tìm kiếm các giải pháp thay thế", Rodrigo Liang, CEO SambaNova - startup phát triển giải pháp kết hợp huấn luyện và suy luận AI bằng chip và phần mềm, cho biết.

Groq - startup thành lập bởi Jonathan Ross, cựu kỹ sư chip AI tại Google, cũng ghi nhận nhu cầu chip suy luận tăng vọt. Công ty này vừa trình diễn các mẫu chip suy luận có thể phản hồi cực nhanh từ mô hình ngôn ngữ lớn.

Theo Ross, Groq đang triển khai 42.000 chip suy luận AI trong năm nay, đặt mục tiêu bán một triệu chip vào 2025. Tuy nhiên, công ty muốn tăng mục tiêu lên lần lượt 220.000 và 1,5 triệu chip.

Chip suy luận AI của Groq. Ảnh: Groq.

Cựu kỹ sư Google cho biết một số hệ thống AI đang được điều chỉnh để phản hồi tốt hơn mà không cần đào tạo lại, khiến phần lớn tác vụ tính toán chuyển sang suy luận. Ông tự tin chip của Groq chạy nhanh và rẻ hơn so với Nvidia hay những công ty khác.

"Để phục vụ giai đoạn suy luận, những gì bạn có thể triển khai sẽ dựa vào chi phí. Có rất nhiều mô hình đào tạo tại Google hoạt động được, nhưng khoảng 80% không được triển khai vì quá đắt để đưa vào thực tế", Ross nhấn mạnh.

Các hãng công nghệ như Meta, Microsoft, Amazon và Alphabet cũng phát triển chip suy luận AI để nắm bắt xu hướng và tiết kiệm chi phí. Ví dụ, Amazon đã có chip suy luận từ năm 2018, giai đoạn này chiếm 40% chi phí tính toán cho trợ lý thông minh Alexa.

Về phần mình, Nvidia đang tìm cách duy trì vị thế khi nhu cầu chuyển từ đào tạo sang suy luận AI. Công ty chuẩn bị ra mắt mẫu chip mới chuyên cho giai đoạn này, thậm chí phản bác quảng cáo của AMD khi cho rằng sản phẩm Nvidia chậm hơn.

Phúc Thịnh

Nguồn Znews: https://znews.vn/thach-thuc-moi-cho-nvidia-post1462293.html