Các công ty AI mở rộng doanh số từ các mô hình ngôn ngữ ‘nhỏ

Các công ty trí tuệ nhân tạo (AI) đã chi hàng tỉ đô la Mỹ cho nỗ lực phát triển mô hình ngôn ngữ lớn (LLM) nhằm vận hànhh các sản AI tạo sinh. Nhưng giờ đây, họ tập trung vào hướng đi mới để thúc đẩy doanh thu bằng cách xây dựng các mô hình ngôn ngữ nhỏ, ít tiêu tốn năng lượng hơn, an toàn với dữ liệu hơn và dễ được khách hàng đón nhận.

Với 7 tỉ tham số, Phil-3 của Microsoft được xem là mô hình ngôn ngữ nhỏ nhất hiện nay. Ảnh: geeksforgeeks.org

Apple, Microsoft, Meta và Google gần đây đều phát hành các mô hình AI mới với ít tham số hơn nhưng vẫn có khả năng mạnh mẽ. Đây là nỗ lực nhằm khuyến khích doanh nghiệp áp dụng AI khi họ vẫn đang lo ngại về chi phí và sức mạnh điện toán cần thiết để chạy các LLM lớn, công nghệ làm nền tảng cho các chatbot phổ biến như ChatGPT của OpenAI.

Nhìn chung, số lượng tham số càng cao thì hiệu suất của phần mềm AI càng tốt, giúp giải quyết được nhiều nhiệm vụ phức tạp hơn. Mô hình GPT-4o mới nhất của OpenAI và Gemini 1.5 Pro của Google đều ra mắt trong tuần này. Cả 2 mô hình này ước tính có hơn 1.000 tỉ tham số. Trong khi đó, Meta, công ty mẹ của Facebook, đang đào tạo phiên bản 400 tỉ tham số của mô hình Llama nguồn mở của công ty.

Nhưng họ đang gặp khó khăn trong việc thuyết phục một số khách hàng doanh nghiệp trả số tiền lớn cần thiết để vận hành các sản phẩm AI tạo sinh. Bên cạnh đó, những lo ngại về rò rỉ dữ liệu và trách nhiệm bản quyền đang cản trở doanh nghiệp sử dụng các LLM.

Điều đó khiến các công ty công nghệ như Meta và Google phát triển các mô hình ngôn ngữ nhỏ với chỉ vài tỉ tham số, có chi phí rẻ hơn, tiết kiệm năng lượng và có thể tùy chỉnh. Các mô hình này cũng có thể ngăn chặn dữ liệu nhạy cảm bị rò rỉ.

“Bằng cách xây dựng các mô hình ngôn ngữ nhỏ chất lượng cao với mức chi phí thấp hơn, bạn thực sự cho phép khách hàng tiếp cận để thực hiện nhiều ứng dụng và công việc mà trước đây tốn kém đến mức lợi nhuận thu về không bù đắp đủ chi phí đầu tư”, Eric Boyd, Phó Chủ tịch trách nền tảng AI Azure của Microsoft, nơi bán các mô hình AI cho các doanh nghiệp nói.

Google, Meta, Microsoft và Mistral ( công ty khởi nghiệp AI của Pháp) đã phát hành các mô hình ngôn ngữ nhỏ, có thể tập trung tốt hơn vào các ứng dụng cụ thể.

Nick Clegg, Chủ tịch phụ trách các vấn đề toàn cầu của Meta cho biết, hiệu suất của mô hình mới Llama 3 với 8 tỉ tham số có thể so sánh với GPT-4 của OpenAI. “Tôi nghĩ mô hình này có hiệu suất vượt trội ở mọi thước đo”, ông nói.

Các mô hình ngôn ngữ nhỏ có thể xử lý các tác vụ cục bộ trên thiết bị thay vì gửi dữ liệu lên đám mây. Đặc điểm này có thể thu hút những khách hàng quan tâm đến quyền riêng tư dữ liệu, muốn đảm bảo thông tin được lưu giữ trong mạng nội bộ.

“Một trong những thách thức mà nhiều khách hàng của chúng tôi đã gặp phải khi áp dụng các sản phẩm AI tạo sinh là tuân thủ các yêu cầu pháp lý về xử lý và truyền dữ liệu”, Charlotte Marshall, đối tác quản lý của Addleshaw Goddard, một công ty luật tư vấn cho các ngân hàng nói. Bà cho biết, các mô hình nhỏ hơn sẽ giúp doanh nghiệp giảm lo ngại về tuân thủ pháp lý và chi phí.

Chi phí tính theo đơn vị đô la Mỹ đối với 1 triệu từ được nhập vào hoặc tạo ra ở các mô hình ngôn ngữ của OpenAI, Google và Meta. Với 8 tỉ tham số, mô hình Llama 3 của Meta, có chi phí thấp nhất. Ảnh: Financial Times

Các mô hình nhỏ hơn cũng cho phép các tính năng AI có thể vận hành trên các thiết bị như điện thoại di động. Mô hình ngôn ngữ nhỏ Gemini Nano của Google được tích hợp bên trong điện thoại Pixel mới nhất của Google và mẫu điện thoại thông minh S24 mới nhất của Samsung.

Apple đã ám chỉ rằng hãng cũng đang phát triển các mô hình AI để chạy trên iPhone. Tháng trước, Apple phát hành OpenELM, một mô hình ngôn ngữ nhỏ được thiết kế để thực hiện các tác vụ dựa trên văn bản.

Eric Boyd của Microsoft cho biết các mô hình nhỏ hơn sẽ mang đến các ứng dụng thú vị trên điện thoại thông minh và máy tính xách tay.

Tháng 11 năm ngoái, Sam Altman, CEO của OpenAI, tiết lộ công ty đang cung cấp các mô hình AI có quy mô khác nhau cho khách hàng, phục vụ các mục đích riêng biệt. Ông nói thêm OpenAI sẽ tiếp tục xây dựng và bán các tùy chọn mô hình AI này.

“Các mô hình nhỏ hơn sẽ hoạt động thực sự tốt đối với số ứng dụng”, ông nói.

Dù vậy, người đứng đầu OpenAI khẳng định công ty vẫn tập trung vào việc xây dựng các mô hình AI lớn hơn, có khả năng suy luận, lập kế hoạch và thực hiện các nhiệm vụ và cuối cùng đạt được trí thông minh ở cấp độ con người.

Theo Financial Times

Lê Linh

Link gốc

https://thesaigontimes.vn/cac-cong-ty-ai-mo-rong-doanh-so-tu-cac-mo-hinh-ngon-ngu-nho/