Tại sự kiện TechXchange thường niên của IBM, doanh nghiệp đã công bố phiên bản mô hình AI tiên tiến nhất cho đến nay, Granite 3.0. Các mô hình ngôn ngữ chủ lực Granite thế hệ thứ ba của IBM có thể vượt trội hơn hoặc ngang bằng với các mô hình có kích thước tương tự từ các nhà cung cấp mô hình hàng đầu trên nhiều chuẩn mực học thuật và công nghiệp, thể hiện hiệu suất mạnh mẽ, tính minh bạch và tính an toàn.
Phù hợp với cam kết của công ty đối với AI nguồn mở, các mô hình Granite được phát hành theo giấy phép Apache 2.0 cho phép, giúp chúng trở nên độc đáo trong sự kết hợp giữa hiệu suất, tính linh hoạt và tính tự chủ mà chúng cung cấp cho khách hàng doanh nghiệp và cộng đồng nói chung.
Các mô hình ngôn ngữ Granite 3.0 8B và 2B mới được thiết kế như các mô hình "chủ lực" cho AI doanh nghiệp, mang lại hiệu suất mạnh mẽ cho các tác vụ như Retrieval Augmented Generationation (RAG), phân loại, tóm tắt, trích xuất thực thể và sử dụng công cụ. Các mô hình nhỏ gọn, linh hoạt này được thiết kế để tinh chỉnh với dữ liệu doanh nghiệp và tích hợp liền mạch trên nhiều môi trường kinh doanh hoặc quy trình làm việc khác nhau.
Trong khi nhiều mô hình ngôn ngữ lớn (LLM) được đào tạo trên dữ liệu có sẵn công khai, thì phần lớn dữ liệu doanh nghiệp vẫn chưa được khai thác. Bằng cách kết hợp một mô hình Granite nhỏ với dữ liệu doanh nghiệp, đặc biệt là sử dụng kỹ thuật căn chỉnh mang tính cách mạng InstructLab - do IBM và RedHat giới thiệu hồi tháng 5 - IBM tin rằng các doanh nghiệp có thể đạt được hiệu suất theo từng tác vụ cụ thể, ngang bằng với các mô hình lớn hơn với chi phí chỉ bằng một phần nhỏ (dựa trên phạm vi chi phí thấp hơn 3x-23x so với các mô hình biên giới lớn trong một số bằng chứng khái niệm ban đầu).
Bản phát hành Granite 3.0 tái khẳng định cam kết của IBM trong việc xây dựng tính minh bạch, an toàn và sự tin cậy vào các sản phẩm AI. Báo cáo kỹ thuật Granite 3.0 và hướng dẫn sử dụng có trách nhiệm cung cấp mô tả về các tập dữ liệu được sử dụng để đào tạo các mô hình này, thông tin chi tiết về các bước lọc, làm sạch và quản lý được áp dụng, cùng với kết quả toàn diện về hiệu suất mô hình trên các chuẩn mực học thuật và doanh nghiệp chính.
Các mô hình "Granite 3.0" được mã nguồn mở, tương tự như những phiên bản khác trong họ AI Granite của IBM. Cách tiếp cận này khác với các đối thủ như Microsoft, nơi tính phí khách hàng khi truy cập vào các mô hình. Đổi lại, IBM cung cấp một công cụ trả phí có tên là Watsonx, giúp chạy các mô hình bên trong các trung tâm dữ liệu sau khi chúng được tùy chỉnh.
Một số biến thể của các mô hình Granite mới có sẵn bắt đầu từ hôm nay để sử dụng thương mại trên nền tảng Watsonx. Một số mô hình này cũng sẽ có sẵn trên bộ công cụ phần mềm của Nvidia, cho phép các doanh nghiệp kết hợp các mô hình AI.
Dario Gil, giám đốc nghiên cứu của IBM cho biết các mô hình Granite mới được đào tạo bằng cách sử dụng các đơn vị xử lý đồ họa (GPU) H100 của Nvidia, công ty dẫn đầu về chip AI.
(Theo IBM, Reuters)
Bình luận bài viết (0)
Gửi bình luận