DigitalOcean đã công bố một quan hệ đối tác chiến lược với OpenAI nhằm tích hợp các mô hình tiên tiến của họ vào Nền tảng Gradient. Sự hợp tác này đặc biệt cho phép truy cập vào hai trong số các mô hình mạnh mẽ nhất của OpenAI là GPT-4o và GPT-4o mini, tận dụng tối đa tiện ích mạnh mẽ của nền tảng Gradient. Điều này mang sức mạnh của các mô hình suy luận tiên tiến và mạnh mẽ nhất từ OpenAI đến với sự đơn giản và dễ tiếp cận của hạ tầng đám mây DigitalOcean.
Tìm hiểu chi tiết về hành trình tối ưu hóa Mô Hình Suy Luận OpenAI với Gradient Platform!
Mô hình Suy luận của OpenAI: GPT-4o & GPT-4o mini
Các Mô hình Ngôn ngữ Lớn (LLM) có khả năng suy luận đang đại diện cho bước tiến vượt bậc trong kỹ thuật mô hình ngôn ngữ. Khái niệm suy luận đã được phân tích chi tiết trong bài viết R1 của DigitalOcean. Tuy nhiên, nói một cách ngắn gọn, suy luận được định nghĩa là quá trình tư duy một cách logic và hợp lý về một vấn đề. Hành vi này giúp các mô hình mở rộng khả năng suy luận vượt xa khỏi việc suy luận đơn thuần, tiến tới các chiến lược xem xét phức tạp hơn, gần như có khả năng tự phản chiếu. Trên thực tế, các mô hình suy luận có thể chủ động cải thiện phản hồi của chúng thông qua quá trình tự phản chiếu có kiểm soát và siêu phân tích trong các đầu ra dạng dài.
GPT-4o và GPT-4o mini là những mô hình suy luận hàng đầu của OpenAI và là một trong những mô hình đầu tiên được ra mắt. Với chữ “o” viết tắt cho “Omni” (Toàn diện), chúng có khả năng tạo ra các phản hồi được lý giải từ nhiều định dạng đầu vào khác nhau, bao gồm hình ảnh, văn bản, âm thanh và video. Tại thời điểm ra mắt, sự linh hoạt chưa từng có này đã khiến các mô hình nhanh chóng trở nên phổ biến trong cộng đồng người dùng LLM. Kể từ đó, tính đa năng và khả năng của chúng không ngừng được mở rộng, với việc bổ sung khả năng nghiên cứu trực tuyến thông qua gọi hàm (function calling) và tạo hình ảnh.
Để so sánh hai mô hình này, bạn có thể tham khảo biểu đồ dưới đây. Biểu đồ này đối chiếu Chỉ số Khả năng Tạo sinh (Generation Ability Index) – một thước đo chất lượng của các mô hình phổ biến – với tốc độ tạo ra đầu ra tính bằng token mỗi giây:
(Nguồn)
Theo báo cáo ban đầu từ Bảng xếp hạng LLM Arena của Artificial Analysis, GPT-4o và GPT-4o mini mỗi loại đều thống trị trong phân khúc riêng của mình: chất lượng và hiệu quả. GPT-4o nằm trong số những mô hình mạnh mẽ và được cung cấp thông tin nhiều nhất hiện có, trong khi GPT-4o mini là một trong những mô hình hiệu quả và nhanh nhất. Cùng với nhau, chúng cung cấp một số dịch vụ mô hình linh hoạt nhất hiện có trên nền tảng đám mây.
Nâng Tầm Khả Năng của Mô Hình Suy Luận OpenAI với Gradient Platform
Gradient Platform là giải pháp của DigitalOcean dành cho mọi nhu cầu về Mô hình Ngôn ngữ Lớn (LLM) dựa trên tác tử (Agentic LLM) của bạn. Nền tảng này giúp việc tải dữ liệu của riêng bạn lên một cách đơn giản và tăng cường sức mạnh cho LLM từ bộ sưu tập các mô hình tốt nhất hiện có thông qua công nghệ Tạo sinh Tăng cường Truy xuất (RAG). Từ đó, mô hình có thể thực hiện các lệnh gọi hàm (function calls) đến API của bạn để xử lý bất kỳ tác vụ nào bạn cần.
Đọc thêm: GradientAI Platform: Đột Phá Mới Trong Phát Triển AI
Với việc bổ sung GPT-4o và GPT-4o mini vào nền tảng, khả năng này càng được nâng cao. GPT-4o và GPT-4o mini là một trong những mô hình tác tử tiên tiến nhất trong các danh mục tương ứng của chúng. Với sức mạnh của cơ sở hạ tầng DigitalOcean Gradient, việc tăng cường các mô hình này bằng dữ liệu của riêng bạn cho bất kỳ mục đích nào giờ đây trở nên dễ dàng.
Giới thiệu Khả năng của Gradient Platform với các Mô hình suy luận của OpenAI
Việc bắt đầu với Gradient Platform rất dễ dàng và việc cấp quyền truy cập vào các mô hình OpenAI cũng đơn giản không kém. Đầu tiên, bạn chỉ cần đăng nhập vào tài khoản DigitalOcean của mình và chọn một Nhóm (Team) cùng Dự án (Project) mong muốn. Trên thanh điều hướng bên trái của cửa sổ, bạn có thể truy cập Nền tảng Gradient bằng cách nhấp vào liên kết dưới mục “Quản lý” (Manage). Từ đây, bạn sẽ có thể tạo Cơ sở Tri thức (Knowledge Base) đầu tiên của mình. Cơ sở Tri thức chính là nguồn tài nguyên mà từ đó Mô hình Ngôn ngữ Lớn (LLM) sẽ nhúng thông tin để sử dụng cho công nghệ Tạo sinh Tăng cường Truy xuất (RAG).
Để tạo Cơ sở Tri thức (Knowledge Base) của bạn trên Gradient AI Platform, cần kết nối một DigitalOcean Space tương ứng với kho dữ liệu. Nếu bạn chưa có Space nào đang sử dụng, hãy tạo một Space mới và tải dữ liệu của bạn lên đó. Đối với bản demo này, toàn bộ kho tài liệu hướng dẫn của DigitalOcean đã được tải lên để phục vụ phân tích.
Sau khi hoàn tất việc này, bạn có thể kết nối Space với Cơ sở Tri thức mới trong quá trình tạo lập. Tiếp theo, bạn có thể lựa chọn mô hình nhúng (embedding model): All MiniLM L6 v2 ($0.00900/1M tokens), GTE Large EN v1.5 ($0.09000/1M tokens), hoặc All MiniLM L6 v2 ($0.00900/1M tokens). Hãy chọn mô hình phù hợp nhất với trường hợp sử dụng và kích thước kho dữ liệu của bạn. Các bộ dữ liệu lớn hơn sẽ yêu cầu những mô hình mạnh hơn như GTE Large EN v1.5 để nhúng toàn bộ thông tin cho công nghệ Tạo sinh Tăng cường Truy xuất (RAG).
Hoàn thành bước này, chúng ta có thể chọn dự án của mình và tạo Cơ sở Tri thức. Quá trình tạo lập thực tế có thể mất một chút thời gian, tùy thuộc vào kích thước dữ liệu đầu vào của quý vị.
Tiếp theo, bạn cần thêm khóa OpenAI của mình vào Gradient Platform. Việc này có thể thực hiện bằng cách nhấp vào tab “Model Keys” trong phần tổng quan của Gradient Platform. Bạn chỉ cần điều hướng đến tab này và nhập khóa API OpenAI của mình.
Giờ đây, khi Cơ sở Tri thức đã được tạo và khóa API đã được thêm, bạn có thể tiến hành tạo Agent với GPT-4o hoặc GPT-4o mini của OpenAI. Trong bản demo này, GPT-4o mini sẽ được sử dụng. Hãy đặt tên cho Agent sao cho phù hợp với các tác vụ được giao và cung cấp một lời nhắc khởi đầu (starting prompt) thích hợp cho công việc hiện tại. Những hướng dẫn này sẽ định hình mọi kết quả đầu ra và hành vi của Agent.
Tiếp theo, bạn sẽ lựa chọn các mô hình. Hãy chọn tùy chọn “OpenAI Models” từ menu thả xuống. Sau đó, chọn khóa API OpenAI của bạn từ danh sách khóa thả xuống. Cuối cùng, hãy chọn mô hình mong muốn. Đối với bản demo này, GPT-4o mini đang được sử dụng.
Cuối cùng, Cơ sở Tri thức sẽ được kết nối với Agent. Điều này cho phép các Mô hình OpenAI thực hiện RAG (Tạo sinh Tăng cường Truy xuất) trên dữ liệu của bạn, từ đó cung cấp thông tin cho mọi kết quả đầu ra.
Sau khi hoàn thành các bước này, Agent có thể được tạo. Việc triển khai Agent có thể mất vài phút. Khi đã triển khai xong, bạn có thể bắt đầu tương tác với nó. Phía trên là một ví dụ về kết quả đầu ra nhận được từ bản demo. Để truy vấn mô hình, bạn có thể sử dụng Model Playground đi kèm dành cho Agent, gửi yêu cầu bằng mã Python hoặc sử dụng cURL.
Đọc thêm: DigitalOcean GradientAI: Tìm Hiểu Tính Năng Agent Tracing
Bạn đang tìm kiếm giải pháp AI phù hợp để tối ưu quy trình và gia tăng hiệu quả? Liên hệ ngay với CloudAZ để được tư vấn chuyên sâu và đồng hành trên hành trình ứng dụng AI một cách hiệu quả và bền vững!