DigitalOcean Kubernetes vừa được cập nhật một loạt các tính năng mới đột phá. Những cải tiến này hứa hẹn mang lại lợi ích đáng kể cho cả hoạt động kỹ thuật và kết quả kinh doanh, giúp các tổ chức xây dựng, triển khai và mở rộng ứng dụng một cách nhanh chóng và hiệu quả hơn. Hãy cùng tìm hiểu những tính năng mới này và cách chúng mang lại lợi ích cho cả môi trường Kubernetes và doanh nghiệp của bạn!
Hỗ Trợ Droplet GPU Mới trong DigitalOcean Managed Kubernetes
Giờ đây, người dùng có thể dễ dàng triển khai các khối lượng công việc tăng tốc GPU trên DigitalOcean Managed Kubernetes bằng cách tận dụng các loại Droplet GPU mới nhất từ NVIDIA và AMD. Các loại phiên bản này là lựa chọn lý tưởng cho: Đào tạo và suy luận AI/ML; Xử lý hình ảnh và video; Các khối lượng công việc chuyên sâu về tính toán khác.
Với sự hỗ trợ nguyên bản cho các nút GPU trong các cụm Kubernetes, người dùng sẽ được hưởng lợi từ sự linh hoạt của các container kết hợp với sức mạnh thô của các GPU hiệu suất cao, tất cả được tích hợp liền mạch vào trải nghiệm DOKS (DigitalOcean Kubernetes Service). Các loại Droplet GPU mới bao gồm:
- NVIDIA RTX 4000 Ada Generation GPU: Một GPU đơn mạnh mẽ, lý tưởng cho sáng tạo nội dung, mô hình 3D, dựng hình và quy trình làm việc suy luận với hiệu suất và hiệu quả vượt trội.
- NVIDIA RTX 6000 Ada Generation GPU: Được xây dựng trên kiến trúc NVIDIA Ada Lovelace, kết hợp các RT Core thế hệ thứ ba, Tensor Core thế hệ thứ tư và CUDA Core thế hệ Ada với 48GB bộ nhớ đồ họa, phù hợp cho dựng hình, máy trạm ảo, AI, đồ họa và hiệu suất tính toán.
- NVIDIA L40s GPU: Hỗ trợ tới tám L40S Tensor Core GPU với 48 GB bộ nhớ mỗi GPU, Tensor Core NVIDIA thế hệ thứ tư, RT Core NVIDIA thế hệ thứ ba và công nghệ DLSS 3.0, lý tưởng cho đồ họa, dựng hình và truyền phát video.
- AMD MI300X GPU: Một GPU hiệu suất cao được xây dựng cho suy luận AI nâng cao và các khối lượng công việc HPC, kết hợp các lõi tính toán mạnh mẽ với băng thông bộ nhớ cao để tăng tốc học máy, phân tích dữ liệu và mô phỏng khoa học, mang lại hiệu quả và khả năng mở rộng đặc biệt.
Tối Ưu Chi Phí Với Tính Năng Nodepool Scale-to-zero
Tính năng Nodepool Scale-to-zero cho phép một nhóm nút tự động thu nhỏ về 0 nút khi không có khối lượng công việc hoạt động nào yêu cầu các nút đó. Người dùng giờ đây có thể cấu hình các nhóm nút trong môi trường Kubernetes của mình để tự động thu nhỏ về 0 khi ở trạng thái nhàn rỗi, chấm dứt các khoản phí điện toán trong những khoảng thời gian không hoạt động đó. Tính năng này là tối ưu cho: Môi trường phát triển hoặc thử nghiệm; Ứng dụng có mô hình sử dụng theo giờ làm việc; Các khối lượng công việc sử dụng nhóm nút chuyên biệt (GPU hoặc CPU-Optimized) cho các tác vụ không liên tục.
Các thành phần chính của tính năng này bao gồm:
- Giảm nhóm nút về 0: Cho phép đặt số lượng nút tối thiểu (min-nodes) về 0 thông qua giao diện người dùng, CLI hoặc API, tích hợp liền mạch với các cấu hình tự động mở rộng hiện có và duy trì toàn quyền kiểm soát đối với các nhóm nút có thể co giãn về 0.
- Tự động mở rộng: Tự động phát hiện các pod đang chờ yêu cầu tài nguyên đã thu nhỏ, giúp phân bổ tài nguyên hiệu quả mà không ảnh hưởng đến tính khả dụng. Khi các khối lượng công việc được lên lịch yêu cầu nhóm nút, nó sẽ tự động mở rộng trở lại. Cluster Autoscaler tự động phát hiện các pod đang chờ và cấp phát các nút cần thiết theo yêu cầu.
- Tối ưu hóa chi phí: Loại bỏ các khoản phí điện toán cho các nhóm nút nhàn rỗi, giúp tiết kiệm chi phí. Điều này rất có giá trị cho các khối lượng công việc phát triển, thử nghiệm và chuyên biệt, nơi nhu cầu tài nguyên dao động. Tính năng này cho phép một mô hình hạ tầng trả tiền theo mức sử dụng thực tế trong Kubernetes, căn chỉnh chi phí trực tiếp với mức tiêu thụ.
Giờ đây, bạn có thể triển khai cơ sở hạ tầng theo yêu cầu thực sự, đảm bảo một một cách tự động rằng chỉ thanh toán cho tài nguyên điện toán khi chúng đang được sử dụng, vào bất cứ khi nào có nhu cầu.
DigitalOcean Kubernetes Hiện Có Sẵn tại Trung Tâm Dữ Liệu Atlanta (ATL1)
Trung tâm dữ liệu AI-optimized mới nhất và lớn nhất của DigitalOcean, ATL1 tại Atlanta-Douglasville, đã đi vào hoạt động hoàn toàn. Người dùng giờ đây có thể triển khai các cụm Kubernetes được quản lý đầy đủ tại khu vực đông nam Hoa Kỳ.
ATL1 được xây dựng có mục đích để cung cấp cơ sở hạ tầng GPU mật độ cao, tối ưu hóa cho các khối lượng công việc AI/ML. Đối với các ứng dụng nhạy cảm về độ trễ, các khối lượng công việc suy luận AI/ML và các triển khai theo khu vực, điều này có nghĩa là thời gian phản hồi nhanh hơn, giảm độ trễ truyền dữ liệu và hiệu suất tốt hơn.
DigitalOcean Kubernetes Routing Agent (GA)
DigitalOcean vui mừng thông báo về sự ra mắt chính thức (GA) của DOKS Routing Agent: một giải pháp được quản lý hoàn toàn giúp đơn giản hóa cấu hình định tuyến tĩnh trong các cụm Kubernetes của người dùng. Với sự hỗ trợ cho các tài nguyên tùy chỉnh của Kubernetes, công cụ này giúp dễ dàng xác định các tuyến tùy chỉnh, sử dụng định tuyến Equal-Cost Multi-Path (ECMP) trên nhiều gateway và ghi đè các tuyến mặc định mà không làm gián đoạn kết nối. Người dùng cũng có thể nhắm mục tiêu các tuyến đến các nút cụ thể bằng cách sử dụng bộ chọn nhãn, làm cho nó lý tưởng cho các trường hợp sử dụng như tích hợp VPN, đường dẫn egress tùy chỉnh và các cổng VPC tự quản lý.
Những tính năng mới này được thiết kế để giúp người dùng xây dựng, triển khai và mở rộng ứng dụng nhanh hơn và hiệu quả hơn, đồng thời mở rộng những khả năng có thể thực hiện được trên Kubernetes.
Đọc thêm: Triển Khai ERNIE 4.5-21B Trên DigitalOcean Với 1-Click Models
Liên hệ ngay CloudAZ để tìm hiểu cách tận dụng tối đa các tính năng mới của DigitalOcean Kubernetes và đưa ứng dụng của bạn lên một tầm cao mới!