Khi triển khai các ứng dụng trên dịch vụ CMC Kubernetes Engine, sử dụng tính năng Auto Scaling cho Cluster giúp tối ưu hóa sử dụng tài nguyên, cải thiện tính sẵn sàng và hiệu suất của ứng dụng, và giúp quản lý cụm trở nên dễ dàng và hiệu quả hơn.
Tính năng Auto Scaling giúp đáp ứng một số vấn đề quan trọng trong việc quản lý cụm:
Tối ưu hóa hiệu suất: Auto Scaling cho phép cụm tự động mở rộng tài nguyên khi có nhu cầu. Khi tải công việc cao hơn, cụm sẽ tự động tạo thêm các node hoặc tài nguyên để đảm bảo các ứng dụng hoạt động với hiệu suất tốt nhất.
Tiết kiệm chi phí: Auto Scaling cho phép cụm tự động giảm quy mô tài nguyên khi không cần thiết. Nếu tải công việc giảm đi, cụm sẽ tự động thu hồi các tài nguyên không sử dụng để tiết kiệm chi phí.
Đảm bảo tính sẵn sàng: Auto Scaling giúp đảm bảo rằng cụm có sẵn để đáp ứng nhu cầu sử dụng và tránh tình trạng quá tải hoặc thiếu tài nguyên.
Mô hình sau mô tả các hoạt động của Cluster Autoscaler:
Bật Auto Scaling
Để bật Auto Scaling cho Kubernetes Cluster , tại cụm đã tạo, chọn Addons và chọn Enable Auto Scale.
Tại Config có thể cấu hình các thông số sau:
Max node: số node worker tối đa có thể scale
Max CPU (cores): số core tối đa có thể scale
Max memory (GB): số RAM tối đa có thể scale
Sau khi đã enable Addons Auto Scale cho Cluster, tại Cluster, truy cập Node Groups. Tại Node group cần cấu hình, chọn Actions và Config Auto Scale.
Thiết lập các thông số sau:
Current Node Count: Số Node hiện tai của Node group
Min. Node Count: Số Node tối thiểu của Node group
Max. Node Count: Số Node tối đa mà Node Group có thể scale
Max Pods: Số Pod tối đa có thể triển khai của Node group