Giải pháp lưu trữ với Google Cloud Storage

Bên cạnh điện toán (compute) và mạng (network), lưu trữ (storage) là một trong những tài nguyên cơ bản cần có trong hệ thống công nghệ và phát triển phần mềm ngày nay. Bất kể hệ thống của doanh nghiệp là on-premises, hay trên đám mây thì đều dựa vào thành phần của storage để duy trì dữ liệu của mình. Tuy nhiên, nếu bạn đã quen với thế giới của các trung tâm dữ liệu (data centers), như Google Cloud Storage – với SAN, NAS, ổ cứng cục bộ (local hard drives), và đang bắt đầu dấn thân vào đám mây công cộng (public cloud), thì khái niệm lưu trữ dựa trên đám mây (cloud-based storage) và các dịch vụ khác nhau có thể vẫn là một thách thức. Trong bài viết này, cùng CloudAZ khám phá những dịch vụ lưu trữ khác nhau của Google Cloud Platform.

Google Cloud cung cấp ba dịch vụ chính cho các loại lưu trữ (storage) khác nhau như: Persistent Disks để lưu trữ khối (block storage), Filestone để lưu trữ tệp mạng (network file storage), và Cloud Storage cho lưu trữ đối tượng (object storage). Các dịch vụ này hoạt động như các khối xây dựng cho phần lớn các dịch vụ của Google Cloud và mở rộng ra là cho các hệ thống mà bạn xây dựng trên nền tảng đó. Chúng ta hãy xem xét kỹ hơn từng dịch vụ lưu trữ Google Cloud này, chúng được thiết kế để làm gì và phù hợp nhất để xử lý những trường hợp sử dụng nào.

Google Cloud Persistent Disks (Block Storage)

Lưu trữ khối (Block Storage) là loại lưu trữ truyền thống, cả trên đám mây và trong các hệ thống tại chỗ (on-premise). Google Cloud Persistent Disk là giải pháp phần mềm Block Storage Software với chức năng và chi phí phù hợp cho các doanh nghiệp từ nhỏ và vừa (SMEs) tới các doanh nghiệp lớn. Google Cloud Persistent Disk cung cấp lưu trữ khối và nó được sử dụng bởi tất cả các máy ảo trong Google Cloud (Google Cloud Compute Engine). Có thể hiểu một cách đơn giản là tưởng tượng các Persistent Disks đó như là các ổ USB. Chúng có thể được đính kèm hoặc tách ra khỏi máy ảo (Virtual Machines) và cho phép bạn xây dựng, lưu giữ dữ liệu bất cứ khi nào máy ảo được khởi động, dừng hoặc kết thúc.

Ngoài các máy ảo Google Cloud Compute Engine, các Persistent Disks này cũng được sử dụng để cung cấp năng lượng cho dịch vụ Google Kubernetes Engine.

Giống với ổ đĩa ảo (Virtual disk) trong máy cục bộ (local machine), Google Cloud Persistent Disk có thể là ổ cứng HDD hoặc SSD. Ngoài ra, còn có khả năng chọn vị trí của chúng và loại khả dụng là cần thiết: ví dụ chúng có thể là Regional, Zonal hoặc Local. Về lý thuyết, mặc dù các đĩa cục bộ (local disks) không phải là một phần của dịch vụ Google Cloud Persistent Disk, các đĩa cục bộ này chỉ khả dụng trong phần cứng nơi máy ảo đang chạy. Google Cloud Filestore (Network File Storage).

Google Cloud Filestore (Network File Storage)

Filestore là dịch vụ Google Cloud được quản lý hoàn toàn, cung cấp dịch vụ lưu trữ tệp mạng. Lưu trữ tệp mạng (network file storage) không phải là một khái niệm đám mây mới và giống với lưu trữ khối, nó cũng tồn tại trong trung tâm dữ liệu tại chỗ. Nếu bạn đã quen làm việc với NAS (Network Attached Storage) thì khái niệm này sẽ quen thuộc với bạn.

Có một sự phân biệt rất rõ ràng giữa network file storage và block storage. Network file storage, đúng như cái tên cho thấy, cung cấp bộ lưu trữ đĩa (disk storage) qua mạng. Điều này cho phép phát triển các hệ thống có nhiều dịch vụ song song có khả năng đọc và ghi các tệp từ cùng một bộ lưu trữ đĩa được gắn trên network.

Tuy có những lợi thế nhưng cần thận trọng trong việc sử dụng nó. So với block hay object storage thông thường, hiệu suất của lưu trữ tệp (file storage) kém hơn đáng kể. Điều này có thể dẫn đến các vấn đề về đồng thời và quyền đối với tệp. Do đó, trong khi thiết kế các hệ thống dựa trên đám mây (cloud-native), bạn chỉ nên sử dụng giải pháp này sau khi đã đánh giá cẩn thận để giải quyết những thách thức này .

Google Cloud Storage (Object Storage)

Google Cloud Storage là gì?

Google Cloud Storage là dịch vụ lưu trữ đối tượng do Google Cloud cung cấp. Nó cung cấp một số tính năng sẵn có thú vị như lập phiên bản đối tượng hoặc quyền chi tiết (trên mỗi đối tượng hoặc nhóm), có thể giúp việc phát triển trở nên dễ dàng và giúp giảm chi phí hoạt động. Google Cloud Storage đóng vai trò là nền tảng của một số dịch vụ khác nhau.

Loại lưu trữ này có những lợi ích gì? Khái niệm object storage không dễ nắm bắt. Trong các hệ thống tại chỗ điển hình, nơi dung lượng hạn chế hơn và khả năng kết nối nhanh và độc quyền, việc có loại lưu trữ này hoàn toàn không phổ biến. Tuy nhiên, cách mà bộ lưu trữ đối tượng hoạt động rất đơn giản đối với người dùng cuối. Nói một cách đơn giản, đề xuất giá trị của nó là để bạn có thể lấy và đặt bất kỳ tệp nào bạn muốn thông qua API REST—và điều này có thể mở rộng vô tận với mỗi đối tượng tăng lên đến quy mô terabyte. Trong Cloud Storage, các đối tượng khác nhau được nhóm trong các “namespaces” duy nhất được gọi là nhóm. Một thùng có thể chứa nhiều đối tượng, một đối tượng sẽ chỉ thuộc về một thùng.

Mô hình lưu trữ này phổ biến rộng rãi trong các hệ thống dựa trên đám mây do chi phí thấp (xu trên mỗi GB) kết hợp với cách tiếp cận không có máy chủ và tính đơn giản. Công việc nặng nhọc về sao chép dữ liệu, tính khả dụng, tính toàn vẹn, lập kế hoạch dung lượng, v.v. sau đó được giao cho nhà cung cấp đám mây. Hạn chế của lưu trữ đối tượng là không có cách nào khác để truy cập dữ liệu ngoài API REST; do đó, cách tiếp cận điển hình để thiết kế hệ thống, quản lý dữ liệu và cấu trúc kiểu truy cập hệ thống tệp không hoạt động.

Các lớp Google Cloud Storage, Archival storage và Quy tắc quản lý vòng đời

Có lẽ một số chức năng bị đánh giá thấp nhất của Google Cloud Storage là các lớp lưu trữ khác nhau và đưa Quy tắc quản lý vòng đời (Lifecycle Management Rules) vào sử dụng cho các nhóm dữ liệu. Việc sử dụng các tính năng này có thể tạo ra sự khác biệt lớn về mặt chi phí và chi phí vận hành.

Các loại lưu trữ trong Google Cloud Storage, bạn được yêu cầu chọn một loại lưu trữ cho các bộ chứa của mình: Tiêu chuẩn (có thể là Khu vực hoặc Đa khu vực), Nearline hoặc Coldline. Cách tiếp cận thông thường là chọn Tiêu chuẩn, nơi bạn có thể chọn đặt bộ chứa của mình trong một Khu vực Google Cloud cụ thể hoặc được lưu trữ trên nhiều Khu vực. Điều này hoạt động thực sự hiệu quả trong các tình huống khác nhau vì bạn có được bộ lưu trữ có hiệu suất cao và khả dụng cao.

Tuy nhiên, có một số trường hợp dữ liệu không được truy cập thường xuyên và việc giảm tính khả dụng là hoàn toàn ổn. Trong những trường hợp này, các lớp lưu trữ Nearline và Coldline là các tùy chọn có thể và nên được khám phá. Họ có thể dễ dàng giảm chi phí >50% so với lớp lưu trữ tiêu chuẩn.

Lớp lưu trữ Nearline được thiết kế cho dữ liệu được truy cập ít hơn một lần mỗi tháng. Một trường hợp sử dụng ví dụ là dữ liệu sẽ chỉ được sử dụng để tạo báo cáo tổng hợp hàng tháng. Mặt khác, lưu trữ Coldline được thiết kế cho dữ liệu được truy cập thậm chí ít thường xuyên hơn—ví dụ, một lần mỗi năm hoặc ít hơn. Do đó, lớp lưu trữ này đặc biệt hữu ích cho lưu trữ lưu trữ. Một trường hợp sử dụng là sử dụng lớp lưu trữ Coldline để giữ một bản sao dữ liệu mà doanh nghiệp yêu cầu lưu giữ trong một khoảng thời gian dài (ví dụ: 10 năm) do tuân thủ các yêu cầu quy định khác nhau.

Quy tắc quản lý vòng đời là một trong những thách thức của việc tận dụng đúng cách các lớp lưu trữ (và các tính năng Cloud Storage khác) là cùng một loại dữ liệu (nghĩa là dữ liệu trong cùng một nhóm) có thể yêu cầu cách xử lý khác nhau trong suốt vòng đời của nó. Ví dụ: nếu bạn sử dụng bộ chứa Google Cloud Storage để lưu trữ nhật ký ứng dụng của mình, bạn có thể yêu cầu tính sẵn sàng cao cho dữ liệu trong tháng đầu tiên (bao gồm cả việc tạo phiên bản cho từng đối tượng như một biện pháp bảo vệ chống giả mạo dữ liệu) và có thể ít khả dụng hơn (không cần tạo phiên bản) cho sáu tháng tiếp theo và cuối cùng giữ lại một bản sao của các nhật ký đó trong hơn năm năm tiếp theo do các nghĩa vụ tuân thủ.

Đối với các loại tình huống này, bạn có thể bật các quy tắc Quản lý vòng đời của Google Cloud Storage. Đây là một tính năng tích hợp thực sự tuyệt vời của Google Cloud Storage cho phép bạn xác định các quy tắc logic nghiệp vụ trên mỗi nhóm mà không cần nỗ lực nhiều. Với các quy tắc này, bạn có thể xác định các hành động chẳng hạn như tự động chuyển đối tượng giữa các lớp lưu trữ khác nhau, vô hiệu hóa lập phiên bản hoặc thậm chí xóa đối tượng sau một khoảng thời gian nhất định. Tận dụng các tính năng này và áp dụng các quy tắc vòng đời có thể giúp tiết kiệm chi phí thực vào cuối tháng.

Theo dõi thêm các bài viết khác của CloudAZ như:

Top 5 lợi ích không thể bỏ qua khi doanh nghiệp quyết định “lên mây” cùng Google Cloud Platform

Trong khi thiết kế và kiến trúc hệ thống của bạn, điều quan trọng là phải hiểu ưu và nhược điểm của từng loại lưu trữ cũng như chi phí liên quan đến chúng. Điều có thể sẽ thu hút người dùng NetApp hiện tại đang cố gắng tìm hiểu cách sử dụng bộ nhớ Google Cloud là Cloud Volumes ONTAP hiện có sẵn để sử dụng với Google Cloud. Liên hệ ngay CloudAZ để được tư vấn miễn phí cho doanh nghiệp của bạn!
CTA_Google_Cloud

Chức năng này đã bị chặn