Sử dụng các tầng lưu trữ (tier) khác nhau trong kiến ​​trúc lưu trữ dữ liệu có giá trị to lớn nhằm đảm bảo các loại dữ liệu khác nhau được lưu trữ trên công nghệ phù hợp. Hệ thống Cloudian Object Storage có tính năng “tự động phân cấp” (Auto-tiering), theo đó các Object có thể được tự động di chuyển từ hệ thống Cloudian ở cục bộ (local) tới hệ thống lưu trữ đích theo lịch trình được xác định trước dựa trên chính sách vòng đời dữ liệu (data lifecycle policies). Cloudian Object Storage có thể được tích hợp với bất kỳ nền tảng cloud nào như:

  • Amazon S3
  • Amazon Glacier
  • Google Cloud Platform
  • Bất kỳ dịch vụ Cloud nào có kết nối S3 API
  • Cụm Cloudian HyperStore ở DC hoặc DR

Khả năng kiểm soát chặt chẽ của Cloudian Object Storage

Đối với bất kỳ hệ thống lưu trữ dữ liệu nào, mức độ chi tiết của kiểm soát và quản lý là vô cùng quan trọng – với mỗi kiểu dữ liệu khác nhau sẽ có các yêu cầu quản lý khác nhau với để phù hợp “Thỏa thuận cấp độ dịch vụ” (Service Level Agreements) sao cho phù hợp với giá trị của chúng đối với tổ chức.

Cloudian HyperStore cung cấp khả năng quản lý dữ liệu ở cấp bucket (lưu ý: “bucket” là khái niệm ở dạng lưu trữ S3, tương tự như LUN trong block storage hoặc tệp trong hệ thống NAS). HyperStore cung cấp các thông số kiểm soát sau đây ở cấp bucket:

  • Data protection – Lựa chọn cơ chế bảo vệ linh hoạt replication hoặc erasure coding cùng với sự phân tán dữ liệu trong một hoặc nhiều region khác nhau
  • Consistency level – Kiểm soát các kỹ thuật sao chép (đồng bộ so với không đồng bộ)
  • Access permissions – Người dùng và nhóm kiểm soát quyền truy cập vào dữ liệu
  • Disaster recovery – Sao chép dữ liệu lên public cloud
  • Encryption – Bảo vệ dữ liệu ở trạng thái nghỉ để tuân thủ bảo mật
  • Compression – Giảm dung lượng lưu trữ thô hiệu quả được sử dụng để lưu trữ các đối tượng dữ liệu
  • Data size threshold – Vị trí lưu trữ dữ liệu thay đổi dựa trên kích thước đối tượng dữ liệu
  • Lifecycle policies – Quy tắc quản lý dữ liệu để phân tầng và xoá dữ liệu

Tự động phân cấp có thể định cấu hình trên cơ sở từng nhóm, với mỗi nhóm cho phép các lifecycle policies khác nhau dựa trên các quy tắc. Ví dụ:

  1. Đối tượng dữ liệu nào sẽ áp dụng lifecycle policies?
  • Tất cả các đối tượng trong bucket
  • Các đối tượng mà tên bắt đầu bằng một tiền tố cụ thể (chẳng hạn như tiền tố “Cuộc họp”)
  1. Lịch trình Auto tiering có thể được chỉ định bằng một trong ba phương pháp:
  • Di chuyển các object số ngày X sau khi chúng được tạo.
  • Di chuyển các object nếu trong số ngày X chúng không được truy cập.
  • Di chuyển các object vào một ngày cố định — chẳng hạn như ngày 31 tháng 12 năm 2022

Khi một object được chọn tiering, một object nhỏ được giữ lại trên cụm HyperStore. Object được lưu lại đó hoạt động như một con trỏ tới object thực tế, vì vậy object vẫn xuất hiện như thể nó được lưu trữ trong cụm cục bộ. Đối với người dùng cuối, không có thay đổi nào đối với hành động truy cập dữ liệu, nhưng đối tượng hiển thị một biểu tượng đặc biệt cho biết thực tế là đối tượng dữ liệu đã được di chuyển.

Truy cập dữ liệu sau khi tự động phân tầng

Để truy cập các object sau khi chúng được tiering chúng ta có 3 cách:

  1. Khôi phục object – Khi người dùng truy cập tệp dữ liệu, họ sẽ được chuyển hướng đến tệp sơ khai cục bộ được lưu trữ trên HyperStore, sau đó chuyển hướng yêu cầu của người dùng đến vị trí thực của đối tượng dữ liệu (nền tảng đích được phân cấp).

Một bản sao của object được khôi phục trở lại bộ chứa HyperStore từ đích. Có thể đặt giới hạn thời gian lưu trữ cho object được khôi phục này. Đây được là lựa chọn tốt nhất nếu bạn cần truy xuất object, tránh mất mát chi phí phát sinh (data transfer in/out).

  1. Truyền object – Truyền dữ liệu trực tiếp đến máy khách mà không cần khôi phục dữ liệu về cụm HyperStore cục bộ trước.

Đây được coi là tùy chọn tốt nhất để sử dụng khi truy cập dữ liệu tương đối không thường xuyên và lo ngại về dung lượng lưu trữ của cụm HyperStore.

  1. Truy cập trực tiếp trên hệ thống đích

Đăng nhập vào hệ thống đích để thực hiện truy cập dữ liệu. Điều này đảm bảo các vấn đề:

  • Khắc phục thảm họa.
  • Tạo điều kiện di chuyển dữ liệu sang nền tảng khác.
  • Cho phép truy cập từ một ứng dụng dựa trên đám mây riêng biệt, chẳng hạn như phân phối nội dung.
  • Cung cấp quyền truy cập vài dữ liệu mà không phụ thuộc vào cơ sở dữ liệu riêng biệt để cung cấp chỉ mục.

Cloudian® là công ty đến từ thung lũng Silicon Valley chuyên về các giải pháp lưu trữ dữ liệu với không gian lưu trữ không giới hạn (từ vài trăm TB đến vài trăm PB) dựa trên công nghệ File phân tán và S3 Object-Storage. Các giải pháp của Cloudian phù hợp với các doanh nghiệp có nhu cầu lưu trữ lớn và phát triển liên tục như: Giải Trí- Truyền Thông, Truyền Hình, Nội Dung Số, Y Tế, Bệnh Viện, Trung Tâm Nghiên Cứu (R&D). Nơi triển khai và ứng dụng các giải pháp: lưu trữ dữ liệu phi cấu trúc, hồ dữ liệu, storage cho AI/ML, bộ lưu trữ cho các giải pháp Big Data, HPC; Làm CDN cho các giải pháp video-on-demand, truyền hình số; Bộ lưu trữ cho các thiết bị Y tế như PACS/VNA…