Lưu trữ phân tán
Bạn có thể sử dụng Ceph để xây dựng một cụm máy chủ để lưu trữ dữ liệu với tính sẵn có cao. Các bản sao dữ liệu hoặc các phần mã hóa bị phân tán được lưu trữ trên các thiết bị thuộc các miền lỗi được xác định trước khác nhau. Ceph có thể duy trì dịch vụ dữ liệu của mình mà không mất dữ liệu khi nhiều thiết bị, nút máy chủ, rack hoặc site gặp sự cố cùng một lúc.
Lưu trữ Ceph được định nghĩa bằng phần mềm
Khách hàng tương tác trực tiếp với tất cả các thiết bị lưu trữ để đọc và ghi sử dụng thuật toán lưu trữ phân tán CRUSH của Ceph. Do đó, nó loại bỏ điểm hạn chế trên Host Bus Adaptor (HBA) truyền thống, giới hạn khả năng mở rộng của hệ thống lưu trữ. Ceph có thể mở rộng dung lượng của nó theo tỷ lệ tuyến tính với hiệu suất lên đến quy mô exabyte.
Ceph được thiết kế để có khả năng mở rộng và không có điểm thất bại duy nhất. Monitor (MON), Object Storage Daemon (OSD), và Metadata Servers (MDS) là ba tiến trình chính (quá trình Linux) trong cụm Ceph. Thường thì, một cụm Ceph sẽ có ba hoặc nhiều hơn các nút giám sát để đảm bảo tính dự phòng. Các máy giám sát duy trì một bản sao chính của bản đồ cụm, cho phép khách hàng Ceph giao tiếp trực tiếp với OSD và MDS. Những bản đồ này là trạng thái cụm quan trọng cần thiết cho các tiến trình Ceph để phối hợp với nhau. Các bộ điều khiển cũng chịu trách nhiệm quản lý xác thực giữa các tiến trình và khách hàng. Các số lẻ của màn hình duy trì bản đồ cụm bằng cách sử dụng quyền biểu quyết. Thuật toán này tránh điểm thất bại duy nhất trên màn hình và đảm bảo rằng sự nhất trí của họ là hợp lệ. OSD là tiến trình lưu trữ đối tượng cho Ceph. Nó lưu trữ dữ liệu, xử lý sao chép dữ liệu, khôi phục, cân bằng lại và cung cấp một số thông tin giám sát cho Ceph Monitors bằng cách kiểm tra các OSD Daemons khác để xác định trạng thái. Mỗi máy chủ lưu trữ chạy một hoặc nhiều tiến trình OSD, một tiến trình cho mỗi thiết bị lưu trữ. Thường cần ít nhất 3 OSD để đảm bảo tính dự phòng và khả năng sẵn có cao. Tiến trình MDS quản lý siêu dữ liệu liên quan đến các tệp được lưu trữ trên Hệ thống Tệp Ceph và cũng điều phối quyền truy cập vào Cụm Lưu trữ Ceph chia sẻ. Bạn có thể có nhiều MDS hoạt động đồng thời để đảm bảo tính dự phòng và cân bằng tải cho mỗi MDS. Bạn sẽ cần một hoặc nhiều Máy chủ Metadata (MDS) chỉ khi bạn muốn sử dụng hệ thống tệp chia sẻ.
Ceph là hệ thống lưu trữ có khả năng mở rộng
Trong một hệ thống lưu trữ truyền thống, khách hàng nói chuyện với một thành phần tập trung (ví dụ: bộ chuyển đổi bus máy chủ hoặc cổng), đó là một điểm vào duy nhất vào một hệ thống con phức tạp. Bộ điều khiển tập trung áp đặt một giới hạn về hiệu suất và khả năng mở rộng cũng như đưa ra một điểm thất bại duy nhất. Nếu thành phần tập trung bị ngừng hoạt động, toàn bộ hệ thống cũng sẽ bị ngừng hoạt động. Các khách hàng Ceph nhận bản đồ cụm mới nhất từ các máy giám sát và sử dụng thuật toán CRUSH để tính toán xem OSD nào trong cụm. Thuật toán này cho phép khách hàng tương tác trực tiếp với Ceph OSD mà không cần thông qua một bộ điều khiển tập trung. Thuật toán CRUSH loại bỏ đường dẫn duy nhất, gây hạn chế về khả năng mở rộng. Cụm OSD Ceph cung cấp cho khách hàng một bể lưu trữ chung. Khi bạn cần thêm dung lượng hoặc hiệu suất, bạn có thể thêm OSD mới để mở rộng pool. Hiệu suất của một cụm Ceph tăng theo tỷ lệ tuyến tính với số lượng OSD. Hình ảnh dưới đây cho thấy tốc độ đọc/ghi IOPS tăng lên nếu chúng ta tăng số lượng OSD.
Hệ thống đĩa cứng truyền thống sử dụng bộ điều khiển RAID để bảo vệ dữ liệu khỏi sự cố hỏng đĩa. Dung lượng của ổ đĩa cứng khoảng 20MB khi công nghệ RAID được phát minh. Hôm nay dung lượng đĩa cứng lên đến 16TB. Thời gian để xây dựng lại ổ đĩa bị hỏng trong nhóm RAID có thể mất một tuần. Trong khi bộ điều khiển RAID đang tái tạo ổ đĩa bị hỏng, có khả năng một ổ đĩa thứ hai có thể hỏng đồng thời. Nếu quá trình tái thiết mất nhiều thời gian hơn, khả năng mất dữ liệu cao hơn.
Ceph khôi phục dữ liệu bị mất trên ổ đĩa bị hỏng bằng tất cả các ổ đĩa khác còn lại trong cụm. Ceph chỉ sẽ tái tạo và phục hồi dữ liệu được lưu trữ trên ổ đĩa bị hỏng. Nếu có nhiều ổ đĩa khỏe mạnh hơn, thời gian phục hồi sẽ ngắn hơn.
- Cấu hình Bản đồ & Quy tắc CRUSH Ceph