Alta disponibilità e durabilità dei dati.
L'archiviazione degli oggetti Ceph raggiunge la disponibilità dei dati attraverso la replica e la codifica avanzata a cancellazione, in cui i dati vengono combinati con informazioni di parità, quindi frammentati e distribuiti nell'insieme di archiviazione.
Quando un dispositivo di archiviazione fallisce, è necessario solo un sottoinsieme dei frammenti per ripristinare i dati, non c'è tempo di ricostruzione o prestazioni degradate e i dispositivi di archiviazione guasti possono essere sostituiti quando è comodo.
Ceph combina dati ampiamente distribuiti e tecnologia di controllo continuo dei dati che convalida continuamente i dati scritti sui supporti, consentendoti di ottenere una durabilità dei dati di 15 nove.
Replicazione dei dati, codifica a cancellazione e controllo.
Replicazione dell'oggetto
Quando un cliente sta per scrivere dati, utilizza l'ID dell'oggetto e il nome del pool per calcolare a quale OSD deve scrivere. Dopo che il cliente scrive i dati nell'OSD, l'OSD copia i dati su uno o più OSD. È possibile configurare quante repliche si desidera per consentire ai dati di sopravvivere nel caso in cui più OSD falliscano contemporaneamente. La replica è simile al RAID-1 di un array di dischi ma consente più copie dei dati. Perché a grande scala, una semplice replicazione RAID-1 potrebbe non coprire più sufficientemente il rischio di guasti hardware. L'unico svantaggio di conservare più repliche è il costo di archiviazione.
I clienti Ceph scrivono dati in modo casuale su OSD in base all'algoritmo CRUSH.Se il disco OSD o il nodo hanno un guasto, Ceph può riparare i dati da altre repliche memorizzate negli OSD sani.
Puoi definire il dominio di guasto per far sì che Ceph memorizza i dati replicati in server, rack, stanze o data center diversi per evitare la perdita di dati a causa di uno o più guasti dell'intero dominio di guasto.Ad esempio, se hai 15 server di archiviazione installati in 5 rack (3 server in ogni rack), puoi utilizzare replica tre e rack come dominio di errore.I dati scritti nel cluster Ceph saranno sempre conservati in tre copie distribuite in tre dei cinque rack.I dati possono sopravvivere anche se fino a 2 dei rack falliscono senza degradare il servizio al cliente.La regola CRUSH è la chiave per rendere Ceph storage ha nessun singolo punto di errore.
Codifica di cancellazione
La replica offre le migliori prestazioni complessive, ma non è molto efficiente in termini di spazio di archiviazione.Soprattutto se hai bisogno di un maggior grado di ridondanza.
Avere un'elevata disponibilità dei dati è il motivo per cui in passato abbiamo utilizzato RAID-5 o RAID-6 come alternativa a RAID-1.Il RAID di parità garantisce la ridondanza con un sovraccarico di archiviazione molto inferiore a discapito delle prestazioni di archiviazione (soprattutto delle prestazioni di scrittura).Ceph utilizza la codifica di cancellazione per ottenere un risultato simile.Quando la dimensione del tuo sistema di archiviazione diventa grande, potresti sentirti insicuro nel permettere che uno o due dischi o domini di errore falliscano contemporaneamente.L'algoritmo di codifica di cancellazione ti consente di configurare un livello più elevato di ridondanza ma con meno spazio di overhead.
La codifica di cancellazione suddivide i dati originali in K blocchi di dati e calcola ulteriori M blocchi di codifica.Ceph può recuperare i dati massimi M domini di errore falliscono nel frattempo.Il totale di K+M di chunk è memorizzato negli OSD, che si trovano in domini di guasto diversi.
Pulizia
Come parte del mantenimento della coerenza e della pulizia dei dati, i demoni Ceph OSD possono eseguire la pulizia degli oggetti all'interno dei gruppi di posizionamento. Ciò significa che i demoni Ceph OSD possono confrontare i metadati degli oggetti in un gruppo di posizionamento con le sue repliche nei gruppi di posizionamento memorizzati su altri OSD. La pulizia (solitamente effettuata quotidianamente) individua errori o problemi del sistema di file. I demoni OSD di Ceph eseguono anche una scansione più approfondita confrontando i dati negli oggetti bit per bit. La pulizia approfondita (solitamente eseguita settimanalmente) individua settori danneggiati su un'unità che non erano evidenti in una pulizia leggera.
Ripristino dei dati
A causa del design del posizionamento dei dati di Ceph, i dati vengono ripristinati da tutti gli OSD sani. Non è necessario un disco di riserva per il ripristino dei dati. Ciò può ridurre notevolmente il tempo di ripristino rispetto a un array di dischi, che deve ricostruire i dati persi sul disco di riserva.
- Configura la mappa CRUSH e le regole