Veeam backup y archivo para trabajar con Ceph
Este estudio de caso explica cómo utilizar el dispositivo de almacenamiento Ceph Mars 400 como repositorio de respaldo de Veeam backup and replication.
Ceph admite almacenamiento de objetos, almacenamiento en bloques y el sistema de archivos POSIX, todo en un solo clúster. Según los requisitos de respaldo, los clientes pueden seleccionar diferentes protocolos de almacenamiento para satisfacer las necesidades de diversas estrategias de respaldo de almacenamiento.
En este artículo, utilizamos el almacenamiento en bloques de Ceph (Ceph RBD) y el sistema de archivos de Ceph (Cephfs) como repositorios de respaldo y comparamos las duraciones de los trabajos de respaldo al respaldar máquinas virtuales de Hyper-V y VMWare.
Arquitectura de solución de respaldo utilizando Veeam y Ceph
La arquitectura de respaldo de máquinas virtuales en VMWare y Hyper-V es similar. Veeam utiliza transferidores de datos para transferir datos desde los hosts de origen a los repositorios de respaldo. Los transferidores de datos se ejecutan en el servidor proxy y en el servidor de repositorio. Para utilizar Ceph como almacenamiento de respaldo de un repositorio, puede montar RBD o CephFS en un servidor físico o máquina virtual Linux como servidor de repositorio.
Si los servidores proxy y de repositorio son máquinas virtuales dentro del clúster del hipervisor, puedes obtener el beneficio de un transporte de datos de alta velocidad sin necesidad de red entre el disco de la máquina virtual, el servidor proxy y el servidor de repositorio. La mejor configuración de un gran clúster de hipervisores es desplegar una máquina virtual de servidor proxy y una máquina virtual de servidor de repositorio en cada host de VMWare. De lo contrario, puedes implementar una máquina virtual de respaldo en cada host de VMWare y un host de repositorio externo para eliminar la carga de trabajo de tus máquinas virtuales de producción en VMWare.
Hay tres formas de utilizar el appliance Ceph Ambedded como repositorios para Veeam Backup and Replication.CephFS y dispositivos de bloques RBD se pueden utilizar como repositorio de copias de seguridad en las instalaciones.El almacenamiento de objetos S3 se puede utilizar como nivel de capacidad para una ubicación remota.
Para obtener información sobre cómo configurar el dispositivo de bloque Ceph RBD y el sistema de archivos CephFS como el repositorio de respaldo de Veeam para la copia de seguridad de máquinas virtuales y archivos, puede encontrar los detalles en el documento blanco al final de esta página.
Ambiente de Prueba
- Tres Mars 400 con 3x monitores, 20 OSDs, y 1x MDS (servidor de metadatos)
- Cada demonio de Ceph se ejecuta en un microservidor Arm A72 de doble núcleo
- Sistema Operativo: CentOS 7
- Software Ceph: Nautilus 14.2.9 Arm64
- Red: 4x 10Gb de red por Mars 400
Veeam Backup & Replicación 10, Versión: 10.0.1.4854
Servidor de Respaldo Veeam
- CPU: Intel Xeon E5-2630 2.3GHz DUAL
- DRAM: 64GB
- Red: 2x 10Gb sfp+ enlace
- Disco: 1TB para el sistema, 256GB SATA3 SSD para el volumen
- Servidor Windows 2019
Servidor Proxy Veeam
- colocar junto al Servidor de Respaldo Veeam
Servidor de Repositorio
- Máquina Virtual
◇ CPU: 4 núcleos a 2.3GHz
◇ DRAM: 8GB
◇ Red: puente
◇ Disco: disco virtual de 50GB
◇ Sistema Operativo: CentOS 7.8.2003
- Servidor Baremetal
◇ CPU: Intel Xeon X5650 2.67GHz DUAL
◇ DRAM: 48GB
◇ Red: vinculación de 2 puertos 10Gb sfp+
◇ Disco: 1TB para el sistema
◇ Sistema Operativo: CentOS 7.6.1810
Anfitrión de Hyper-V
◇ CPU: Intel Xeon E5-2630 2.3GHz DUAL
◇ DRAM: 64GB
◇ Red: enlace de 2 puertos 10Gb sfp+ enlace
◇ Disco: 1TB para el sistema
◇ Servidor Windows 2019
Anfitrión de VMWare
◇ CPU: Intel Xeon E5-2630 2.3GHz DUAL
◇ DRAM: 64GB
◇ Red: enlace de 2 puertos 10Gb sfp+ enlace
◇ Disco: 1TB para el sistema
◇ ESXi 6.5
Red: switch de 10GbE
Prueba de rendimiento en diferentes configuraciones
Para evaluar el rendimiento de respaldo de varios repositorios de respaldo, configuramos pruebas con diferentes repositorios de respaldo y tres fuentes de respaldo.
Las fuentes de respaldo que utilizamos para las pruebas son un volumen basado en SSD SATA en un servidor, una máquina virtual de Windows de Hyper-V y una máquina virtual de CentOS 7 y una máquina virtual de Windows de VMWare.
(1) Respaldar un volumen en una unidad SSD
Tabla 1. Respaldar un volumen desde un servidor con un SSD SATA.
Tamaño del disco (datos procesados) | 237.9GB |
Datos leídos desde la fuente | 200.1GB |
Datos transferidos a Ceph después de la deduplicación y compresión | 69.7GB |
Deduplicación | 1.3X |
Compresión | 2.7X |
Tabla 2.
Respaldo Repositorio |
Duración (seg) |
Origen (%) |
Intermediario (%) |
Red (%) |
Destino (%) |
Procesamiento Tasa (MB/s) |
Promedio Escritura de Datos Tasa (MB/s) |
Máquina virtual de Linux Réplica RBD 3 | 646 | 83 | 33 | 84 | 21 | 554 | 110 |
Máquina virtual de Linux Réplica CephFS 3 | 521 | 97 | 25 | 31 | 5 | 564 | 137 |
Máquina virtual de Linux RBD, EC | 645 | 82 | 34 | 83 | 24 | 554 | 111 |
Máquina virtual de Linux CephFS, EC | 536 | 97 | 26 | 27 | 4 | 564 | 133 |
Servidor Linux, RBD, EC | 526 | 97 | 21 | 16 | 3 | 561 | 136 |
Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.
(2) Hacer una copia de seguridad de una máquina virtual de Windows 10 en Hyper-V en HDD
En esta prueba de referencia, hacemos una copia de seguridad de una instancia de Hyper-V que está almacenada en un disco duro SATA. Las tasas de procesamiento de estos trabajos alcanzan el límite superior del ancho de banda del HDD. También podemos encontrar que el cuello de botella está en la fuente porque sus cargas están ocupadas durante el 99% de la duración del trabajo. El clúster de Ceph, el objetivo, la carga de trabajo de los trabajos de respaldo de Veeam es ligera. El clúster de Ceph solo está ocupado entre el 6% y el 1% del tiempo de trabajo.
En comparación con el benchmark anterior, la velocidad de procesamiento de la copia de seguridad de la máquina virtual es mucho más baja que la copia de seguridad en SSD.Esto se debe principalmente a que los datos de la máquina virtual se almacenan en un disco duro.
Tabla 3.
Tamaño del disco (HDD) | 127GB |
Datos leídos desde la fuente | 37.9GB |
Datos transferidos a Ceph después de Deduplicación y Compresión | 21.4GB |
Deduplicación | 3.3X |
Compresión | 1.8X |
Tabla 4. Hacer una copia de seguridad de una imagen de máquina virtual en un disco duro SATA3
Respaldo Repositorio |
Duración (seg) |
Origen (%) |
Intermediario (%) |
Red (%) |
Destino (%) |
Procesamiento Tasa (MB/s) |
Promedio Escritura de Datos Tasa (MB/s) |
Máquina virtual de Linux Volumen RBD, EC | 363 | 99 | 7 | 3 | 6 | 145 | 60 |
Máquina virtual de Linux Volumen de CephFS, EC | 377 | 99 | 7 | 2 | 1 | 142 | 58.1 |
Servidor Linux, Volumen RBD, EC | 375 | 99 | 6 | 2 | 2 | 140 | 58.4 |
Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.
(3)Hacer copias de seguridad de máquinas virtuales en ESXi en HDD
Esta prueba realiza una copia de seguridad de máquinas virtuales CentOS 7 y Windows 10 que se ejecutan en un host VMWare ESXi 6.5 con un disco duro a un repositorio respaldado por un Ceph RBD con protección de código de borrado 4+2.
Tabla 5.
Origen | CentOS VM | Windows 10 VM |
Tamaño del disco (HDD) | 40GB | 32GB |
Datos leídos desde la fuente | 1.8GB | 12.9GB |
Datos transferidos a Ceph después de Deduplicación y Compresión | 966MB | 7.7GB |
Deduplicación | 22.1X | 2.5X |
Compresión | 1.9X | 1.7X |
Tabla 6.
Respaldo Origen |
Duración (seg) |
Origen (%) |
Intermediario (%) |
Red (%) |
Destino (%) |
Procesamiento Tasa (MB/s) |
Promedio Escritura de Datos Tasa (MB/s) |
CentOS 7 | 122 | 99 | 10 | 5 | 0 | 88 | 8 |
Windows 10 | 244 | 99 | 11 | 5 | 1 | 93 | 32 |
Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.
Conclusiones
Según los resultados de la prueba, Ceph RBD y CephFS tienen un rendimiento similar. Esto cumple con nuestra experiencia en cuanto al rendimiento de referencia de RBD y CephFS. Comparando las características de CephFS y RBD, tienen sus ventajas y desventajas. Si necesitas implementar varios servidores de repositorio, debes crear una imagen RBD para cada servidor de repositorio de respaldo, ya que solo puedes montar Ceph RBD en un host. Comparado con CephFS, usar RBD es más simple ya que no necesita servidores de metadatos. Tenemos que asignar el tamaño de capacidad de RBD al crearlo, por lo que debes redimensionar su capacidad cuando necesites más espacio.
Si utiliza CephFS como repositorio, debe implementar al menos un servidor de metadatos (MDS) en el clúster de Ceph. También necesitamos un servidor de metadatos de reserva para alta disponibilidad. En comparación con Ceph RBD, no es necesario asignar un cuota al sistema de archivos. Por lo tanto, puede considerar CephFS como un grupo de almacenamiento ilimitado.
En esta demostración de caso de uso, nuestras pruebas respaldan solo una VM en cada trabajo de respaldo. Según los informes de prueba anteriores, sabemos que la velocidad promedio de escritura de datos está relacionada con la velocidad de procesamiento y la eficiencia de deduplicación y compresión de datos. Un disco fuente más rápido reduce la duración del trabajo de respaldo y resulta en una velocidad de procesamiento más rápida. Dependiendo de la infraestructura de los usuarios, pueden implementarse varios trabajos simultáneos para respaldar objetos diferentes al mismo tiempo. El almacenamiento de Ceph funciona muy bien al admitir múltiples trabajos simultáneos.
Un clúster Ceph OSD de HDD 20x alimentado por 3x Ambedded Mars 400 puede ofrecer hasta 700MB/s de rendimiento de escritura agregado al grupo de código de borrado 4+2. Desplegar múltiples trabajos de respaldo actuales obtiene el beneficio de reducir la duración total del respaldo. El rendimiento máximo de un clúster Ceph es casi proporcionalmente lineal al número total de unidades de disco en el clúster.
En este caso de uso, no probamos el uso de almacenamiento de objetos S3 como repositorio de respaldo. El almacenamiento de objetos S3 se puede utilizar como nivel de capacidad en el repositorio de respaldo escalable de Veeam y como repositorio de archivo objetivo para el respaldo de NAS. Puede configurar fácilmente una puerta de enlace RADOS y crear usuarios de almacenamiento de objetos fácilmente utilizando el gestor UVS Ambedded, la interfaz web de gestión de Ceph.
- Descargar
Usar Ceph como el repositorio para el documento técnico de Veeam Backup & Replication
Cómo configurar el dispositivo de bloque Ceph RBD y el sistema de archivos CephFS como el repositorio de respaldo de Veeam para respaldar máquinas virtuales...
Descargar- Productos Relacionados
Aparato de almacenamiento Ceph Mars 400PRO
Mars 400PRO
El dispositivo Mars 400 Ceph Appliance está diseñado para satisfacer las necesidades de almacenamiento de datos nativos en la nube de alta capacidad....
Detalles