Skip to main content

        Isilon OneFS: Eficiencia de Almacenamiento - Implementación de SmartDedupe - Featured image

Isilon OneFS: Eficiencia de Almacenamiento - Implementación de SmartDedupe

A medida que los usuarios consumen el almacenamiento, es común encontrar datos redundantes (documentos copiados múltiples veces, ISOs idénticos, o respaldos duplicados). Para mitigar este desperdicio de capacidad, Isilon ofrece SmartDedupe.

A diferencia de otros sistemas de almacenamiento que realizan deduplicación en línea (inline), Isilon utiliza deduplicación post-proceso. Esto significa que los datos se escriben en disco inmediatamente con el máximo rendimiento, y posteriormente, un trabajo en segundo plano (Job Engine) escanea el sistema de archivos buscando bloques de 8KB idénticos para consolidarlos y liberar espacio.

Consideraciones de Diseño: ¿Dónde habilitar SmartDedupe?

Important

Mejor Práctica: Nunca se debe habilitar SmartDedupe a nivel global (/ifs). Debe configurarse de manera granular por directorio.

El trabajo de deduplicación consume IOPS y ciclos de CPU. Escanear datos que ya están comprimidos o encriptados (como archivos multimedia, bases de datos o respaldos en .zip) resultará en un ahorro de espacio del 0% y una degradación del rendimiento del clúster.

Cargas de trabajo ideales: Directorios de usuarios (Home directories), repositorios de ofimática y almacenamiento de máquinas virtuales o ISOs.

Paso 1: Configurar las rutas de Deduplicación

Antes de evaluar o ejecutar la deduplicación, es necesario remover la configuración global por defecto y asignar únicamente los directorios específicos.

Vía WebUI:

  1. Ve a File System > SmartDedupe y selecciona la pestaña Settings.

Ajustes de SmartDedupe


  1. En la sección - Deduplication settings:

    • Haz clic en el botón Remove path junto a /ifs.
    • Haz clic en Add another directory path.
    • Escribe o navega hasta la ruta deseada: /ifs/data/production/IT_Share.
  2. En la sección - Assess deduplication:

    • Repite el proceso: remueve /ifs y agrega /ifs/data/production/IT_Share.
  3. Haz clic en Save changes en la parte inferior.


Guardando Configuración


Vía CLI:

# Remove the default global path and add the specific directory for deduplication
isi dedupe settings modify --remove-paths=/ifs --add-paths=/ifs/data/production/IT_Share

# Verify the configured deduplication paths
isi dedupe settings view

Configuración CLI


Paso 2: Evaluación de Deduplicación (Dedupe Assessment)

Habilitar SmartDedupe consume memoria RAM y procesamiento. Es estándar ejecutar primero una evaluación para determinar si el porcentaje de datos duplicados justifica la operación.

Vía WebUI:

  1. Ve a la pestaña Summary dentro del menú de SmartDedupe.
  2. En la sección inferior Deduplication assessment reports, haz clic en el botón Start deduplication assessment job.

Iniciar Trabajo de Evaluación


Vía CLI:

# Start a deduplication assessment on the configured paths
# This job only scans the data and reports potential savings; it does NOT modify any data.
isi job jobs start DedupeAssessment

Una vez que el trabajo finaliza, el reporte en la pestaña Summary indicará el porcentaje de espacio que se puede recuperar.

Paso 3: Ejecución y Monitoreo del Trabajo (SmartDedupe Job)

Si el estimado de ahorro justifica el proceso, se inicia la consolidación de bloques. Este trabajo opera en segundo plano.

Vía WebUI:

  1. En la pestaña Summary de SmartDedupe.
  2. En la sección intermedia Deduplication reports, haz clic en el botón Start deduplication job.

Iniciando Trabajo de Deduplicación


Vía CLI:

# Start the actual data deduplication job 
isi job jobs start Dedupe 

# Monitor the progress of the deduplication job 
isi job jobs list

Monitoreo de Trabajo CLI


Validación de Resultados

Una vez concluido el trabajo, el panel superior Deduplication savings en la pestaña Summary mostrará una gráfica actualizada con los gigabytes ahorrados. Este proceso es completamente transparente para los usuarios conectados vía SMB; los archivos mantendrán su tamaño lógico original en Windows, mientras el clúster optimiza los discos físicos.




End of transmission.