Windows Server – Usando Deduplication do Windows Server 2012 R2 para bibliotecas de VMs

Olá galera,

Dando continuidade à temática do mês de Fevereiro, junto ao grupo de especialistas do MTI (Mixed Technology Influencers), vamos abordar mais um tema relacionado ao Windows Server.

Hoje falaremos sobre a feature de Deduplication, componente nativo no Windows Server desde sua versão 2012. Este recurso já era utilizado há muito tempo por várias ferramentas, principalmente de backups, mas se tornou muito mais conhecida e utilizada quando a Microsoft adicionou-a no seu portfólio de Funções.

Sua lógica de funcionamento é tão simples, que chega a gerar confusão. A idéia do Deduplication é o que o próprio nome diz: encontrar dados duplicados e removê-los, unificando blocos de informação sem comprometer a integridade dos mesmos.

Porém, isto tudo é feito no nível mais baixo da informação, utilizando-se dos metadados. Com isso, não é necessário que a duplicação seja perceptível apenas a “olho nú”, como por exemplo em mídias de Sistemas Operacionais ou arquivos de sistemas; mas a um nível mais profundo, onde a sequência de binários dos arquivos podem ser lidas e convertidas em arquivos com informações duplicadas.

É aí que a função de Deduplication entra, fazendo não só a remoção deste conteúdo “repetido”, mas gerenciando também toda a gama de acesso a estas informações através dos novos serviços e arquivos que farão a requisição destes dados. Veja abaixo uma figura que ilustra bem isso.

IC564245

O Dedup, como é abreviadamente chamado, é uma sub-role de File and Storage Services, e pode ser habilitada tanto por Powershell quanto pelo Server Manager. O cmdlet para ativação é:

Import-Module ServerManager
Add-WindowsFeature -name FS-Data-Deduplication
Import-Module Deduplication

As recomendações de uso do Dedup são várias:

  • General file shares: Group content publication and sharing, user home folders, and Folder Redirection/Offline Files
  • Software deployment shares: Software binaries, images, and updates
  • VHD libraries: Virtual hard disk (VHD) file storage for provisioning to hypervisors
  • VDI Deployments (Windows Server 2012 R2 only): Virtual Desktop Infrastructure (VDI) deployments using Hyper-V
  • Virtualized Backup (Windows Server 2012 R2 only): Backup applications running as Hyper-V guests saving backup data to mounted VHDs

Porém, hoje vamos focar na opção de VHD Libraries, onde pela minha experiência pessoal, foi onde tive maiores ganhos com o uso da feature. Segundo a documentação oficial no TechNet, há uma tabela de “ganhos” com o Dedup, chamado de Space Saving. Nela, são mensurados os ganhos em cada tipo de Dedup a ser ativada nos cenários recomendados.

Plan to Deploy Data Deduplication - Mozilla Firefox

Como requerimentos para ativação, recomenda-se ler a documentação de planejamento e considerações de Data Deduplication, encontrada neste link. É altamente recomendável, para ter em mente quais arquivos são suportados (e quais não são), quais as práticas recomendadas e como realizar a administração do mesmo. Não levar isso em consideração pode ocasionar perda de dados, e ainda causar transtornos por não estar em conformidade com a política de suporte Microsoft. Ou seja, você estará sozinho e com um problemão…

Para ativação, depois de instalada a feature, o processo é bem simples. Basta decidir qual o(s) volume(s) no qual o Dedup executará seus jobs, e realizar a ativação da execução nele. Informação importante: o Dedup não pode ser ativado no diretório de instalação do Windows (C:\). É importante reforçar isto, mesmo sabendo que a feature bloqueia este tipo de configuração. 😉

Abaixo, o cmdlet de ativação, onde aponto para o diretório E:, onde estão alocadas minhas VMs, e defino o tipo de uso para HyperV, dizendo para a ferramenta que vou deduplicar uma library de VHDs. O segundo exemplo, onde o tipo é Default, faz o dedup funcionar normalmente. A vantagem de se usar o parâmetro UsageType é que a ferramenta sabe com que tipos de arquivos irá trabalhar, e já possui uma base de conhecimento para deduplicação destes.

Enable-DedupVolume E: -UsageType HyperV
Enable-DedupVolume E: -UsageType Default

O Dedup cria jobs de execução, a fim de escanear o discos lógicos, com o intuito de trabalhar o tempo todo buscando novos arquivos para deduplicar. São jobs de otimização, coleta de “lixos” e limpeza.

Administrator Windows PowerShell

Os jobs possuem agendamentos, que podem ser personalizados de acordo com a necessidade do ambiente e do administrador. Estes podem ser feitos pelo PowerShell, ou pela própria console do Server Manager, na opção File and Storage Services > Volumes.

Aproveitando que falamos da console, é nela onde vemos de forma mais relevante as informações de Deduplication Savings, que é o que estamos ganhando habilitando este recurso. Além de mostrar um percentual, ele mostra também a quantidade de espaço real que está sendo “salva” da utilização desnecessária, trazendo ainda maior relevância ao ganho proporcionado. Abaixo, vocês podem ver o percentual e os valores de deduplicação do meu ambiente, que é um servidor host de Hyper-V, onde abrigo meus laboratórios. Na primeira imagem, mostro a console do Dedup, com o espaço que foi reduzido. Na segunda imagem, mostro as propriedades das pastas onde abrigo minha Library, com VHDs, ISOs, EXEs entre outros, com o tamanho real dos arquivos (Size) e tamanho ocupado no disco (Size on disk).

Server Manager

VMs Properties

É realmente impressionante a redução de consumo de espaço em disco após a ativação da feature. Chega a ser assustador, o que ela pode fazer. E com os jobs agendados para trabalhar em horários onde o pico de utilização é menor, o comprometimento na performance do ambiente é praticamente imperceptível.

Então, é isso galera!

Fica aí a dica de um excelente recurso para utilização no ambiente. Deixo logo abaixo um vídeo explicativo do Dedup, feito pela CA (ArcServe), e as referências deste artigo. Abços e até mais!

 

Referências:

Install and Configure Data Deduplication

Data Deduplication Overview

Plan to Deploy Data Deduplication

What’s New in Data Deduplication in Windows Server

Deduplication Cmdlets

 

 

Anúncios

Sobre MVP Bruno Lopes

Profissional MBA em Redes de Computadores e Telecomunicações, MVP Microsoft e atualmente Technical Trainer e Engenheiro de Suporte na Microsoft/Wipro, especialista em Exchange/Office 365; sou mais um voluntário desta grande pátria de blogueiros a me dedicar em prol das informações compartilhadas à todos...Se já me salvou um dia, creio que ajudará a muitos mais...

Publicado em 29/02/2016, em Tecnologia e marcado como , , , , , , , , . Adicione o link aos favoritos. 1 comentário.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: