O blog da AWS
Amazon FSx for Windows File Server, Capítulo 2 – Mais funcionalidades: Shadow Copy, DFS Namespace, Data Deduplication e Quotas
Por: Caio Ribeiro César
O Amazon FSx for Windows File Server oferece um armazenamento de arquivos totalmente gerenciado, altamente confiável e que é acessível pelo protocolo Server Message Block (SMB).
Ele é baseado no Windows Server, oferecendo uma ampla gama de recursos administrativos, como cotas de usuários, restauração de arquivos de usuário final e integração com o Microsoft Active Directory (AD). Ele oferece opções de implantação Multi-AZ e single-AZ, backups totalmente gerenciados e criptografia de dados em repouso e em trânsito. O armazenamento de arquivos do Amazon FSx pode ser acessado por instâncias computacionais e dispositivos Windows, Linux e MacOS sendo executados na AWS ou no ambiente on-premises. Você pode otimizar o custo e o desempenho das suas necessidades de carga de trabalho com opções de armazenamento SSD e HDD. O Amazon FSx ajuda a diminuir o TCO por meio da deduplicação de dados, reduzindo os custos em 50-60% para compartilhamento de arquivos para fins gerais. É fácil de começar a usar e não há compromissos mínimos ou taxas antecipadas.
O Amazon FSx oferece suporte ao acesso no ambiente on-premises por meio do AWS Direct Connect ou do AWS VPN, bem como acesso de várias VPCs, contas e regiões usando o emparelhamento de VPCs ou o AWS Transit Gateway.
Iremos criar uma série de posts explicando as funcionalidades do FSx. Esta série terá 4 Capítulos:
- Criando e Configurando o FSx.
- Mais funcionalidades: VolumeShadowCopy, DFS Namespace, Data Deduplication e Quotas.
- Mapeando o FSx para servidores Linux.
- Migrando dados com o AWS DataSync (Cenário de Multi-Região).
Neste post, iremos discutir como configurar mais funcionalidades, tais como VolumeShadowCopy, DFS Namespace , Data Deduplication e Quotas. Para mais informações sobre tarefas administrativas em FSx, acesse nosso site.
a. Microsoft Windows shadow copy
O Shadow Copy é uma captura instantânea de um sistema de arquivos do Windows em um determinado momento. Ou seja, seus usuários podem visualizar e restaurar facilmente arquivos ou pastas individuais de um snapshot anterior no Windows File Explorer. Fazendo isso, os usuários podem desfazer facilmente as alterações e comparar as versões dos arquivos. Os administradores de armazenamento que usam o Amazon FSx podem agendar as shadow copies a serem tiradas periodicamente usando os comandos do Windows PowerShell.
As shadow copies são armazenadas juntamente com os dados do sistema de arquivos e, portanto, consomem sua capacidade de armazenamento. No entanto elas consomem capacidade de armazenamento apenas para as partes alteradas dos arquivos. Todas as shadow copies armazenadas no seu sistema de arquivos também são incluídas nos backups do seu sistema de arquivos. Assim, quando você restaura um backup, os usuários continuam a ter versões anteriores disponíveis a partir do momento em que o backup do sistema de arquivos foi feito.
b. Microsoft Distributed File System (DFS)
Como iremos demonstrar no próximo capítulo, podemos efetuar um mapeamento do FSx no Linux utilizando ferramentas do Common Internet File System (cifs) com o protocolo de SMB v3.0. Além disso, o Amazon FSx suporta o uso dos namespaces do Sistema de Arquivos Distribuídos (DFS) da Microsoft. Você pode usar os Namespaces do DFS para agrupar compartilhamentos de arquivos em vários sistemas de arquivos em uma estrutura de pastas comum (um espaço de nomes) usada para acessar o conjunto de dados do arquivo inteiro. Os Namespaces do DFS podem ajudá-lo a organizar e unificar o acesso aos seus compartilhamentos de arquivos em vários sistemas de arquivos. Os Namespaces do DFS também podem ajudar a dimensionar o armazenamento de dados de arquivos além do que cada sistema de arquivos suporta (64 TB) para conjuntos de dados de arquivos grandes – até centenas de petabytes.
c. Data Deduplication
Conjuntos de dados grandes geralmente têm dados redundantes, o que aumenta os custos de armazenamento de dados. Por exemplo, com compartilhamentos de arquivos do usuário, vários usuários podem armazenar muitas cópias ou versões do mesmo arquivo. Você pode reduzir seus custos de armazenamento de dados ativando o data deduplication para o seu sistema de arquivos.
Esta funcionalidade reduz ou elimina dados redundantes armazenando partes duplicadas do conjunto de dados apenas uma vez. Como a desduplicação de dados é executada como um processo em segundo plano, ela não afeta significativamente o desempenho do seu sistema de arquivos. Também é transparente para seus usuários e clientes conectados. Depois que a desduplicação de dados é ativada, ela “varre” e otimiza contínua e automaticamente o sistema de arquivos em segundo plano.
A economia de armazenamento que você pode obter com a deduplicação de dados depende da natureza do seu conjunto de dados, incluindo a quantidade de duplicação existente nos arquivos. As economias típicas são em média de 50 a 60% para compartilhamentos de arquivos de uso geral. Dentro dos compartilhamentos, a economia varia de 30 a 50% para documentos do usuário e 70 a 80% para conjuntos de dados de desenvolvimento de software.
Como outras tarefas administrativas no FSx, o data dedup é feito via PowerShell. Podemos executar o comando “Enable-FsxDedup” para habilitar a funcionalidade e “Disable-Fsxdedup”. Para uma lista completa de comandos, acesse nosso site.
d. Storage Quotas
Você pode configurar cotas de armazenamento do usuário em seus sistemas de arquivos FSx para limitar a quantidade de armazenamento de dados que os usuários podem consumir. Depois de definir cotas, você pode acompanhar o status da cota para monitorar o uso e ver quando os usuários superam suas cotas. Você também pode aplicar cotas impedindo que os usuários que atingem suas cotas gravem no espaço de armazenamento. Quando você impõe cotas, um usuário que excede sua cota recebe uma mensagem de erro “espaço em disco insuficiente“.
Você pode definir esses limites para as configurações de cota:
- Warn – usado para rastrear se um usuário ou grupo está atingindo seu limite de cota, relevante apenas para rastreamento.
- Limit – o limite da cota de armazenamento para um usuário ou grupo.
O administrador em si também consegue gerenciar métricas do FSx tais como espaço em disco utilizando integrações com o CloudWatch e SNS.
Vamos então colocar a teoria em prática e utilizar estas novas funcionalidades no Amazon FSx:
Sobre o autor
Caio atualmente trabalha como arquiteto de soluções especializadas em tecnologia da Microsoft na nuvem AWS. Ele iniciou sua carreira profissional como administrador de sistemas, que continuou por mais de 13 anos em áreas como Segurança da Informação, Identity Online e Plataformas de Email Corporativo. Recentemente, se tornou fã da computação em nuvem da AWS e auxilia os clientes a utilizar o poder da tecnologia da Microsoft na AWS.