Qual é a diferença entre throughput e latência?

A latência e a throughput são duas métricas que medem a performance de uma rede de computadores. Latência é o atraso na comunicação de rede. Ela mostra o tempo que os dados demoram para serem transferidos pela rede. Redes com atraso ou espera maior têm alta latência, enquanto redes com tempos de resposta rápidos têm menor latência. Por outro lado, throughput refere-se ao volume médio de dados que podem realmente passar pela rede em um período específico. Ela indica o número de pacotes de dados que chegam ao destino com êxito e a perda de pacotes de dados.

Leia sobre latência »

Por que a throughput e a latência são importantes?

Você pode determinar a velocidade da rede observando a rapidez com que uma rede pode transferir pacotes de dados para seus destinos. Essa velocidade é o resultado de fatores de performance da rede, como latência e throughput.

A latência determina o atraso que um usuário experimenta ao enviar ou receber dados da rede. A throughput determina o número de usuários que podem acessar a rede ao mesmo tempo. 

Uma rede com baixa throughput e alta latência tem dificuldade em enviar e processar um alto volume de dados, o que resulta em congestionamento e baixa performance das aplicações. Por outro lado, uma rede com alta throughput e baixa latência é responsiva e eficiente. Os usuários têm melhor performance e maior satisfação.

Redes de alta performance afetam diretamente a geração de receita e a eficiência operacional. Além disso, certos casos de uso, como streaming em tempo real, análise de dados da Internet das Coisas (IoT) e computação de alta performance, exigem determinados limites de performance da rede para operar de forma ideal.

Principais diferenças: latência de rede versus throughput

Embora a latência e a throughput contribuam para uma rede confiável e rápida, elas não são a mesma coisa. Essas métricas de rede se concentram em estatísticas distintas e são diferentes umas das outras.

Como medir

Você pode medir a latência da rede medindo o tempo de ping. Esse processo é quando você transmite um pequeno pacote de dados e recebe a confirmação de que ele chegou.

A maioria dos sistemas operacionais oferece suporte a um comando ping que faz isso no seu dispositivo. O tempo de ida e volta (RTT) é exibido em milissegundos e dá uma ideia de quanto tempo sua rede leva para transferir dados.  

Você pode medir a throughput com ferramentas de teste de rede ou manualmente. Se você quisesse testar a throughput manualmente, enviaria um arquivo e dividiria o tamanho do arquivo pelo tempo necessário para chegar. No entanto, a latência e a largura de banda afetam a throughput. Por causa disso, muitas pessoas usam ferramentas de teste de rede, pois as ferramentas relatam a throughput junto com outros fatores, como largura de banda e latência.

Leia sobre o RTT em redes »

Unidade de medida

A latência é medida em milissegundos. Se você tiver um número baixo de milissegundos, sua rede está passando por apenas um pequeno atraso. Quanto maior o número em milissegundos, mais lento é a performance da rede. 

Originalmente, você mediria a throughput da rede em bits por segundo (bps). Porém, à medida que as tecnologias de transmissão de dados foram aprimoradas, agora você pode obter valores muito mais altos. Por isso, você pode medir a throughput em kilobytes por segundo (KBps), megabytes por segundo (MBps) e até gigabytes por segundo (GBps). Um byte é igual a oito bits. 

Fatores de impacto: latência vs throughput

Diferentes fatores podem afetar suas métricas de latência e throughput.

Latência

A latência tem vários fatores que contribuem para que ela seja alta ou baixa.

Localização

Um dos fatores mais importantes é a localização de origem dos dados e o destino pretendido. Se os seus servidores estiverem em uma região geográfica diferente do seu dispositivo, os dados precisarão viajar mais longe, o que aumenta a latência. Esse fator é chamado de propagação.

Congestionamento da rede

O congestionamento da rede ocorre quando há um grande volume de dados sendo transmitidos por uma rede. O aumento do tráfego na rede faz com que os pacotes sigam rotas mais longas até seus destinos. 

Eficiência do protocolo

Algumas redes exigem protocolos adicionais de segurança. As etapas extras de handshake criam atraso. 

Infraestrutura da rede

Os dispositivos de rede podem ficar sobrecarregados, o que resulta em pacotes descartados. Quando os pacotes são atrasados ou descartados, os dispositivos os retransmitem. Isso acrescenta latência adicional. 

Throughput 

As velocidades de throughput são diretamente afetadas por outros fatores.

Largura de banda

Se a capacidade da sua rede atingir a largura de banda máxima do meio de transmissão, sua throughput nunca poderá ultrapassar esse limite. 

Capacidade de processamento

Alguns dispositivos de rede têm otimizações especializadas de hardware ou software que melhoram sua performance de processamento. Alguns exemplos são circuitos integrados dedicados para aplicações específicas ou mecanismos de processamento de pacotes baseados em software.

Essas otimizações permitem que o dispositivo gerencie volumes maiores de tráfego e tarefas mais complexas de processamento de pacotes, o que aumenta a throughput.

Perda de pacotes

A perda de pacotes pode ocorrer por vários motivos, incluindo congestionamento de rede, hardware defeituoso ou dispositivos de rede mal configurados. Quando os pacotes são perdidos, eles devem ser retransmitidos. Isso resulta em atrasos e reduz a throughput geral da rede.

Topologia de rede

Topologia de rede refere-se ao número de dispositivos de rede, à largura de banda dos links de rede e à distância entre dispositivos em um caminho de rede.

Uma topologia de rede bem projetada fornece vários caminhos para transmissão de dados, reduz os gargalos de tráfego e aumenta a throughput. Redes com mais dispositivos ou distâncias maiores exigem topologias de rede complexas para alcançar alta throughput.

Relação entre largura de banda, latência e throughput

A latência e a throughput trabalham juntas para oferecer alta conectividade e performance de rede. Como ambas afetam a transmissão de pacotes de dados, eles também afetam uma à outra.

Se uma conexão de rede tiver alta latência, ela poderá ter menor throughput, pois os dados demoram mais para serem transmitidos e chegar. A baixa throughput também faz parecer que uma rede tem alta latência, pois leva mais tempo para grandes quantidades de dados chegarem.

Como elas estão intimamente vinculadas, você deve monitorar a latência e a throughput para alcançar alta performance de rede. 

Largura de banda e throughput da rede

A largura de banda representa o volume total de dados que você pode transferir por uma rede. Sua largura de banda total se refere à quantidade máxima teórica de dados que você pode transferir por uma rede. Ela é medida por megabytes por segundo (MBps). Você pode pensar na largura de banda como a throughput máxima teórica da sua rede. 

A largura de banda é a quantidade de dados que você pode transferir, enquanto a throughput é a quantidade real de dados que você transmite em um determinado momento com base nas limitações da rede do mundo real. Uma alta largura de banda não garante velocidade ou um boa performance da rede, mas uma largura de banda maior resulta em uma maior throughput.

Como você pode melhorar a latência e a throughput?

Para melhorar a latência, você pode reduzir a propagação entre a origem e o destino. Você pode melhorar a throughput aumentando a largura de banda geral da rede.

A seguir, damos algumas sugestões para melhorar a latência e a throughput em conjunto.

Armazenamento em cache

Armazenamento em cache na rede se refere ao processo de armazenar dados acessados com frequência geograficamente mais perto do usuário. Por exemplo, você pode armazenar dados em servidores proxy ou redes de entrega de conteúdo (CDNs).

Sua rede pode fornecer dados do local provenientes do cache muito mais rápido do que se eles precisassem ser recuperados da fonte original. E o usuário recebe os dados muito mais rápido, o que melhora a latência. Além disso, como os dados são recuperados de um cache, isso reduz a carga na fonte original. Isso permite lidar com mais solicitações ao mesmo tempo, melhorando a throughput.

Protocolos de transporte

Ao otimizar o protocolo de transporte utilizado para aplicações específicas, você pode melhorar a performance da rede.

Por exemplo, TCP e UDP são dois protocolos de rede comuns. O TCP estabelece uma conexão e verifica se você recebe dados sem erros. Devido ao seu objetivo de reduzir a perda de pacotes, o TCP tem maior latência e maior throughput. O UDP não verifica se há perda ou erros de pacotes, transmitindo vários pacotes duplicados. Portanto, ele fornece latência mínima, mas uma throughput maior.

Dependendo da aplicação que você está usando, o TCP ou o UDP podem ser a melhor opção. Por exemplo, o TCP é útil para transferir dados, enquanto o UDP é útil para streaming de vídeo e jogos.

Qualidade do serviço 

Você pode usar uma estratégia de qualidade de serviço (QoS) para gerenciar e otimizar a performance da rede. A QoS permite que você divida o tráfego de rede em categorias específicas. É possível atribuir um nível de prioridade a cada categoria.

Suas configurações de QoS priorizam aplicações sensíveis à latência. Algumas aplicações e usuários têm menor latência do que outros. Suas configurações de QoS também podem priorizar dados por tipo, reduzindo a perda de pacotes e aumentando a throughput para determinados usuários

Resumo das diferenças: throughput vs. latência

 

Throughput

Latência

O que ela mede?

A throughput mede o volume de dados que passam por uma rede em um determinado período. A throughput afeta a quantidade de dados que você pode transmitir em um período de tempo.

A latência mede o tempo de atraso no envio de dados. Uma latência mais alta causa atraso na rede.

Como medir?

Calcule manualmente a throughput enviando um arquivo ou usando ferramentas de teste de rede.

Calcule a latência usando tempos de ping.

Unidade de medida

Megabytes por segundo (MBps). 

Milissegundos (ms).

Fatores de impacto

Largura de banda, capacidade de processamento de rede, perda de pacotes e topologia de rede.

Distâncias geográficas, congestionamento de rede, protocolo de transporte e infraestrutura da rede. 

Como a AWS pode dar suporte aos seus requisitos de performance de rede?

A Amazon Web Services (AWS) tem várias soluções para reduzir a latência da rede e melhorar a throughput da rede. Você pode implementar qualquer um dos seguintes serviços, dependendo dos seus requisitos:

  • O Amazon CloudFront é um serviço de rede de entrega de conteúdo criado para alta performance, segurança e conveniência do desenvolvedor. Você pode usá-lo para entregar conteúdo com segurança, baixa latência e altas velocidades de transferência.
  • O AWS Direct Connect é um serviço de nuvem que vincula sua rede diretamente à AWS para oferecer uma latência de rede mais consistente e baixa. Ao criar uma nova conexão, você pode escolher uma conexão hospedada fornecida por um parceiro de entrega do AWS Direct Connect ou escolher uma conexão dedicada da AWS para implantá-la em mais de 100 locais do AWS Direct Connect em todo o mundo.
  • O AWS Global Accelerator é um serviço de rede que melhora a performance do tráfego dos seus usuários em até 60% usando a infraestrutura de rede global da AWS. Quando a Internet está congestionada, o AWS Global Accelerator otimiza o caminho para sua aplicação para manter a perda de pacotes, o jitter e a latência consistentemente baixos.
  • As zonas locais da AWS são um tipo de implantação de infraestrutura que coloca computação, armazenamento, banco de dados e outros serviços selecionados da AWS mais perto de grandes centros populacionais e industriais. Você pode fornecer aplicações inovadoras que necessitam de latência de milissegundos, aproximando-as das instalações on-premises e dos usuários finais.

Comece a otimizar sua throughput e latência na AWS criando uma conta hoje mesmo.