O que é HTTP Caching e como ele funciona?

Caching é o armazenamento e a reutilização de recursos de uma página da web (imagens, texto HTML, gráficos, URLs, scripts, etc.) acessadas com frequência. O uso de cache traz vários benefícios para um site, como a redução de latência, a redução do consumo de banda, a redução do tráfego de rede e o aumento da velocidade e do desempenho. Tudo isso otimiza a experiência online do usuário e, consequentemente, aumenta a receita das empresas.

Vivian Seixas - Technical Researcher
O que é HTTP Caching e como ele funciona?

Caching é, basicamente, o armazenamento e o reuso de recursos frequentemente acessados em páginas da web. Como o armazenamento é feito em um local de rápido acesso, a navegação fica mais rápida e a performance dos sites e das aplicações também melhora. É por isso que o HTTP Caching é uma ferramenta essencial para negócios que querem otimizar a experiência do usuário e, consequentemente, ter uma receita maior.

Cada milissegundo conta

Se te perguntassem o que mais te irrita em um site, você provavelmente vai responder que é um site lento. E você não está sozinho: 70% dos consumidores afirma que a velocidade de exibição de uma página afeta a vontade deles de fazer uma compra online. Então, junto com a paciência dos usuários, vão-se embora as oportunidades de engajamento e as vendas também.

E por vivermos na era do imediatismo, qualquer coisa que fuja disso no mundo virtual é sinônimo de fracasso. Se nem o Google e outros mecanismos de busca perdoam sites lentos ao fazer o ranqueamento das buscas, imagina o usuário quando está navegando.

Em tempos de alta demanda, uma forma eficaz de fazer um site ficar mais rápido é o uso de caching. Você já ouviu falar disso? Neste blog post, nós explicamos o que é caching e como ele funciona.

O que é caching?

Nós vimos que o caching é o armazenamento e a reutilização de recursos de um site (imagens, texto HTML, gráficos, URLs, scripts, etc.) acessados com frequência, evitando o download dos recursos toda vez que é visitado. Para o caching acontecer, utiliza-se o cache, que é como se fosse um depósito de recursos – no caso de uma página da web, o cache pode ser no navegador, servidor proxy, edge nodes, etc. – mais próximo do usuário do que um servidor de origem. Então, quando alguém acessa um site, o sistema acessa o cache para verificar se há cópias dos recursos do site ali armazenadas e, caso haja, as resgata com muito mais rapidez, porque não precisa obter isso da origem. Caso não haja uma cópia desses recursos no cache, a requisição será continuada e eles serão ali armazenados.

Imagem mostrando o que é caching e como funciona

O uso de cache é feito por meio de informações transmitidas pelo header (cabeçalho) da requisição e resposta. Por meio do caching é possível diminuir o número de round-trips feitos em uma requisição, já que se verifica se existem cópias em cache do que foi requisitado. A diminuição na quantidade de round-trips reduz o tempo das requisições e, consequentemente, o tráfego da rede. É como se fosse um efeito cascata, mas no bom sentido, porque tudo isso em conjunto contribui para a redução da latência e a diminuição de custos com servidor.

O uso de cache faz parte do protocolo HTTP na transmissão de dados. Então vamos ver a seguir do que isso se trata, mais especificamente.

O que é HTTP Caching?

Para entendermos o que é HTTP caching, ou cache HTTP, vamos relembrar o que é HTTP. De forma resumida, HTTP é um protocolo de transferência de camada de aplicação baseado em texto e é considerado a base da comunicação de dados entre dispositivos em rede, entre clientes e servidores. No processo de comunicação do HTTP também podem ser dadas diretivas para se definir como as informações trocadas serão armazenadas e isso é, então, o que chamamos de HTTP caching. Essas informações sobre o armazenamento em cache ocorre nos headers das requisições e das respostas e elas definem o comportamento desejado pelo cliente ou pelo servidor. Podemos dizer, ainda, que o principal objetivo do armazenamento em cache é melhorar o desempenho da comunicação ao se reutilizar uma mensagem de resposta anterior para satisfazer uma requisição atual.

Como o HTTP caching funciona?

Em linhas gerais, o processo de caching funciona da seguinte forma:

  1. A página do site faz a requisição de um recurso ao servidor de origem.
  2. O sistema verifica o cache para saber se já existe uma cópia do recurso armazenada.
  3. Se o recurso estiver armazenado no cache, o resultado será uma resposta de acerto de cache e o recurso será entregue a partir do cache.
  4. Se o recurso não estiver armazenado no cache, o resultado será perda de cache e o arquivo será acessado em sua fonte original.
  5. Após o recurso ser armazenado no cache, ele continuará a ser acessado ali até que expire ou que o cache seja limpo.

Tipos de caching

O tipo de cache é definido de acordo com o local em que o conteúdo é armazenado.

  • Cache de browser - esse armazenamento é feito no navegador. Todos os navegadores possuem um armazenamento local, que serve normalmente para resgatar recursos previamente acessados. Esse tipo de cache é privado, já que os recursos armazenados não são compartilhados.
  • Cache de proxy - esse armazenamento, também chamado de cache intermediário, é feito no servidor proxy, entre o cliente e o servidor de origem. Esse é um tipo de cache compartilhado, já que é utilizado por vários clientes, e geralmente é mantido por provedores.
  • Cache de gateway - também chamado de proxy reverso, é uma camada independente, separada, e esse armazenamento fica entre o cliente e a aplicação. Ele armazena em cache as requisições feitas pelo cliente e as envia para a aplicação e faz o mesmo com as respostas, enviando da aplicação para o cliente. Se um recurso for solicitado novamente, o cache retorna a resposta, antes de chegar à aplicação. Também é um cache compartilhado, mas pelos servidores e não pelos usuários.
  • Cache de aplicação - esse armazenamento ocorre dentro da aplicação e permite que o desenvolvedor especifique quais arquivos o navegador deve armazenar em cache e os disponibilize para usuários mesmo quando estiverem offline.

Caching Headers

Nos headers (cabeçalhos) das requisições e das respostas são dadas diretivas para definir características do armazenamento em cache. Por exemplo:

Imagem com caching headers

Cache-Control

No header Cache-Control, as seguintes diretivas padrão podem ser dadas para o armazenamento em cache:

  • private

O conteúdo é considerado privado, pois somente um usuário tem acesso. Nesse caso, o conteúdo privado pode ser armazenado pelo navegador do usuário, mas não em caches intermediários.

  • public

O conteúdo é considerado público, pois mais de um usuário pode ter acesso. O conteúdo pode ser armazenado pelo navegador ou em outros caches entre o cliente e o servidor.

  • no-store

O conteúdo não pode ser armazenado em cache, assim a requisição é sempre enviada ao servidor de origem. Esse formato é indicado quando se transmite dados confidenciais.

  • no-cache

O conteúdo armazenado deve ser revalidado a cada nova requisição, e isso torna o conteúdo imediatamente obsoleto. Nesse caso, o cache envia a requisição ao servidor de origem para validação antes de liberar uma cópia armazenada.

  • max-age

Define o tempo máximo que o conteúdo pode ficar no cache sem ser revalidado no servidor de origem. O tempo é definido em segundos e o máximo que chega é um ano (31.536.000 segundos).

  • s-maxage

Indica a quantidade de tempo que o conteúdo pode ser armazenado em cache e por isso é muito parecido com o max-age, mas a diferença é que esta opção é aplicada apenas a caches intermediários e não ao navegador.

  • max-stale

Indica que será aceita uma resposta que excedeu seu tempo de vida de atualização. Se nenhum valor (dado em segundos) for atribuído a max-stale, será aceita uma resposta obsoleta de qualquer idade, mas se for atribuído um valor, será aceita uma resposta que excedeu sua vida útil de atualização conforme o tempo especificado para o limite.

  • must-revalidate

Indica que o tempo de expiração, indicado por max-age, s-maxage ou por Expires, deve ser obrigatoriamente obedecido. Nesse caso, o conteúdo obsoleto obrigatoriamente não pode ser entregue ao cliente, e o navegador pode usar um conteúdo obsoleto somente se ocorrer uma falha na rede.

  • proxy-revalidate

Essa diretiva é parecida com o must-revalidate, mas é apenas configurada para servidores intermediários, proxies ou CDNs. Nesse caso, serviços de cache intermediários devem necessariamente revalidar o conteúdo se ele ficar obsoleto.

  • no-transform

Define que o cache não pode alterar o conteúdo recebido. Por exemplo, o cache não pode escolher entre enviar uma versão compacta de conteúdo não compactado que recebeu do servidor de origem.

  • min-fresh

Define que o conteúdo deverá ser mantido atualizado por pelo menos o tempo de vida que foi especificado (em segundos).

  • only-if-cached

Indica que o cliente deseja obter somente conteúdo que tenha cópia no cache. O cache deve utilizar na resposta o conteúdo em cache, se estiver de acordo com as restrições, caso contrário responde com um código de status 504 (tempo limite de gateway), que indica que o servidor intermediário não obteve resposta do servidor de origem para completar a requisição.

É possível combinar diferentes comportamentos de cache nos headers, mas há dois casos em que somente uma opção é possível, pelo fato de serem opostas: 1) no-cache ou no-store e 2) private ou public.

Expires

O header Expires define o momento em que um conteúdo vai expirar. Após essa data, o conteúdo em cache é considerado obsoleto, então a requisição terá acesso ao conteúdo mais recente no servidor de origem.

ETag

O header Etag (Entity tag ou tag de entidade) é utilizado para verificar se o recurso em cache do navegador é o mesmo que está no servidor de origem, ou seja, ele valida se o cliente está recebendo a versão mais recente do conteúdo cacheado. Esse header funciona como um identificador único associado a cada recurso de um site. Para a identificação, os servidores de página da web utilizam um valor Etag, que é modificado a cada vez que o recurso é alterado. E o valor de ETag é a data e hora da última atualização do recurso.

Last-Modified

O header Last-Modified indica ao navegador quando o recurso foi modificado pela última vez e se ele deve usar a cópia em cache ou baixar a versão mais recente. Por exemplo, quando um usuário visita seu site, o navegador armazena os recursos da página, então na próxima vez que ele acessar o site, o servidor verifica se houve modificação nos arquivos desde a última vez que foram acessados. Se não houver nenhuma modificação, o servidor envia uma resposta “304 not modified” ao navegador e é utilizada a cópia contida no cache.

Vary

O header Vary possibilita o armazenamento de diferentes versões do mesmo conteúdo, então ele é utilizado para solicitar ao cache a verificação de cabeçalhos adicionais antes de decidir para qual conteúdo é uma requisição. Por exemplo, ao se usar com o header Accept-Encoding, a configuração permite diferenciar conteúdo comprimido e não comprimido, ou quando usado com o header User-Agent, diferencia a versão de um site para celular ou para desktop.

Benefícios do caching

Para resumir, listamos a seguir os principais benefícios do caching:

  • redução da latência;
  • redução de consumo de banda;
  • redução do tráfego na rede;
  • aumento da velocidade e do desempenho do site.

A solução da Azion

Os usuários têm altíssimas expectativas quanto à velocidade de um site, e uma resposta mais lenta do que a que eles desejam é sinônimo de perda de clientes. Um relatório feito em 2020 pela Deloitte, Milliseconds Make Millions, comprova isso ao mostrar que uma velocidade 0,1s mais rápida traz vários benefícios aos negócios, como maior engajamento do usuário, melhores taxas de conversão e, consequentemente, crescimento nas vendas.

E como nós mostramos nesse texto, o HTTP caching é extremamente relevante para otimizar a velocidade de um site e crucial para melhorar a percepção da marca de uma empresa, principalmente se você quer aumentar o número de clientes ou mantê-los fiéis à sua marca. E como você pode alcançar isso? É simples: com a Azion.

Edge Cache da Azion: muita velocidade e altíssimo desempenho

O nosso Edge Cache é a melhor solução para quem quer um site super rápido e com altíssimo desempenho. E como isso é possível? Um dos principais motivos é porque o cache é feito no edge, mais próximo dos usuários. Outro é porque ele suporta milhares de requisições simultâneas sem comprometer a infraestrutura.

Além disso, nosso serviço de caching entrega todos os tipos de conteúdos baseados em HTTP e HTTPS, incluindo arquivos estáticos e dinâmicos ou vídeos sob demanda, mesmo se o servidor de origem estiver indisponível. Isso aprimora a performance e a confiabilidade na entrega de conteúdo, com qualquer tamanho de audiência, reduzindo falhas e latência enquanto aumenta a taxa de transferência.

O nosso Edge Cache possui uma arquitetura de proxy reverso, pela qual os usuários se conectam nos edge nodes de nossa rede global altamente distribuída. Nela, é possível realizar o caching do seu conteúdo e ainda ampliar sua versatilidade com o add-on Tiered Cache, uma camada adicional de cache entre o edge da Azion e sua origem que ajuda a reduzir ainda mais a carga em sua infraestrutura.

Então, se você quer garantir altíssima velocidade para o seu site e a melhor experiência online para os seus usuários, fale aqui com o nosso time de vendas.

Inscreva-se na nossa Newsletter