¿Qué es Request Coalescing?

Request Coalescing protege tu servidor de origen agrupando solicitudes concurrentes idénticas en una sola llamada upstream — previniendo ataques Thundering Herd y agotamiento de recursos.

Request Coalescing — también conocido como request collapsing o request deduplication — es una técnica que agrupa solicitudes concurrentes idénticas en una sola llamada upstream.

Cuando miles de usuarios acceden al mismo recurso simultáneamente, Request Coalescing asegura que solo una solicitud llegue a tu servidor de origen. Todas las demás solicitudes idénticas esperan la respuesta única, que luego se comparte entre todos los clientes en espera.

Esta técnica sirve una función crítica de seguridad: protección de origen contra ataques de agotamiento de recursos.

El problema de seguridad: Thundering Herd

Thundering Herd — también llamado cache stampede o dogpile effect — es una vulnerabilidad de seguridad que puede ser explotada para agotar los recursos del servidor de origen.

Cómo funciona Thundering Herd

Un recurso muy accedido expira del cache
Múltiples solicitudes simultáneas detectan el cache miss
Todas las solicitudes intentan independientemente regenerar los datos
El servidor de origen recibe una explosión de solicitudes idénticas
Los recursos del backend (CPU, memoria, conexiones) se saturan
Las solicitudes legítimas fallan o experimentan timeout

Vector de ataque

Actores maliciosos pueden explotar esta vulnerabilidad mediante:

Invalidación coordinada de cache — disparando mass cache misses
Ataques de timing — enviando solicitudes cuando el cache está por expirar
Agotamiento de recursos — usando Thundering Herd como técnica de amplificación DDoS

El resultado es predecible: saturación del backend, aumento de latencia, timeouts y degradación del servicio — exactamente lo que los atacantes buscan lograr.

Cómo Request Coalescing protege tu origen

Request Coalescing actúa como un mecanismo de control de seguridad en tu infraestructura distribuida.

El flujo de protección

Primera solicitud se convierte en líder La solicitud inicial identifica un cache miss y procede hacia el origen.
Solicitudes posteriores se agrupan En lugar de disparar nuevas llamadas al backend, las solicitudes idénticas esperan la respuesta del líder.
Respuesta única alimenta todas las solicitudes Cuando el origen responde, el resultado se reutiliza para todos los usuarios en espera, y el cache se repobla.

Beneficios de seguridad

1. Reducción de la superficie de ataque Al colapsar solicitudes, reduces la superficie de ataque de miles de potenciales llamadas de origen a una sola llamada.

2. Prevención de agotamiento de recursos El backend deja de recibir oleadas de llamadas idénticas, previniendo saturación de CPU, memoria y conexiones.

3. Mitigación de DDoS Request Coalescing actúa como defensa de primera línea contra ciertos patrones de DDoS que dependen de amplificación de solicitudes.

4. Prevención de fallos en cascada Cuando el backend colapsa por carga redundante, el problema usualmente se propaga a otros servicios. Coalescing ayuda a prevenir esta cascada.

Request Coalescing vs. otros controles de seguridad

Control	Tipo de Protección	Capa
WAF	Ataques de capa de aplicación	Capa 7
Protección DDoS	Ataques volumétricos	Capa 3/4/7
Rate Limiting	Frecuencia de solicitudes	Capa 7
Request Coalescing	Amplificación de solicitudes	Capa 7

Request Coalescing complementa — no reemplaza — otros controles de seguridad. Aborda específicamente el vector de amplificación de solicitudes que otros controles pueden no detectar.

Cuándo usar Request Coalescing para seguridad

Usa Request Coalescing cuando:

Tu origen tiene recursos limitados y no puede manejar tráfico en burst
Estás protegiendo endpoints de alta concurrencia
La expiración de cache puede disparar solicitudes masivas al origen
Necesitas defenderte contra ataques de agotamiento de recursos
Tu infraestructura sirve datos de lectura intensiva muy solicitados

Endpoints protegidos comunes

APIs de catálogo de productos y precios
Servicios de cálculo de envío
Validación de promociones y descuentos
Verificaciones de disponibilidad de stock
Contenido estático muy accedido

Cuándo NO usar Request Coalescing

Evita aplicar Request Coalescing cuando:

La operación es altamente personalizada por usuario
Los datos deben procesarse individualmente por solicitud
La respuesta no puede compartirse de forma segura entre usuarios
El endpoint representa una acción transaccional no idempotente

Request Coalescing está diseñado para operaciones de lectura y solicitudes idempotentes. No debe aplicarse a operaciones de escritura o endpoints transaccionales sin consideración cuidadosa.

Request Coalescing en una arquitectura de seguridad

Request Coalescing funciona mejor como parte de una estrategia de defensa en profundidad:

Capa 1: Protección de Infraestructura Distribuida

Reglas de WAF filtran solicitudes maliciosas
Rate limiting controla frecuencia de solicitudes
Request Coalescing previene amplificación

Capa 2: Capa de Cache

Contenido cacheado reduce carga en el origen
Invalidación de cache es coordinada
Políticas de TTL equilibran frescura y protección

Capa 3: Origin Shield

Request Coalescing protege durante cache misses
El origen tiene rate limiting adicional
Health checks detectan estrés en el origen

Ejemplo real: protegiendo contra ataques en flash sales

Durante flash sales, los atacantes pueden intentar sobrecargar tu origen mediante:

Envío de miles de solicitudes simultáneas para el mismo producto
Timing de solicitudes para impactar cuando el cache expira
Explotación del efecto Thundering Herd para agotar recursos

Sin Request Coalescing:

10,000 solicitudes simultáneas → 10,000 llamadas al origen
Servidor de origen sobrecargado
Usuarios legítimos experimentan timeouts
Potencial pérdida de ingresos

Con Request Coalescing:

10,000 solicitudes simultáneas → 1 llamada al origen
9,999 solicitudes esperan la respuesta única
El origen permanece estable
Todos los usuarios reciben la respuesta

Mejores prácticas para implementación de seguridad

1. Identifica endpoints de alto riesgo

Mapea qué endpoints son más vulnerables a ataques Thundering Herd:

Endpoints de lectura muy accedidos
Endpoints con respuestas cacheables
Endpoints que disparan operaciones costosas en el backend

2. Configura timeouts apropiados

Define timeouts de espera razonables para solicitudes coalesced para prevenir:

Usuarios esperando indefinidamente
Atacantes explotando timeouts largos

3. Monitorea patrones de ataque

Rastrea métricas que indican ataques Thundering Herd:

Picos súbitos en cache miss ratios
Patrones inusuales de solicitudes idénticas
Utilización de recursos del servidor de origen

4. Combina con rate limiting

Usa Request Coalescing junto con rate limiting:

Rate limiting controla volumen total de solicitudes
Coalescing controla amplificación de solicitudes

5. Planifica para degradación graciosa

Define comportamiento cuando:

La solicitud líder falla
Se alcanza el timeout
El origen no está disponible

FAQ

¿Qué es Request Coalescing?

Es una técnica que agrupa solicitudes concurrentes idénticas en una sola llamada upstream, protegiendo el origen de agotamiento de recursos.

¿Cómo mejora la seguridad Request Coalescing?

Previene ataques Thundering Herd y cache stampede, que pueden ser explotados para agotar los recursos del servidor de origen.

¿Es Request Coalescing protección contra DDoS?

Es un componente de la protección contra DDoS, abordando específicamente ataques de amplificación de solicitudes. Debe combinarse con otros controles de seguridad.

¿Cuál es la diferencia entre Request Coalescing y rate limiting?

Rate limiting controla el número total de solicitudes. Request Coalescing controla cuántas de esas solicitudes llegan al origen mediante la deduplicación de solicitudes concurrentes idénticas.

¿Cuándo debo usar Request Coalescing?

Úsalo para endpoints de lectura intensiva que pueden ser objetivos de agotamiento de recursos, especialmente durante eventos de alto tráfico.

¿Puede Request Coalescing reemplazar un WAF?

No. Request Coalescing es un control complementario. Un WAF filtra solicitudes maliciosas; Request Coalescing previene amplificación de solicitudes.

Conclusión

Request Coalescing es un poderoso control de seguridad que protege tu infraestructura de origen contra ataques Thundering Herd y agotamiento de recursos. Al agrupar solicitudes concurrentes idénticas, previene que los atacantes amplifiquen su impacto a través de técnicas de cache stampede.

Como parte de una estrategia de defensa en profundidad junto con WAF, protección DDoS y rate limiting, Request Coalescing asegura que tus servidores de origen permanezcan disponibles incluso bajo condiciones de ataque coordinado.

Próximos pasos

Conoce cómo las soluciones de seguridad de Azion pueden proteger tu infraestructura con Request Coalescing y otras técnicas de protección de origen.

Habla con un especialista en seguridad

Únete a nuestra comunidad

¿Qué es Request Coalescing? | Protección de origen

Aprende qué es Request Coalescing, cómo protege tu servidor de origen contra ataques Thundering Herd y cache stampede, y cuándo implementarlo para seguridad de infraestructura.

¿Qué es Request Coalescing?

El problema de seguridad: Thundering Herd

Cómo funciona Thundering Herd

Vector de ataque

Cómo Request Coalescing protege tu origen

El flujo de protección

Beneficios de seguridad

Request Coalescing vs. otros controles de seguridad

Cuándo usar Request Coalescing para seguridad

Usa Request Coalescing cuando:

Endpoints protegidos comunes

Cuándo NO usar Request Coalescing

Request Coalescing en una arquitectura de seguridad

Ejemplo real: protegiendo contra ataques en flash sales

Mejores prácticas para implementación de seguridad

1. Identifica endpoints de alto riesgo

2. Configura timeouts apropiados

3. Monitorea patrones de ataque

4. Combina con rate limiting

5. Planifica para degradación graciosa

FAQ

¿Qué es Request Coalescing?

¿Cómo mejora la seguridad Request Coalescing?

¿Es Request Coalescing protección contra DDoS?

¿Cuál es la diferencia entre Request Coalescing y rate limiting?

¿Cuándo debo usar Request Coalescing?

¿Puede Request Coalescing reemplazar un WAF?

Conclusión

Próximos pasos

Suscríbete a nuestro boletín informativo