La cuestión fundamental de la arquitectura

Al diseñar un sistema de monitoreo de transacciones contra el lavado de dinero, una de las decisiones arquitectónicas más críticas es si procesar las transacciones en tiempo real o en lotes. Esta elección se extiende a todos los aspectos de su sistema: costos de infraestructura, capacidades de detección, flujos de trabajo operativos y postura de cumplimiento normativo.

El enfoque tradicional ha sido el procesamiento por lotes: recopilar transacciones a lo largo del día, ejecutar algoritmos de detección durante la noche y presentar alertas a los analistas a la mañana siguiente. Pero a medida que la tecnología ha evolucionado y los esquemas de lavado de dinero se han vuelto más sofisticados, el monitoreo en tiempo real se ha vuelto cada vez más atractivo. La cuestión ya no es si es posible la monitorización en tiempo real, sino si es la elección correcta para sus necesidades específicas.

Información clave

La decisión entre tiempo real y por lotes no es binaria. Los sistemas AML más sofisticados utilizan un enfoque híbrido, procesando algunos escenarios en tiempo real mientras procesan otros por lotes. El arte es saber qué transacciones requieren atención inmediata y cuáles pueden esperar.

Comprender el procesamiento por lotes

El procesamiento por lotes analiza las transacciones en grupos a intervalos programados, normalmente diariamente, pero a veces cada hora o semanalmente, según el escenario. Este enfoque ha dominado los sistemas ALD durante décadas y por buenas razones:

Ventajas del procesamiento por lotes

Acceso completo a los datos:Los sistemas por lotes pueden analizar juntas las transacciones de un día completo, detectando patrones que surgen en todo el conjunto de datos. Los esquemas estructurantes que involucran múltiples transacciones a lo largo del día se vuelven evidentes cuando se ve el panorama completo.
Eficiencia computacional:El procesamiento masivo permite técnicas de optimización como la vectorización y el procesamiento paralelo en conjuntos de datos completos. Puede ejecutar costosos modelos de aprendizaje automático que serían demasiado lentos para el procesamiento por transacción.
Previsibilidad de recursos:Los costos de infraestructura son predecibles porque se sabe exactamente cuándo se producirá el procesamiento. Puede activar los recursos informáticos fuera del horario laboral cuando los costos de la nube son más bajos
Arquitectura más simple:Los sistemas por lotes son conceptualmente más sencillos de construir y mantener. No hay necesidad de una infraestructura de transmisión compleja, administración de estado o garantías de procesamiento exactamente una vez.
Pruebas más fáciles:Los trabajos por lotes son deterministas y reproducibles. Puede volver a ejecutar el lote de ayer con reglas modificadas para probar los cambios antes de implementarlos en producción.

Desventajas del procesamiento por lotes

Latencia de detección:Por definición, el procesamiento por lotes introduce retrasos. Una transacción sospechosa a las 9 a.m. no generará una alerta hasta el día siguiente, lo que les dará a los delincuentes una ventaja de más de 24 horas.
Capacidad de intervención limitada:No puede detener una transacción sospechosa si no la conoce hasta que se haya completado. Para escenarios de alto riesgo, este retraso puede ser inaceptable
Restricciones de la ventana de lotes:Todo el procesamiento debe completarse dentro de la ventana del lote. A medida que crecen los volúmenes de transacciones, es posible que tenga dificultades para finalizar el procesamiento antes de que llegue el siguiente lote.
Picos de recursos:Los trabajos por lotes crean una carga de infraestructura significativa durante las ventanas de procesamiento, lo que requiere un aprovisionamiento excesivo para manejar la capacidad máxima que permanece inactiva la mayor parte del tiempo.

18-36h

latencia de detección típica

para sistemas por lotes

60%

menor costo de infraestructura

vs sistema equivalente en tiempo real

99,9%

confiabilidad del procesamiento por lotes

tecnología madura y probada

Comprender el procesamiento en tiempo real

El procesamiento en tiempo real (o casi en tiempo real) analiza cada transacción a medida que ocurre, generando alertas en segundos o minutos. Este enfoque requiere una arquitectura fundamentalmente diferente, pero ofrece capacidades únicas:

Ventajas del procesamiento en tiempo real

Detección Inmediata:La actividad sospechosa se identifica en cuestión de segundos, lo que permite una respuesta rápida. Para escenarios como la apropiación de cuentas o la detección de cuentas mulas, esta velocidad es crucial
Intervención de transacciones:Los sistemas en tiempo real pueden bloquear o retrasar las transacciones antes de que se completen, previniendo el fraude y el lavado de dinero en lugar de simplemente detectarlo después del hecho.
Utilización continua de recursos:Los recursos informáticos se utilizan sin problemas a lo largo del día en lugar de aumentar durante los períodos de procesamiento por lotes. Esto puede ser más rentable a escala
Mejor experiencia del cliente:Para transacciones legítimas marcadas incorrectamente (falsos positivos), los sistemas en tiempo real pueden proporcionar comentarios inmediatos, lo que permite una resolución rápida en lugar de sorprender a los clientes días después.
Detección de patrones incrementales:Algunos patrones son más fáciles de detectar en tiempo real. Por ejemplo, las comprobaciones de velocidad ("demasiadas transacciones en la última hora") son naturales en las arquitecturas de streaming.

Desventajas del procesamiento en tiempo real

Complejidad arquitectónica:Los sistemas en tiempo real requieren una infraestructura de transmisión sofisticada (Kafka, Flink, Kinesis), gestión del estado y un manejo cuidadoso de los eventos desordenados.
Ventana de contexto limitada:Al procesar la transacción N, no puede ver la transacción N+1 que ocurre cinco minutos después. Algunos patrones que son obvios en lotes se vuelven más difíciles de detectar en transmisiones
Restricciones computacionales:Cada modelo debe completarse dentro de su SLA de latencia (normalmente < 100 ms para procesamiento en línea). Los modelos complejos de aprendizaje automático pueden ser demasiado lentos para la ejecución por transacción
Mayores costos de infraestructura:Los sistemas en tiempo real deben prepararse para volúmenes máximos de transacciones las 24 horas del día, los 7 días de la semana, lo que podría aumentar significativamente los costos de infraestructura.
Complejidad con estado:Mantener el estado en los sistemas de transmisión distribuidos es un desafío. Funciones como "número de transacciones esta semana" requieren una gestión del estado y ventanas cuidadosas

// Ejemplo: verificación de velocidad en tiempo real en la arquitectura de transmisión
// Usando procesamiento estilo Apache Flink

corriente
  .keyBy(txn => txn.accountId)
  .window(TumblingEventTimeWindows.of(Tiempo.horas(1)))
  .aggregate(nuevo VelocityAggregator())
  .filtro(velocidad => velocidad.cuenta > umbral)
  .map(crearAlerta)
  .addSink(alertaSink);

// La misma lógica en lote:
SELECCIONAR 
  id_cuenta,
  CONTAR(*) como txn_count,
  SUMA(monto) como monto_total
DE transacciones
DONDE marca de tiempo >= AHORA() - INTERVALO '1 hora'
GRUPO POR id_cuenta
TENER CUENTA (*) > umbral;

Arquitecturas híbridas: lo mejor de ambos mundos

En la práctica, los sistemas AML más sofisticados utilizan un enfoque híbrido, que combina el procesamiento por lotes y en tiempo real según los requisitos del escenario. Esta arquitectura por niveles procesa transacciones a través de múltiples capas:

Nivel 1: en línea en tiempo real (< 100 ms)

• Controles sencillos basados en reglas (detección de sanciones, umbrales de importe)
• Verificaciones de velocidad usando el estado reciente (transacciones por hora)
• Detección de malos actores conocidos (listas de bloqueo, estafadores anteriores)
• Indicadores de anomalías básicas que informan el procesamiento posterior
• Puede bloquear transacciones antes de su finalización

Nivel 2: casi en tiempo real (1-15 minutos)

• Modelos de ML sofisticados (demasiado lentos para en línea)
• Análisis gráfico de redes de transacciones.
• Detección de patrones entre cuentas
• Detección de anomalías de comportamiento
• Genera alertas para investigación inmediata.

Nivel 3: Procesamiento por lotes (diario/semanal)

• Detección de patrones temporales complejos
• Análisis integral de la red.
• Modelos de aprendizaje profundo computacionalmente costosos
• Comparación histórica y tendencias.
• Informes y análisis regulatorios

Este enfoque por niveles le permite aplicar el modelo de procesamiento adecuado a cada escenario. Los escenarios de alto riesgo que se benefician de una intervención inmediata reciben tratamiento en tiempo real, mientras que la detección de patrones complejos que requiere un contexto completo se ejecuta por lotes. La mayoría de las transacciones fluyen a través de los tres niveles, y cada capa agrega análisis progresivamente más sofisticados.

Marco de decisión: cuándo utilizar cada enfoque

Elegir entre procesamiento en tiempo real y por lotes requiere analizar sus requisitos específicos en múltiples dimensiones:

Utilice el procesamiento en tiempo real cuando:

La intervención es valiosa:Si bloquear o retrasar transacciones sospechosas proporciona un valor significativo, el tiempo real es esencial. Esto incluye prevención de fraude, cumplimiento de sanciones y seguimiento de clientes de alto riesgo.
La velocidad importa operativamente:Cuando los analistas necesitan investigar y resolver alertas mientras los clientes aún están interesados (por ejemplo, en una sucursal o por teléfono), el procesamiento en tiempo real permite un mejor servicio al cliente.
Requisitos reglamentarios:Algunas jurisdicciones o escenarios exigen controles en tiempo real, particularmente para la detección de sanciones y la prevención de la financiación del terrorismo.
La lógica de detección es simple:Si sus reglas y modelos pueden ejecutarse en menos de 100 ms, el procesamiento en tiempo real es factible sin una optimización exhaustiva.
Patrones por transacción:Cuando se detectan anomalías en transacciones individuales o en un historial muy reciente (velocidad, geolocalización, huellas dactilares del dispositivo)

Utilice el procesamiento por lotes cuando:

El contexto requiere un conjunto de datos completo:Detectar estructuras, capas u otros esquemas complejos a menudo requiere ver las transacciones de un día o una semana completos para identificar el patrón.
Computacionalmente intensivo:Los modelos de aprendizaje profundo, las redes neuronales gráficas o el análisis integral de redes pueden requerir segundos o minutos por transacción, algo aceptable en lotes pero imposible en tiempo real.
Análisis retroactivo:Los informes regulatorios, el análisis de tendencias y la capacitación de modelos se adaptan naturalmente al procesamiento por lotes, ya que analizan datos históricos.
Restricciones de costos:Cuando el presupuesto de infraestructura es limitado, el procesamiento por lotes proporciona más capacidad de detección por cada dólar gastado
No se necesita intervención:Para muchos escenarios de AML, un retraso de detección de 24 horas es aceptable porque está documentando patrones para la presentación de SAR, no impidiendo transacciones.

Patrón de arquitectura

Un patrón común exitoso es comenzar con el procesamiento por lotes para obtener una cobertura integral y luego pasar progresivamente escenarios específicos de alto valor a tiempo real a medida que los identifique.

• Comience con el procesamiento por lotes para todos los escenarios
• Identifique patrones de alto riesgo donde la velocidad importa
• Implementar procesamiento en tiempo real para esos escenarios específicos
• Mantenga el procesamiento por lotes para una cobertura de respaldo integral

Consideraciones técnicas de implementación

La implementación exitosa de cualquiera de las arquitecturas requiere atención cuidadosa a los detalles técnicos que impactan significativamente el rendimiento y la confiabilidad:

Desafíos de implementación en tiempo real

La creación de un monitoreo AML en tiempo real a nivel de producción implica resolver varios desafíos técnicos que no existen en los sistemas por lotes:

Gestión Estatal:Los sistemas de transmisión deben mantener el estado (saldos de cuentas, recuentos de transacciones, patrones históricos) entre los trabajadores distribuidos. Esto requiere un uso cuidadoso de los almacenes estatales, las ventanas y las marcas de agua.
Procesamiento exactamente una vez:Evitar alertas duplicadas cuando los sistemas fallan y se reinician requiere un procesamiento idempotente y un manejo cuidadoso de las transacciones.
Datos que llegan tarde:Las transacciones pueden llegar desordenadas o retrasadas. Su estrategia de ventanas debe manejar esto con elegancia sin crear brechas en la detección.
Manejo de contrapresión:Cuando los sistemas posteriores se ralentizan, la canalización de transmisión debe manejar la contrapresión sin interrumpir las transacciones ni crear un crecimiento ilimitado de la memoria.
Implementación del modelo:La actualización de modelos de aprendizaje automático en un sistema de transmisión en ejecución sin tiempo de inactividad ni procesamiento duplicado requiere estrategias de implementación sofisticadas

Desafíos de implementación por lotes

Si bien conceptualmente son más simples, los sistemas por lotes tienen sus propias complejidades técnicas:

Gestión de ventanas por lotes:A medida que crecen los volúmenes de datos, completar el procesamiento dentro de las ventanas disponibles se vuelve un desafío. Las estrategias incluyen procesamiento incremental, partición de datos y optimización progresiva.
Gestión de dependencias:Los trabajos por lotes a menudo dependen de múltiples fuentes de datos ascendentes. Orquestar estas dependencias y manejar las fallas con elegancia requiere herramientas como Airflow o Dagster.
Reprocesamiento:Cuando descubre problemas en el procesamiento histórico, reprocesar de manera eficiente grandes rangos de fechas requiere una arquitectura cuidadosa para actualizaciones incrementales.
Actualización de datos:Garantizar que todos los datos necesarios hayan llegado antes de iniciar el procesamiento por lotes requiere una coordinación cuidadosa, especialmente entre zonas horarias.

Análisis de rendimiento y costos

Las características de rendimiento y costo del procesamiento en tiempo real versus el procesamiento por lotes difieren significativamente, y la elección óptima depende en gran medida de su volumen y patrones de transacciones:

3-5x

aumento de costos de infraestructura

en tiempo real frente a lotes (típico)

99,5%

costo en cálculo

para procesamiento por lotes

60%

costo de infraestructura de transmisión

para sistemas en tiempo real

Desglose de costos: procesamiento por lotes

Para una institución financiera que procesa 10 millones de transacciones por día con monitoreo ALD por lotes:

Cálculo: $3000/mes (activar un clúster grande durante 4 horas cada noche)
Almacenamiento: $800/mes (historial de transacciones de 90 días, historial de alertas de 1 año)
Orquestación: $200/mes (servicio administrado por Airflow)
Total: ~$4000/mes o $0,012 por cada 1000 transacciones

Desglose de costos: procesamiento en tiempo real

Para la misma institución con seguimiento en tiempo real:

Infraestructura de streaming: $8000/mes (Kafka o Kinesis a escala)
Procesamiento de flujo: $5000/mes (clúster Flink, siempre activo)
Tienda estatal: $2500/mes (Redis o DynamoDB para estado en tiempo real)
Servicio de modelo: $3500/mes (infraestructura de inferencia de baja latencia)
Total: ~$19 000/mes o $0,057 por cada 1000 transacciones

La diferencia de costo de 4 a 5 veces es típica, pero la propuesta de valor depende completamente de lo que permite esa capacidad en tiempo real. Si se bloquean 10 millones de dólares en transacciones fraudulentas al mes, el retorno de la inversión es obvio. Si simplemente está moviendo la generación de alertas de 24 horas a 5 minutos sin impacto operativo, es posible que no esté justificado.

Consideraciones regulatorias y de cumplimiento

Los diferentes regímenes regulatorios tienen diferentes expectativas en torno a la latencia del monitoreo ALD, lo que puede influir en sus elecciones arquitectónicas:

Evaluación de sanciones

La mayoría de las jurisdicciones exigen una verificación de sanciones en tiempo real antes de que se completen las transacciones. Por lo general, esto no es negociable y debe ser parte de su procesamiento en línea. Sin embargo, la evaluación integral de las sanciones a menudo puede dividirse:

En línea: coincidencias exactas de nombres y coincidencias aproximadas de alta confianza (< 100 ms)
Casi en tiempo real: coincidencia difusa integral, algoritmos fonéticos (1-5 minutos)
Lote: Detección de sanciones basada en red, análisis de beneficiarios reales (diario)

Detección de actividad sospechosa

Para el monitoreo general de ALD, los reguladores normalmente esperan una detección "oportuna" en lugar de en tiempo real. Lo que constituye "oportuno" varía según la jurisdicción y el perfil de riesgo:

Clientes de alto riesgo: se espera un seguimiento casi en tiempo real o diario
Clientes de riesgo medio: monitoreo diario a semanal aceptable
Clientes de bajo riesgo: el seguimiento semanal o mensual suele ser suficiente

Este enfoque basado en riesgos permite una arquitectura escalonada donde los escenarios de alto riesgo reciben tratamiento en tiempo real, mientras que los escenarios de menor riesgo utilizan el procesamiento por lotes, optimizando tanto el cumplimiento como el costo.

Perspectiva regulatoria

Los reguladores se preocupan más por la eficacia de su detección que por la velocidad, salvo algunas excepciones. Un sistema por lotes que detecta el 95% del lavado de dinero es mejor que un sistema en tiempo real que detecta el 60%.

• Documente su enfoque basado en riesgos para monitorear la frecuencia
• Demostrar que la latencia de detección es adecuada para cada escenario.
• Demuestre que su arquitectura puede escalar con el crecimiento de las transacciones
• Demuestre que puede investigar y presentar SAR dentro de los plazos requeridos.

Estrategias de migración

Muchas instituciones están considerando migrar del procesamiento por lotes al procesamiento en tiempo real o implementar arquitecturas híbridas. Basándonos en nuestra experiencia ayudando a docenas de instituciones financieras con esta transición, aquí presentamos una ruta de migración comprobada:

Fase 1: Establecer una infraestructura de streaming (3-6 meses)

Implementar plataforma de streaming (Kafka, Kinesis, Pulsar)
Implementar la ingestión de transacciones en la infraestructura de transmisión
Cree runbooks operativos, de supervisión y de alertas
Capacitar al equipo de operaciones en operaciones de streaming
Ejecutar en paralelo con el sistema por lotes existente (no cambiar todavía)

Fase 2: Implementación del Modo Sombra (2-4 meses)

Implementar escenarios seleccionados en procesamiento en tiempo real
Generar alertas pero no enviarlas a analistas (modo sombra)
Compare alertas en tiempo real con alertas por lotes para los mismos escenarios
Ajuste para lograr paridad o mejor con el rendimiento por lotes
Validar la latencia, la precisión y las características operativas.

Fase 3: transición gradual (3-6 meses)

Mover el primer escenario al procesamiento de producción en tiempo real
Monitoree cuidadosamente para detectar problemas y mantenga el lote como respaldo
Migrar progresivamente escenarios adicionales
Mantenga el procesamiento por lotes en ejecución para una cobertura integral
Documentar los aprendizajes y perfeccionar el enfoque de forma iterativa

Fase 4: Optimización y mejora (en curso)

Optimice el rendimiento y reduzca costes
Agregue escenarios sofisticados de detección en tiempo real
Implementar capacidades de intervención.
Mejore con actualizaciones del modelo ML en tiempo real
Continuar con el procesamiento por lotes para análisis complejos

Estudio de caso: Migración de grandes bancos europeos

Un importante banco europeo con 15 millones de clientes y 50 millones de transacciones mensuales migró con éxito de una arquitectura por lotes pura a una arquitectura híbrida en 18 meses:

Punto de partida:Procesamiento por lotes diario con latencia de alerta de 24 a 36 horas, tasa de alerta del 3,2 %, tasa de verdaderos positivos del 8 %
Fase 1:Implementación de controles de velocidad y detección de sanciones en tiempo real (6 meses)
Fase 2:Se agregaron modelos de aprendizaje automático casi en tiempo real para adquisición de cuentas y detección de mulas (6 meses)
Fase 3:Procesamiento por lotes mantenido para la detección de patrones complejos, mejorado con redes neuronales gráficas (6 meses)
Resultados:La latencia de alerta promedio se redujo a 4 horas, la tasa de alerta disminuyó al 1,8 %, la tasa de verdaderos positivos mejoró al 15 %, se bloquearon 45 millones de euros en fraude durante el primer año.

El enfoque híbrido resultó óptimo: procesamiento en tiempo real para escenarios donde la intervención tiene valor, procesamiento por lotes para una detección integral de patrones que requiere un contexto completo.

Tendencias futuras: convergencia y evolución

El futuro de las arquitecturas de monitoreo ALD es cada vez más sofisticado y están surgiendo varias tendencias:

Microprocesamiento por lotes:El procesamiento de lotes pequeños cada pocos minutos combina los beneficios de ambos enfoques: latencia casi en tiempo real con contexto completo al estilo de lotes.
Procesamiento adaptativo:Sistemas que eligen dinámicamente la estrategia de procesamiento según la puntuación de riesgo de la transacción, utilizando tiempo real para alto riesgo y lotes para bajo riesgo.
Aprendizaje continuo:Modelos de aprendizaje automático que se actualizan incrementalmente a partir de la transmisión de datos en lugar de requerir un reentrenamiento por lotes, lo que permite una adaptación más rápida a nuevos patrones.
Streaming unificado/por lotes:Marcos como Apache Beam que permiten escribir la lógica de procesamiento una vez e implementarla en motores de transmisión por secuencias o por lotes.
Procesamiento de bordes:Mover parte de la lógica de detección al punto de origen de la transacción para una intervención de latencia ultrabaja

Conclusión: no es ni lo uno ni lo otro

La cuestión del tiempo real versus el lote no es binaria. Los sistemas AML más eficaces utilizan ambos enfoques estratégicamente, aplicando procesamiento en tiempo real donde sus capacidades proporcionan un valor claro y procesamiento por lotes donde un análisis integral requiere un contexto completo.

Su decisión debe basarse en una evaluación clara de sus requisitos: ¿dónde importa la velocidad de detección? ¿Dónde es valiosa la intervención? ¿Cuáles son sus limitaciones computacionales y de costos? ¿Qué requiere su entorno regulatorio? La respuesta será diferente para cada institución y cada escenario dentro de esa institución.

En nerous.ai, nuestra plataforma admite de forma nativa el procesamiento por lotes y en tiempo real, lo que permite a las instituciones elegir el enfoque correcto para cada escenario sin quedar encerradas en un único patrón arquitectónico. Esta flexibilidad es crucial a medida que los esquemas de lavado de dinero evolucionan y los requisitos institucionales cambian con el tiempo.

La mejor arquitectura no es la más avanzada ni la más costosa: es la que mejor se alinea con sus requisitos operativos, regulatorios y comerciales específicos, sin dejar de ser sustentable y escalable a medida que su institución crece.

Monitoreo de transacciones en tiempo real versus por lotes: elección de la arquitectura adecuada