...

¿La IA admite la detección de "Agrupación de personas" para identificar agrupaciones anómalas?

28 de mayo de 2026 Por Han

He visto a demasiados equipos de seguridad depender de alertas básicas de movimiento, solo para pasar por alto la amenaza real: un grupo que se forma silenciosamente en un punto ciego hasta que es demasiado tarde.

Sí, las cámaras de IA de grado industrial admiten la detección de “Agrupación de personas”. Esta función utiliza la estimación de mapas de densidad, el análisis de proximidad espacial y el seguimiento de la duración para identificar agrupaciones anómalas en tiempo real. Puede establecer umbrales personalizados para el recuento de personas, la densidad del área y el tiempo de permanencia para activar alertas instantáneas a su centro de seguridad.

Detección de agrupación de personas por IA para la vigilancia de seguridad Detección de agrupación de personas por IA para la vigilancia de seguridad

A continuación, detallaré exactamente cómo funciona, qué puede personalizar y cómo funciona en condiciones del mundo real, como transmisiones de baja resolución y despliegues 4G fuera de la red.

¿Puedo establecer un umbral (por ejemplo, >5 personas) para activar una alerta si un grupo se reúne en un área restringida?

Solía pensar que una simple regla de recuento sería suficiente. Pero después de probar en el campo, aprendí que los números brutos sin contexto crean más ruido que valor.

Sí, puede establecer un umbral de recuento de personas personalizado. La mayoría de las interfaces web profesionales de cámaras le permiten definir un número (como 5, 10 o 15 personas) dentro de una zona dibujada. Cuando se supera ese recuento durante una duración determinada, el sistema envía una alerta a su aplicación o centro de seguridad. Plataformas VMS1 y las interfaces web de las cámaras le permiten definir un número (como 5, 10 o 15 personas) dentro de una zona dibujada. Cuando se supera ese recuento durante una duración determinada, el sistema envía una alerta a su aplicación o centro de seguridad.

Configuración de umbrales de multitud en la interfaz VMS Configuración de umbrales de multitud en la interfaz VMS

Cómo funciona realmente la configuración de umbrales

Establecer un umbral suena simple. Pero en la práctica, necesita combinar múltiples parámetros para obtener alertas útiles sin ahogarse en falsos positivos.

Esto es lo que sucede detrás de escena. La IA dibuja una zona virtual en el campo de visión de la cámara. Usted define esta zona en la interfaz web de la cámara o en su software VMS. Dentro de esa zona, el algoritmo cuenta objetivos humanos distintos cuadro por cuadro. Cuando el recuento cruza su número establecido, comienza un temporizador. Si el recuento se mantiene por encima del umbral durante la duración definida (digamos, 30 segundos), el sistema lo confirma como un evento de reunión real y dispara la alerta.

Parámetros clave que puede ajustar

Parámetro Rango Típico Propósito
Umbral de recuento de personas2 3 – 50 (ajustable) Defina qué significa “anormal” para su zona específica
Tiempo mínimo de permanencia 10s – 120s Filtrar personas que solo pasan
Forma de la zona de detección Polígono (4–8 puntos) Coincide con el límite exacto de tu área restringida
Enfriamiento de alerta 1 – 10 minutos Evitar alertas repetidas durante un único evento en curso
Nivel de sensibilidad Baja / Media / Alta Equilibrio entre detectar eventos reales e ignorar el ruido

Por qué un número simple no es suficiente

Permíteme explicarte por qué necesitas más que solo “5 personas = alarma”. Imagina una acera al lado de tu valla restringida. Cinco trabajadores pasan cada 3 minutos durante el cambio de turno. Un recuento bruto de 5 activaría docenas de falsas alarmas al día. Por eso el parámetro de tiempo de permanencia es tan importante. Le dice al sistema: “Solo alarmarme si 5 o más personas permanecen en esta zona durante más de 30 segundos”.”

También puedes superponer reglas basadas en horarios. Por ejemplo, durante el horario comercial (8 a. m. – 6 p. m.), establece el umbral en 10 personas porque algo de tráfico peatonal es normal. Fuera del horario, redúcelo a 3 personas porque no debería haber nadie allí.

Mejores prácticas para dibujar zonas

La forma de tu zona de detección importa más de lo que la mayoría de la gente piensa. Dibújala demasiado grande y detectarás personas en caminos adyacentes. Dibújala demasiado pequeña y la IA podría pasar por alto objetivos que se encuentran justo fuera del límite. Recomiendo dejar un margen de 1 metro dentro de tu perímetro restringido real. Esto tiene en cuenta el ligero error de posición que tienen todas las analíticas de video al convertir píxeles 2D a coordenadas del mundo real.

Para sitios con múltiples puntos de entrada, crea zonas separadas para cada ruta de aproximación. De esta manera, tu alerta te dice no solo que se reunió gente, sino dónde se reunió. Esa información ayuda a tu equipo de respuesta a llegar más rápido.

¿Cómo maneja el algoritmo de densidad de multitudes los objetivos superpuestos en transmisiones 4K de baja resolución?

He visto cómo la detección tradicional de cuadros delimitadores fallaba en el momento en que dos personas se paraban juntas. Los cuadros se fusionan, el recuento disminuye y el sistema cree que la multitud es menor de lo que realmente es.

El algoritmo de densidad de multitudes evita por completo los cuadros delimitadores. En su lugar, utiliza la estimación de mapas de densidad a nivel de píxeles. Este enfoque maneja la oclusión pesada y los objetivos superpuestos mucho mejor que el conteo basado en cuadros, incluso en transmisiones 4K comprimidas.

Estimación de mapas de densidad frente a detección de cuadros delimitadores Estimación de mapas de densidad frente a detección de cuadros delimitadores

Por qué los cuadros delimitadores fallan en multitudes densas

La detección tradicional de objetos dibuja un rectángulo alrededor de cada persona. Cuando las personas se superponen, el algoritmo tiene dos malas opciones: fusionarlas en una sola caja (subconteo) o crear cajas inestables y parpadeantes (datos ruidosos). En una multitud de 20 personas de pie hombro con hombro, un sistema de cuadros delimitadores podría contar solo 12.

La estimación de mapas de densidad adopta un enfoque completamente diferente. No intenta aislar a cada individuo. En cambio, pregunta: “¿Cuánta presencia humana existe en cada píxel?” El resultado es un mapa de calor donde las áreas brillantes significan alta densidad y las áreas oscuras significan baja densidad. Al sumar los valores en su zona de detección, el sistema obtiene un recuento total preciso incluso cuando los cuerpos se superponen mucho.

El factor de compresión 4K

Aquí hay algo que muchos integradores pasan por alto. Su cámara puede capturar en resolución 4K, pero para cuando ese video viaja a través de un enlace 4G, ha sido comprimido. Codificación H.2653 a una velocidad de bits típica de 4–8 Mbps introduce artefactos. Los detalles finos como el espacio entre dos personas que están muy juntas pueden suavizarse.

El algoritmo de densidad está diseñado para tolerar esto. Debido a que funciona con patrones de características aprendidas en lugar de bordes afilados, la compresión moderada no lo rompe. Sin embargo, hay un límite. Si su velocidad de bits cae por debajo de 2 Mbps (común en redes 4G congestionadas), la precisión se degradará. Es por eso que recomiendo establecer un umbral mínimo de velocidad de bits en la configuración de su codificador.

Compensación entre resolución y velocidad de fotogramas

Para el análisis de densidad de multitudes, la velocidad de fotogramas importa más que la resolución bruta. He aquí por qué. El algoritmo necesita consistencia temporal. Rastrea cómo cambia el mapa de densidad con el tiempo para distinguir una multitud en crecimiento de un grupo que pasa. A 5 fps, el sistema tiene suficientes puntos de datos. A 1 fps (a lo que algunas cámaras solares descienden para ahorrar energía), el algoritmo podría perderse eventos de reunión rápidos.

Mi recomendación: ejecute a resolución 4K completa pero a 10–15 fps durante la monitorización normal. Cuando la IA detecte los primeros signos de reunión (aumento de la densidad), cambie automáticamente a 25 fps para un seguimiento preciso. Esto equilibra el ancho de banda, la energía y la calidad de la detección.

Expectativas de precisión prácticas

Escenario Precisión de conteo esperada Notas
Multitud dispersa (< 10 personas, superposición mínima) 95%+ El cuadro delimitador también funciona bien aquí
Multitud media (10–30 personas, algo de superposición) 85–92 % El mapa de densidad supera claramente la detección de cajas
Multitud densa (más de 30 personas, superposición pesada) 75–85% La precisión depende del ángulo y la altura de la cámara
Transmisión comprimida (< 4 Mbps) 70–80% Los artefactos reducen la separación de grano fino
Configuración óptima (ángulo alto, 8+ Mbps, 15 fps) 90%+ El mejor escenario para implementaciones reales

Estos números provienen de pruebas de campo reales, no de condiciones de laboratorio. Sus resultados reales dependen de la altura de montaje de la cámara, el ángulo de la lente, la iluminación y la estabilidad de la red.

¿Es la “Detección de agrupaciones” lo suficientemente sensible como para detectar merodeo ilegal en estacionamientos públicos?

He tenido clientes que me han hecho exactamente esta pregunta después de instalar cámaras básicas y aún así perdieron grupos merodeando por sus lotes por la noche. El problema no era la cámara. Era la incapacidad del algoritmo para distinguir entre “merodeo” y “estacionamiento”.”

Sí, la detección de congregación puede identificar merodeo en estacionamientos, pero requiere una calibración cuidadosa. La clave es combinar reglas de zonas espaciales con umbrales basados en el tiempo. Usted define dónde no deben permanecer las personas, establece un tiempo de permanencia (por ejemplo, 60 segundos) y la IA marca a cualquiera que permanezca más allá de ese límite.

Detección de merodeo en estacionamientos con zonas de IA Detección de merodeo en estacionamientos con zonas de IA

La diferencia entre congregación y merodeo

Estos dos comportamientos se ven similares para una cámara, pero son problemas diferentes. Congregación significa que varias personas se juntan en un lugar. Merodeo significa que una o más personas permanecen en un lugar más tiempo del esperado. Un buen sistema de IA maneja ambos, pero los configura de manera diferente.

Para los estacionamientos, normalmente querrá que ambas reglas estén activas al mismo tiempo:

  • Regla de merodeo: Alerte si alguna persona permanece en una zona que no sea de estacionamiento (como entre autos o cerca de salidas) durante más de 90 segundos.
  • Regla de congregación: Alerte si 3 o más personas se agrupan en cualquier lugar del lote durante más de 30 segundos.

Por qué los estacionamientos son difíciles para la IA

Los estacionamientos crean desafíos únicos para el análisis de video. Los autos bloquean las líneas de visión. Los faros crean cambios repentinos de brillo. Las sombras cambian a lo largo del día. Las personas caminan legítimamente hacia y desde sus vehículos, creando movimiento constante.

La IA necesita separar el comportamiento normal (caminar hacia un auto, cargar comestibles) del comportamiento anormal (tres personas paradas entre autos durante cinco minutos). Lo hace a través de análisis de trayectoria6. Una persona que camina en línea recta hacia un auto y luego se va es normal. Una persona que camina en círculos o se queda quieta no lo es.

Optimización para la detección nocturna

La mayor parte del merodeo ilegal ocurre por la noche. Esto significa que el rendimiento con poca luz de su cámara afecta directamente la precisión de la detección. Recomiendo cámaras con sensores de al menos 1/1.8″ e iluminación IR suplementaria. Sensores de luz estelar4 pueden mantener imágenes en color hasta 0.001 lux, lo que proporciona a la IA más datos de características para trabajar en comparación con el modo IR en blanco y negro.

Para sitios con energía solar donde la energía es limitada, use programación IR inteligente5. Mantenga los LED IR apagados durante el día y actívelos automáticamente al anochecer. Esto ahorra energía y garantiza que la IA tenga suficiente calidad de imagen para detectar formas humanas por la noche.

Reducción de falsas alarmas por vehículos y animales

En los estacionamientos, la mayor fuente de falsas alarmas no son las personas. Son los coches al ralentí, los animales que cruzan y la basura que se mueve con el viento. La IA moderna maneja esto a través de la clasificación de objetivos. El algoritmo primero identifica si un objeto detectado es una persona, un vehículo o un animal. Solo los objetivos humanos confirmados cuentan para el umbral de reunión o merodeo.

También puede establecer filtros de tamaño mínimo de objetivo. Esto elimina animales pequeños (gatos, pájaros) que de otro modo podrían desencadenar cambios de densidad a nivel de píxeles. Establezca la altura mínima en aproximadamente 0.8 metros en su calibración de perspectiva, y la mayoría de las falsas alarmas de animales desaparecerán.

¿Puedo personalizar el “Tiempo de agrupación” antes de que se envíe una alarma a mi centro de seguridad?

Aprendí desde el principio que las alertas instantáneas suenan bien en teoría, pero crean fatiga de alerta en la práctica. Su equipo de seguridad deja de prestar atención después de la alarma falsa número 50 en un turno.

Sí, el tiempo de reunión (también llamado tiempo de permanencia o duración mínima) es totalmente personalizable. Puede establecerlo entre 5 segundos y varios minutos. Este parámetro le dice a la IA cuánto tiempo debe permanecer agrupado un grupo antes de que el sistema lo confirme como un evento real y envíe la notificación.

Configuración de tiempo de alarma personalizable para la detección de multitudes Configuración de tiempo de alarma personalizable para la detección de multitudes

Por qué el tiempo es el parámetro más importante

De todas las configuraciones que puede ajustar, el tiempo de reunión tiene el mayor impacto en la experiencia diaria de su equipo. Si lo establece demasiado corto (menos de 10 segundos), cada grupo de compañeros de trabajo que charlan en un descanso para fumar activará una alarma. Si lo establece demasiado largo (más de 3 minutos), una amenaza real tendrá tiempo de actuar antes de que alguien responda.

El valor correcto depende completamente del perfil de riesgo de su sitio. Una instalación nuclear podría establecer 10 segundos porque cualquier reunión no autorizada es crítica. Un estacionamiento minorista podría establecer 90 segundos porque las interacciones sociales breves son normales.

Cómo funciona el temporizador internamente

El temporizador no es un cronómetro simple. Utiliza un modelo de “detección sostenida”. Aquí está la secuencia:

  1. La IA detecta que el número de personas en una zona excede el umbral.
  2. El temporizador comienza a contar.
  3. Si el recuento cae por debajo del umbral en cualquier momento (alguien se va), el temporizador se reinicia.
  4. Solo cuando el recuento se mantiene por encima del umbral de forma continua durante toda la duración, se activa la alarma.

Este enfoque “sostenido” evita activaciones falsas por aglomeraciones momentáneas, como un grupo que pasa por un pasillo estrecho. Podrían exceder el recuento durante 5 segundos, pero siguen moviéndose, por lo que el temporizador se reinicia.

Opciones de entrega de alarmas

Una vez que el temporizador confirma un evento de reunión real, tiene múltiples canales de entrega:

  • Notificación push a su aplicación móvil (más rápido, retraso de 2 a 5 segundos)
  • Alerta por correo electrónico con archivo adjunto de instantánea (bueno para registros, retraso de 10 a 30 segundos)
  • Ventana emergente de VMS en su estación de trabajo de monitoreo (instantáneo si el operador está observando)
  • Salida de relé para activar sirenas, luces o bloqueos de puertas (cableado, subsegundo)
  • Webhook de API7 a su plataforma personalizada o sistema PSIM8 (programable)

Tiempos recomendados por escenario

Tipo de sitio Tiempo de reunión sugerido Razonamiento
Infraestructura crítica (centrales eléctricas, centros de datos) 10 – 15 segundos Tolerancia cero para grupos no autorizados
Sitios de construcción 30 – 60 segundos Los trabajadores pueden agruparse brevemente; filtrar actividad normal
Estacionamientos de tiendas 60 – 120 segundos Las interacciones sociales son comunes; centrarse en merodeo prolongado
Parques públicos / áreas abiertas 120 – 180 segundos Alto tráfico peatonal; solo marcar agrupaciones anormales sostenidas
Sitios remotos fuera de la red (granjas, campos solares) 15 – 30 segundos Cualquier presencia humana es inusual; responder rápidamente

Combinando Tiempo con Niveles de Escalada

Para configuraciones más avanzadas, puede crear respuestas por niveles. Por ejemplo:

  • 30 segundos: El sistema registra el evento y comienza a grabar a resolución completa.
  • 60 segundos: Notificación push enviada al teléfono del guardia en el sitio.
  • 120 segundos: La alarma se escala al centro de seguridad central con transmisión de video en vivo.
  • 180 segundos: La advertencia de voz automatizada se reproduce a través del altavoz incorporado de la cámara.

Este enfoque gradual brinda contexto a su equipo antes de que respondan. Para cuando la alarma llega al centro de seguridad, el sistema ya ha capturado 2 minutos de metraje de evidencia de alta calidad.

Conclusión

La detección de congregación de multitudes es una capacidad de IA probada que funciona mejor cuando combina configuraciones de umbral inteligentes, colocación adecuada de la cámara y reglas de tiempo personalizadas. Si necesita ayuda para configurar estos parámetros para su sitio específico, comuníquese conmigo en sales05@.com y lo guiaré.


1. Software de gestión de video comúnmente utilizado para configurar y monitorear reglas de detección de IA. ︎↩︎ 2. Parámetro que establece cuántas personas deben reunirse antes de activar una alerta. ︎↩︎ 3. Estándar de compresión de video que reduce el ancho de banda mientras preserva la calidad para el análisis. ︎↩︎ 4. Tecnología de sensor de cámara de poca luz que permite imágenes en color en casi total oscuridad para una mejor detección de IA. ︎↩︎ 5. Función que activa los LED IR solo al anochecer para ahorrar energía en cámaras alimentadas por energía solar. ︎↩︎ 6. Método que utiliza la IA para comprender si el movimiento de una persona es normal (caminar hacia el coche) o sospechoso (merodear). ︎↩︎ 7. Integración programable que permite a la cámara enviar alertas a una plataforma personalizada o sistema PSIM. ︎↩︎ 8. Software de gestión de información de seguridad física que unifica múltiples subsistemas de seguridad. ︎↩︎

¿Listo para asegurar su proyecto?

Obtenga especificaciones técnicas completas, precios al por mayor y una solución personalizada para sus requisitos específicos de PTZ y Solar.

Respuesta en 24 horas

¿Necesita una solución solar a medida para su proyecto?

Consulte nuestras guías técnicas revisadas por expertos o solicite un plan de configuración personalizado. Nuestro equipo de ingenieros le ayudará a encontrar el kit de energía solar perfecto para sus requisitos específicos de cámara PTZ.