Ho visto troppi team di sicurezza fare affidamento su semplici avvisi di movimento, solo per perdere la vera minaccia: un gruppo che si forma silenziosamente in un punto cieco fino a quando non è troppo tardi.
Sì, le telecamere AI di livello industriale supportano il rilevamento di “assembramenti”. Questa funzione utilizza la stima della mappa di densità, l'analisi della prossimità spaziale e il tracciamento della durata per identificare raggruppamenti anomali in tempo reale. È possibile impostare soglie personalizzate per il conteggio delle persone, la densità dell'area e il tempo di permanenza per attivare avvisi istantanei al proprio centro di sicurezza.

Di seguito, spiegherò esattamente come funziona, cosa è possibile personalizzare e come si comporta in condizioni reali come flussi a bassa risoluzione e distribuzioni 4G offline.
Indice dei contenuti
Posso impostare una soglia (ad es. >5 persone) per attivare un avviso se un gruppo si riunisce in un'area ristretta?
Pensavo che una semplice regola di conteggio sarebbe stata sufficiente. Ma dopo aver testato sul campo, ho imparato che i numeri grezzi senza contesto creano più rumore che valore.
Sì, è possibile impostare una soglia di conteggio personalizzata delle persone. La maggior parte delle interfacce web professionali Piattaforme VMS1 e delle telecamere consente di definire un numero (come 5, 10 o 15 persone) all'interno di una zona disegnata. Quando tale conteggio viene superato per una durata prestabilita, il sistema invia un avviso alla tua app o al centro di sicurezza.

Come funziona effettivamente la configurazione della soglia
Impostare una soglia sembra semplice. Ma in pratica, è necessario combinare più parametri per ottenere avvisi utili senza essere sommersi da falsi positivi.
Ecco cosa succede dietro le quinte. L'IA disegna una zona virtuale sul campo visivo della telecamera. Si definisce questa zona nell'interfaccia web della telecamera o nel software VMS. All'interno di tale zona, l'algoritmo conta i bersagli umani distinti fotogramma per fotogramma. Quando il conteggio supera il numero impostato, parte un timer. Se il conteggio rimane al di sopra della soglia per la durata definita (ad esempio, 30 secondi), il sistema lo conferma come un vero evento di assembramento e attiva l'allarme.
Parametri chiave che è possibile regolare
| Parametro | Intervallo tipico | Scopo |
|---|---|---|
| Soglia di conteggio persone2 | 3 – 50 (regolabile) | Definisci cosa significa “anomalo” per la tua zona specifica |
| Tempo minimo di permanenza | 10s – 120s | Filtra le persone che stanno solo passando |
| Forma della zona di rilevamento | Poligono (4–8 punti) | Corrisponde al confine esatto della tua area ristretta |
| Raffreddamento degli allarmi | 1 – 10 minuti | Impedisce allarmi ripetuti durante un singolo evento in corso |
| Livello di sensibilità | Bassa / Media / Alta | Equilibrio tra il rilevamento di eventi reali e l'ignoranza del rumore |
Perché un semplice numero non è sufficiente
Lascia che ti spieghi perché hai bisogno di più di un semplice “5 persone = allarme”. Immagina un marciapiede accanto alla tua recinzione ristretta. Cinque operai passano ogni 3 minuti durante il cambio turno. Un conteggio grezzo di 5 attiverebbe dozzine di falsi allarmi al giorno. Ecco perché il parametro del tempo di permanenza è così importante. Dice al sistema: “Avvisami solo se 5 o più persone rimangono in questa zona per più di 30 secondi”.”
Puoi anche aggiungere regole basate su orari. Ad esempio, durante l'orario di lavoro (8:00-18:00), imposta la soglia a 10 persone perché un certo traffico pedonale è normale. Dopo l'orario di lavoro, abbassala a 3 persone perché non dovrebbe esserci nessuno.
Migliori pratiche per il disegno delle zone
La forma della tua zona di rilevamento è più importante di quanto la maggior parte delle persone pensi. Disegnala troppo grande e rileverai persone su percorsi adiacenti. Disegnala troppo piccola e l'IA potrebbe non rilevare bersagli che si trovano appena fuori dal confine. Raccomando di lasciare un margine di 1 metro all'interno del tuo perimetro ristretto effettivo. Questo tiene conto del leggero errore di posizione che tutte le analisi video hanno quando convertono pixel 2D in coordinate del mondo reale.
Per siti con più punti di ingresso, crea zone separate per ogni percorso di avvicinamento. In questo modo, il tuo allarme ti dice non solo che le persone si sono radunate, ma dove si sono radunate. Queste informazioni aiutano il tuo team di risposta ad arrivare più velocemente.
Come gestisce l'algoritmo di densità della folla i bersagli sovrapposti in flussi 4K a bassa risoluzione?
Ho visto la tradizionale rilevazione a riquadri di delimitazione fallire nel momento in cui due persone si trovano vicine. I riquadri si fondono, il conteggio diminuisce e il sistema pensa che la folla sia più piccola di quanto non sia in realtà.
L'algoritmo di densità della folla aggira completamente i riquadri di delimitazione. Invece, utilizza la stima della mappa di densità a livello di pixel. Questo approccio gestisce meglio l'occlusione pesante e i bersagli sovrapposti rispetto al conteggio basato su riquadri, anche su flussi 4K compressi.

Perché i riquadri di delimitazione falliscono in folle dense
Il rilevamento tradizionale degli oggetti disegna un rettangolo attorno a ogni persona. Quando le persone si sovrappongono, l'algoritmo ha due scelte sbagliate: fonderle in un'unica scatola (sottostima) o creare scatole instabili e tremolanti (dati rumorosi). In una folla di 20 persone in piedi spalla a spalla, un sistema di bounding box potrebbe contarne solo 12.
La stima della mappa di densità adotta un approccio completamente diverso. Non cerca di isolare ogni individuo. Invece, chiede: “Quanta presenza umana esiste in ogni pixel?” L'output è una mappa di calore in cui le aree luminose indicano alta densità e le aree scure indicano bassa densità. Sommando i valori nella zona di rilevamento, il sistema ottiene un conteggio totale accurato anche quando i corpi si sovrappongono pesantemente.
Il fattore di compressione 4K
Ecco qualcosa che molti integratori trascurano. La tua telecamera potrebbe catturare a risoluzione 4K, ma nel momento in cui quel video viaggia su un collegamento 4G, è stato compresso. Codifica H.2653 a un tipico bitrate di 4-8 Mbps introduce artefatti. Dettagli fini come lo spazio tra due persone in piedi vicine possono essere smussati.
L'algoritmo di densità è progettato per tollerare questo. Poiché funziona su schemi di caratteristiche appresi anziché su bordi netti, la compressione moderata non lo danneggia. Tuttavia, c'è un limite. Se il tuo bitrate scende al di sotto di 2 Mbps (comune su reti 4G congestionate), l'accuratezza diminuirà. Ecco perché consiglio di impostare un limite minimo di bitrate nelle impostazioni del tuo encoder.
Compromesso risoluzione vs. frequenza dei fotogrammi
Per l'analisi della densità della folla, la frequenza dei fotogrammi è più importante della risoluzione grezza. Ecco perché. L'algoritmo necessita di coerenza temporale. Traccia come la mappa di densità cambia nel tempo per distinguere una folla in crescita da un gruppo di passaggio. A 5 fps, il sistema ha abbastanza punti dati. A 1 fps (a cui alcune telecamere solari scendono per risparmiare energia), l'algoritmo potrebbe perdere eventi di raccolta rapidi.
La mia raccomandazione: esegui a piena risoluzione 4K ma a 10-15 fps durante il monitoraggio normale. Quando l'IA rileva i primi segni di assembramento (densità in aumento), passa automaticamente a 25 fps per un tracciamento accurato. Questo bilancia larghezza di banda, potenza e qualità di rilevamento.
Aspettative di accuratezza pratica
| Scenario | Accuratezza di conteggio prevista | Note |
|---|---|---|
| Folla sparsa (< 10 persone, sovrapposizione minima) | 95%+ | Anche il bounding box funziona bene qui |
| Folla media (10-30 persone, sovrapposizione parziale) | 85-92% | La mappa di densità supera chiaramente il rilevamento a scatola |
| Folla densa (30+ persone, sovrapposizione pesante) | 75-85% | L'accuratezza dipende dall'angolo e dall'altezza della telecamera |
| Flusso compresso (< 4 Mbps) | 70–80% | Gli artefatti riducono la separazione granulare |
| Configurazione ottimale (angolo elevato, 8+ Mbps, 15 fps) | 90%+ | Scenario migliore per implementazioni reali |
Questi numeri provengono da test sul campo reali, non da condizioni di laboratorio. I tuoi risultati effettivi dipendono dall'altezza di montaggio della telecamera, dall'angolo dell'obiettivo, dall'illuminazione e dalla stabilità della rete.
Il “Rilevamento di assembramenti” è abbastanza sensibile da individuare il vagabondaggio illegale nei parcheggi pubblici?
Ho avuto clienti che mi hanno posto esattamente questa domanda dopo aver installato telecamere di base e aver comunque perso gruppi di persone che stazionavano nei loro parcheggi di notte. Il problema non era la telecamera. Era l'incapacità dell'algoritmo di distinguere tra “sosta” e “parcheggio”.”
Sì, il rilevamento di assembramento può identificare la sosta nei parcheggi, ma richiede un'attenta calibrazione. La chiave è combinare regole di zona spaziale con soglie basate sul tempo. Definisci dove le persone non dovrebbero indugiare, imposta un tempo di permanenza (ad esempio, 60 secondi) e l'IA segnala chiunque rimanga oltre quel limite.

La differenza tra assembramento e sosta
Questi due comportamenti sembrano simili a una telecamera, ma sono problemi diversi. L'assembramento significa che più persone si riuniscono in un unico posto. La sosta significa che una o più persone rimangono in un posto più a lungo del previsto. Un buon sistema AI gestisce entrambi, ma li configuri in modo diverso.
Per i parcheggi, di solito vuoi entrambe le regole attive contemporaneamente:
- Regola di sosta: Avvisa se una persona rimane in una zona non di parcheggio (come tra le auto o vicino alle uscite) per più di 90 secondi.
- Regola di assembramento: Avvisa se 3 o più persone si raggruppano ovunque nel parcheggio per più di 30 secondi.
Perché i parcheggi sono difficili per l'IA
I parcheggi creano sfide uniche per l'analisi video. Le auto bloccano le linee di vista. I fari creano improvvisi cambiamenti di luminosità. Le ombre si spostano durante il giorno. Le persone camminano legittimamente verso e dai loro veicoli, creando un movimento costante.
L'IA deve separare il comportamento normale (camminare verso un'auto, caricare la spesa) dal comportamento anomalo (tre persone ferme tra le auto per cinque minuti). Lo fa attraverso l'analisi della traiettoria6. Una persona che cammina in linea retta verso un'auto e poi si allontana è normale. Una persona che cammina in cerchio o sta ferma non lo è.
Ottimizzazione per il rilevamento notturno
La maggior parte della sosta illegale avviene di notte. Ciò significa che le prestazioni della tua telecamera in condizioni di scarsa illuminazione influiscono direttamente sull'accuratezza del rilevamento. Raccomando telecamere con sensori da almeno 1/1,8″ e illuminazione IR supplementare. Sensori di luce stellare4 possono mantenere l'imaging a colori fino a 0,001 lux, il che fornisce all'IA più dati di funzionalità con cui lavorare rispetto alla modalità IR in bianco e nero.
Per i siti alimentati a energia solare dove l'energia è limitata, utilizzare pianificazione IR intelligente5. Mantenere i LED IR spenti durante il giorno e attivarli automaticamente al tramonto. Ciò consente di risparmiare energia garantendo al contempo che l'IA disponga di una qualità dell'immagine sufficiente per rilevare forme umane di notte.
Riduzione dei falsi allarmi da veicoli e animali
Nei parcheggi, la principale fonte di falsi allarmi non sono le persone. Sono le auto al minimo, gli animali che attraversano e la spazzatura che viene portata dal vento. L'IA moderna gestisce questo attraverso la classificazione dei bersagli. L'algoritmo identifica prima se un oggetto rilevato è una persona, un veicolo o un animale. Solo i bersagli umani confermati contano per la soglia di assembramento o stazionamento.
È anche possibile impostare filtri per la dimensione minima del bersaglio. Questo elimina i piccoli animali (gatti, uccelli) che altrimenti potrebbero innescare cambiamenti di densità a livello di pixel. Impostare l'altezza minima a circa 0,8 metri nella calibrazione della prospettiva e la maggior parte dei falsi allarmi dovuti ad animali scomparirà.
Posso personalizzare il “Tempo di assembramento” prima che un allarme venga inviato al mio centro di sicurezza?
Ho imparato presto che gli avvisi istantanei suonano bene in teoria ma creano affaticamento da allarme in pratica. Il tuo team di sicurezza smette di prestare attenzione dopo il 50° falso allarme in un turno.
Sì, il tempo di assembramento (chiamato anche tempo di permanenza o durata minima) è completamente personalizzabile. Puoi impostarlo da 5 secondi a diversi minuti. Questo parametro indica all'IA per quanto tempo un gruppo deve rimanere raggruppato prima che il sistema lo confermi come un evento reale e invii la notifica.

Perché il timing è il parametro più importante
Di tutte le impostazioni che puoi regolare, il tempo di assembramento ha il maggiore impatto sull'esperienza quotidiana del tuo team. Impostalo troppo breve (meno di 10 secondi) e ogni gruppo di colleghi che chiacchiera durante una pausa sigaretta attiverà un allarme. Impostalo troppo lungo (oltre 3 minuti) e una minaccia reale avrà il tempo di agire prima che qualcuno risponda.
Il valore corretto dipende interamente dal profilo di rischio del tuo sito. Una centrale nucleare potrebbe impostare 10 secondi perché qualsiasi assembramento non autorizzato è critico. Un parcheggio di un negozio al dettaglio potrebbe impostare 90 secondi perché le brevi interazioni sociali sono normali.
Come funziona il timer internamente
Il timer non è un semplice cronometro. Utilizza un modello di “rilevamento sostenuto”. Ecco la sequenza:
- L'IA rileva che il numero di persone in una zona supera la soglia.
- Il timer inizia a contare.
- Se il conteggio scende al di sotto della soglia in qualsiasi momento (qualcuno se ne va), il timer si resetta.
- Solo quando il conteggio rimane continuamente al di sopra della soglia per l'intera durata, scatta l'allarme.
Questo approccio “sostenuto” impedisce falsi allarmi dovuti a assembramenti momentanei, come un gruppo che attraversa uno stretto corridoio. Potrebbero superare il conteggio per 5 secondi, ma continuano a muoversi, quindi il timer si reimposta.
Opzioni di consegna degli allarmi
Una volta che il timer conferma un vero evento di assembramento, hai più canali di consegna:
- Notifica push sulla tua app mobile (più veloce, ritardo di 2-5 secondi)
- Avviso e-mail con allegato snapshot (utile per i registri, ritardo di 10-30 secondi)
- Popup VMS sulla tua postazione di monitoraggio (istantaneo se l'operatore sta guardando)
- Uscita relè per attivare sirene, luci o blocchi di cancelli (cablato, sub-secondo)
- Webhook API7 alla tua piattaforma personalizzata o sistema PSIM8 (programmabile)
Tempistica consigliata per scenario
| Tipo di Sito | Tempo di assembramento suggerito | Ragionamento |
|---|---|---|
| Infrastrutture critiche (centrali elettriche, data center) | 10 – 15 secondi | Tolleranza zero per gruppi non autorizzati |
| Cantieri edili | 30 – 60 secondi | I lavoratori possono raggrupparsi brevemente; filtrare l'attività normale |
| Parcheggi di negozi | 60 – 120 secondi | Le interazioni sociali sono comuni; concentrarsi su stazionamenti prolungati |
| Parchi pubblici / aree aperte | 120 – 180 secondi | Elevato traffico pedonale; segnalare solo cluster anomali sostenuti |
| Siti remoti off-grid (fattorie, campi solari) | 15 – 30 secondi | Qualsiasi presenza umana è insolita; rispondere rapidamente |
Combinare il tempo con i livelli di escalation
Per configurazioni più avanzate, è possibile creare risposte a più livelli. Ad esempio:
- 30 secondi: Il sistema registra l'evento e inizia la registrazione a risoluzione completa.
- 60 secondi: Notifica push inviata al telefono della guardia in loco.
- 120 secondi: L'allarme viene escalation al centro di sicurezza centrale con feed video live.
- 180 secondi: Un avviso vocale automatico viene riprodotto tramite l'altoparlante integrato della telecamera.
Questo approccio graduale fornisce al tuo team un contesto prima che rispondano. Quando l'allarme raggiunge il centro di sicurezza, il sistema ha già acquisito 2 minuti di filmati di prova di alta qualità.
Conclusione
Il rilevamento di assembramenti di folla è una comprovata capacità dell'IA che funziona al meglio quando si combinano impostazioni di soglia intelligenti, posizionamento corretto della telecamera e regole di temporizzazione personalizzate. Se hai bisogno di aiuto per configurare questi parametri per il tuo sito specifico, contattami all'indirizzo sales05@.com e ti guiderò.
1. Software di gestione video comunemente utilizzato per configurare e monitorare le regole di rilevamento AI. ︎↩︎ 2. Parametro che imposta quante persone devono riunirsi prima di attivare un avviso. ︎↩︎ 3. Standard di compressione video che riduce la larghezza di banda preservando la qualità per l'analisi. ︎↩︎ 4. Tecnologia del sensore della telecamera per condizioni di scarsa illuminazione che consente l'imaging a colori in condizioni di quasi oscurità per un migliore rilevamento AI. ︎↩︎ 5. Funzione che attiva i LED IR solo al crepuscolo per risparmiare energia sulle telecamere a energia solare. ︎↩︎ 6. Metodo utilizzato dall'IA per comprendere se il movimento di una persona è normale (camminare verso l'auto) o sospetto (aggirarsi). ︎↩︎ 7. Integrazione programmabile che consente alla telecamera di inviare avvisi a una piattaforma personalizzata o a un sistema PSIM. ︎↩︎ 8. Software di gestione delle informazioni sulla sicurezza fisica che unifica più sottosistemi di sicurezza. ︎↩︎