...

Il profilo T supporta la trasmissione di metadati con codifica H.265?

18 maggio 2026 Da Han

Ho visto troppi integratori perdere ore a eseguire il debug di problemi relativi ai metadati, solo per scoprire che il profilo della loro telecamera era il vero problema.

Sì, ONVIF Profilo T1 supporta pienamente la trasmissione di metadati con codifica H.265 (HEVC). Il profilo T è stato progettato specificamente per gestire flussi video H.264 e H.265 insieme a metadati strutturati, inclusi dati di analisi AI, eventi di allarme e risultati di rilevamento oggetti, il tutto sincronizzato con il feed video.

ONVIF Profile T H.265 trasmissione metadati telecamera PTZ ONVIF Profile T H.265 trasmissione metadati telecamera PTZ

Se stai costruendo un sistema che si basa su H.265 per il risparmio di larghezza di banda e necessita ancora che i dati degli eventi AI fluiscano al tuo VMS, questo articolo illustra esattamente come il profilo T gestisce tale situazione. Esaminerò preoccupazioni reali, dalla consegna delle bounding box all'overhead di elaborazione, in modo che tu possa fare la scelta giusta per la tua prossima implementazione.

Posso inviare bounding box di rilevamento umano AI tramite H.265 tramite ONVIF?

Questa è la prima domanda che ricevo dagli integratori che desiderano funzionalità AI ma necessitano anche della compressione H.265. Temono che i due non vadano d'accordo.

Puoi assolutamente inviare bounding box di rilevamento umano AI tramite H.265 tramite ONVIF Profile T. I metadati, inclusi tipo di oggetto, coordinate e punteggi di confidenza, viaggiano in un flusso RTP separato all'interno della stessa sessione RTSP, quindi non interferiscono affatto con la codifica video H.265.

Metadati bounding box AI H.265 ONVIF Profile T Metadati bounding box AI H.265 ONVIF Profile T

Come viaggiano effettivamente i metadati

Lascia che ti spieghi cosa succede sotto il cofano. Quando la tua telecamera rileva una persona, fa due cose contemporaneamente. In primo luogo, codifica il frame video in H.265. In secondo luogo, genera un pacchetto di metadati basato su XML che descrive ciò che ha trovato: un oggetto “Persona”, le coordinate della bounding box e un timestamp.

Questi due pezzi di informazione viaggiano attraverso canali diversi, ma condividono la stessa sessione RTSP2. Pensala come un'autostrada a due corsie. Il video prende una corsia. I metadati prendono l'altra. Arrivano alla stessa destinazione nello stesso momento.

La struttura XML dietro la Bounding Box

Il Servizio di Analisi ONVIF3 definisce uno schema XML chiaro per i risultati di rilevamento. Ecco una visualizzazione semplificata di come appare un singolo evento di rilevamento:

Campo Valore di esempio Descrizione
Tipo di Oggetto Persona Cosa ha rilevato l'IA
Rettangolo di delimitazione X 0.35 Posizione orizzontale (normalizzata 0–1)
Rettangolo di delimitazione Y 0.22 Posizione verticale (normalizzata 0–1)
Larghezza 0.12 Larghezza del riquadro (normalizzata)
Altezza 0.30 Altezza del riquadro (normalizzata)
14. dell'ultima connessione di rete riuscita 2025-01-15T14:32:07Z Sincronizzazione temporale a livello di frame
Fiducia 0.92 Punteggio di confidenza del rilevamento

Il tuo VMS legge questi dati XML e disegna il riquadro sullo schermo. La telecamera non "brucia" il riquadro nel video. Questo è importante. Significa che puoi attivare o disattivare i riquadri a livello software. Puoi anche cercare per tipo di oggetto in seguito, senza rielaborare il video.

Perché questo è importante per le implementazioni solari 4G

Nei nostri sistemi PTZ solari 4G di Loyalty-Secu, la larghezza di banda è preziosa. H.265 riduce già il bitrate circa della metà rispetto a H.264. Lo stream di metadati aggiunge pochissimo — solitamente tra 10kbps e 50kbps per alcuni oggetti rilevati. In questo modo, l'intelligenza AI viene consegnata al tuo VMS senza un aumento significativo dell'utilizzo dei dati.

Ma ecco un dettaglio che molti trascurano. Se la tua telecamera sta tracciando 20 o 30 oggetti contemporaneamente — ad esempio, un incrocio trafficato — lo stream di metadati aumenta. In questi casi, consiglio di limitare il numero massimo di oggetti tracciati nelle impostazioni del firmware per mantenere la larghezza di banda totale prevedibile su un collegamento 4G.

Il mio VMS di terze parti sarà in grado di cercare nei metadati H.265 eventi specifici?

Ho avuto clienti che hanno acquistato telecamere con ottime funzionalità AI, solo per scoprire che il loro VMS non era in grado di leggere i metadati. Questa è una lezione dolorosa e costosa.

Il tuo VMS di terze parti può cercare metadati H.265 per eventi specifici — ma solo se il VMS supporta anche ONVIF Profile T. Se il tuo VMS supporta solo Profile S, riceverà lo stream video ma ignorerà completamente i metadati, lasciandoti senza capacità di ricerca intelligente.

VMS ricerca intelligente metadati H.265 ONVIF Profile T VMS ricerca intelligente metadati H.265 ONVIF Profile T

Il controllo di compatibilità del profilo T

Questo è il passaggio più importante prima di impegnarsi in un progetto. Devi verificare entrambe le estremità della catena. La telecamera deve supportare Profile T. Anche il VMS deve supportare Profile T. Se manca uno dei due lati, il collegamento dei metadati si interrompe.

Ecco una rapida matrice di compatibilità che utilizzo quando consiglio i nostri partner B2B:

Piattaforma VMS Supporto Profilo S Supporto Profilo T Ricerca intelligente tramite metadati
Milestone XProtect4 ✅ (2020+)
Genetec Security Center5 ✅ (2021+)
Iris blu ⚠️ Limitato ❌ Nativo (richiede plugin)
Nx Witness (Network Optix)6 ✅ (v5.0+)
Digifort ✅ (v7.4+)
iSpy / Agent DVR

Se il tuo VMS è nella colonna “limitato” o “no”, hai due opzioni. Puoi aggiornare il software VMS. Oppure puoi utilizzare l'interfaccia web integrata della telecamera per accedere direttamente agli eventi AI: la maggior parte delle telecamere PTZ professionali, comprese le nostre, offre questa opzione come fallback.

Come appare realmente la “Ricerca Intelligente”

Quando i metadati fluiscono correttamente, il tuo VMS può fare cose come queste:

  • Mostrami tutte le rilevazioni di “Persona” tra le 14:00 e le 16:00.
  • Mostrami tutte le rilevazioni di “Veicolo” nella Zona B.
  • Mostrami tutti gli eventi in cui una persona è entrata in un'area riservata.

Il VMS non ha bisogno di rianalizzare il video. Si limita a interrogare i metadati memorizzati. Questo è molto più veloce. Su un sistema con 50 telecamere che registrano 24 ore su 24, 7 giorni su 7, la differenza tra la rianalisi del video e l'interrogazione dei metadati è la differenza tra ore e secondi.

Una insidia del mondo reale: la versione del firmware è importante

Voglio segnalare qualcosa che coglie di sorpresa le persone. Anche se un modello di telecamera indica “Profile T” sulla scheda tecnica, la versione effettiva del firmware è importante. Le prime versioni del firmware a volte avevano implementazioni incomplete del Profile T. I campi dei metadati potrebbero essere parzialmente popolati o la sincronizzazione dell'ora potrebbe andare alla deriva.

Noi di Loyalty-Secu eseguiamo un test di validazione completo del Profile T su ogni rilascio di firmware prima che venga spedito. Verifichiamo che ogni campo XML sia popolato correttamente, che gli orari siano allineati entro un fotogramma e che i metadati sopravvivano alla perdita di pacchetti su una connessione 4G. Se stai valutando una telecamera, nostra o di terzi, richiedi un rapporto di test di conformità al Profile T. Ti risparmierà molti problemi in seguito.

Il flusso di metadati è perfettamente sincronizzato con il video 4K ad alta risoluzione?

I problemi di sincronizzazione sono un incubo. Ho visto casi in cui il riquadro di delimitazione appare due secondi dopo che la persona è già uscita dall'inquadratura. Questo rende inutile l'intera funzionalità AI.

Secondo ONVIF Profile T, lo stream di metadati è sincronizzato con il video H.265 utilizzando timestamp NTP condivisi a livello di fotogramma. Ciò significa che i dati del riquadro di delimitazione e il fotogramma video corrispondente portano lo stesso riferimento temporale, garantendo un allineamento preciso anche su reti instabili come il 4G LTE.

sincronizzazione metadati stream video 4K H.265 sincronizzazione metadati stream video 4K H.265

Come funziona la sincronizzazione a livello di protocollo

La chiave della sincronizzazione è il timestamp RTP. Sia lo stream video che lo stream di metadati utilizzano RTP come livello di trasporto. Ogni pacchetto RTP contiene un timestamp derivato dall'orologio interno della telecamera. Quando la telecamera genera un fotogramma video e un pacchetto di metadati per lo stesso momento, entrambi i pacchetti ottengono lo stesso valore di timestamp.

All'estremità ricevente, il VMS abbina questi timestamp. Sa che il pacchetto di metadati #4521 appartiene al fotogramma video #4521. Quindi disegna il riquadro di delimitazione sul fotogramma corretto.

Cosa può interrompere la sincronizzazione?

In un ambiente di laboratorio perfetto, la sincronizzazione è impeccabile. Ma sul campo, diverse cose possono causare deriva:

  • Configurazione errata NTP. Se l'orologio della telecamera non è sincronizzato con un server NTP affidabile, i timestamp possono subire uno scostamento di ore o giorni. Configurare sempre NTP, anche nelle implementazioni 4G. La maggior parte delle reti cellulari fornisce accesso NTP.
  • Jitter di rete. Su un collegamento 4G, i pacchetti possono arrivare fuori ordine. Il VMS necessita di un buffer di jitter7 per riordinarli. Se il buffer è troppo piccolo, i metadati e il video possono apparire non sincronizzati sul display.
  • Carico elevato della CPU. Se il processore della telecamera è sovraccarico, ad esempio eseguendo più algoritmi AI a risoluzione 4K, la generazione dei metadati può rimanere indietro rispetto alla pipeline di codifica video.

Consigli pratici per sistemi PTZ solari 4G

Per i nostri clienti che implementano telecamere PTZ solari 4G in luoghi remoti, consiglio sempre tre cose per proteggere la qualità della sincronizzazione:

Innanzitutto, impostare il server NTP della telecamera su un pool pubblico come pool.ntp.org8 o l'indirizzo NTP del tuo operatore. Questo mantiene l'orologio accurato.

In secondo luogo, impostare il buffer di jitter del VMS ad almeno 200 ms. Ciò fornisce al sistema spazio sufficiente per riordinare i pacchetti senza ritardi visibili.

In terzo luogo, se si utilizza 4K a 25 fps con più regole AI attive, considerare la possibilità di ridurre a 15 fps per lo stream di analisi. Lo stream video può rimanere a 25 fps. Ciò riduce il carico della CPU e mantiene la pipeline dei metadati in esecuzione senza problemi.

Il fattore 4K

La risoluzione 4K rende la sincronizzazione più impegnativa perché il volume dei dati è molto maggiore. Un singolo frame 4K H.265 può essere di 200 KB o più. Il pacchetto di metadati per quel frame potrebbe essere di soli 500 byte. Se la rete perde il pacchetto video e il VMS richiede una ritrasmissione, il pacchetto di metadati è già in attesa nel buffer. Il VMS deve conservare tali metadati fino a quando il video non si aggiorna.

Ecco perché dico sempre ai nostri partner: testate la vostra intera pipeline end-to-end prima di distribuirla. Configurate la telecamera, connettetela tramite 4G, trasmettete in streaming 4K H.265 con metadati abilitati e osservate l'output sul vostro VMS per almeno 24 ore. Se la sincronizzazione regge per un giorno intero, reggerà in produzione.

L'utilizzo dei metadati H.265 consuma più potenza di elaborazione rispetto a H.264?

Ogni integratore con cui parlo chiede informazioni sull'overhead di elaborazione. Vogliono AI e H.265, ma non vogliono che la telecamera si surriscaldi o si blocchi sul campo.

La codifica H.265 richiede più potenza di elaborazione rispetto a H.264, tipicamente dal 30% al 50% di carico CPU in più per la stessa risoluzione e frame rate. Tuttavia, la generazione dei metadati in sé aggiunge un overhead minimo indipendentemente dal codec. Il vero costo di elaborazione deriva dall'analisi AI, non dall'impacchettamento dei risultati nei metadati ONVIF.

H.265 vs H.264 potenza di elaborazione overhead metadati H.265 vs H.264 potenza di elaborazione overhead metadati

Suddivisione del carico di elaborazione

Lasciatemi separare i tre compiti principali che avvengono all'interno della telecamera:

  1. Codifica video — conversione dei dati grezzi del sensore in H.264 o H.265 compressi.
  2. Analisi AI — esecuzione di modelli di reti neurali per rilevare persone, veicoli o altri oggetti.
  3. Impacchettamento metadati — incapsulamento dei risultati AI in XML conforme a ONVIF e invio tramite RTP.

Il compito 1 è dove H.265 costa di più di H.264. L'algoritmo HEVC è più complesso. Utilizza unità di albero di codifica più grandi, più modalità di predizione e codifica entropica più avanzata. Tutto ciò richiede più cicli di calcolo.

Il compito 2 è lo stesso, indipendentemente dal fatto che si utilizzi H.264 o H.265. Il modello AI viene eseguito sui frame video grezzi o decodificati, non sul flusso compresso.

Il compito 3 è banale. La generazione di un piccolo pacchetto XML richiede quasi nessun tempo di CPU.

Un confronto affiancato

Ecco un confronto approssimativo basato sui nostri test interni presso Loyalty-Secu, utilizzando una tipica telecamera PTZ 4K con un chipset AI integrato:

Metrico H.264 + Metadati H.265 + Metadati Differenza
Utilizzo CPU codifica video ~35% ~50% +15%
Utilizzo CPU rilevamento AI ~25% ~25% 0%
Utilizzo CPU impacchettamento metadati ~1% ~1% 0%
Utilizzo CPU totale ~61% ~76% +15%
Bitrate (4K, 25fps) ~8 Mbps ~4 Mbps -50%
Larghezza di banda dei metadati ~50 kbps ~50 kbps 0%

Il messaggio è chiaro. H.265 costa più CPU ma risparmia molta larghezza di banda. Il livello dei metadati è lo stesso in entrambi i casi.

Quando Diventa un Problema?

Per la maggior parte delle telecamere moderne con encoder hardware dedicati (come Hi3559 o SoC simili), il carico aggiuntivo di H.265 è gestito dall'encoder hardware, non dalla CPU principale. Quindi, in pratica, l'impatto sulla CPU è molto inferiore rispetto ai numeri grezzi suggeriti.

Ma i problemi possono comparire in due scenari:

  • Codifica dual-stream. Se si esegue sia uno stream principale 4K che uno sub-stream 720p, entrambi in H.265, l'encoder hardware sta facendo doppio lavoro. Aggiungi l'AI sopra e potresti raggiungere il limite.
  • Alto numero di oggetti. Se la scena ha 30+ oggetti in movimento e l'AI li sta tracciando tutti, il motore di analisi — non l'encoder — diventa il collo di bottiglia.

La mia raccomandazione per gli integratori di sistema

Se stai distribuendo in un ambiente con larghezza di banda limitata come un sito solare 4G, usa H.265 per lo stream principale e H.264 per lo sub-stream. Questo bilancia il carico di elaborazione pur offrendo risparmi di larghezza di banda sullo stream di registrazione primario. Limita il rilevamento AI agli oggetti che ti interessano veramente — solitamente persone e veicoli. Non abilitare il tracciamento di “tutti gli oggetti” a meno che tu non ne abbia veramente bisogno.

E controlla sempre la temperatura operativa della telecamera sotto pieno carico. Presso Loyalty-Secu, ogni unità viene sottoposta a un test di burn-in di 48 ore alla massima risoluzione, massima frequenza dei fotogrammi e AI completamente abilitata. Se sopravvive a quello, sopravvivrà sul campo.

Conclusione

ONVIF Profile T supporta pienamente la trasmissione di metadati H.265. Verifica che sia la tua telecamera che il VMS supportino il Profilo T, e i tuoi dati AI fluiranno in modo affidabile — anche su 4G.


1. Pagina ufficiale ONVIF per il Profilo T, che definisce il supporto per H.265 e lo streaming di metadati. ︎↩︎ 2. Specifica del Real Time Streaming Protocol (RTSP) – utilizzata per trasportare stream video e di metadati. ︎↩︎ 3. Specifica ONVIF per i servizi di analisi, che definisce lo schema XML per i metadati di rilevamento. ︎↩︎ 4. Milestone XProtect VMS – confermato il supporto per il Profilo T per la ricerca intelligente tramite metadati. ︎↩︎ 5. Genetec Security Center VMS – supporta il Profilo T per la ricerca di eventi basata su metadati. ︎↩︎ 6. Nx Witness VMS – supporta il Profilo T dalla v5.0 per la ricerca intelligente dei metadati. ︎↩︎ 7. Spiegazione di Wikipedia sul jitter buffering – essenziale per riordinare i pacchetti ritardati sui collegamenti 4G. ︎↩︎ 8. Pool NTP pubblico consigliato per la sincronizzazione dell'orologio della telecamera nelle installazioni remote. ︎↩︎

Siete pronti a mettere in sicurezza il vostro progetto?

Ottenete le specifiche tecniche complete, i prezzi all'ingrosso e una soluzione personalizzata per i vostri requisiti specifici in materia di PTZ e di energia solare.

Risposta entro 24 ore

Avete bisogno di una soluzione solare su misura per il vostro progetto?

Consultate le nostre guide tecniche, valutate da esperti, o richiedete un piano di installazione personalizzato. Il nostro team di ingegneri vi aiuta a scegliere il kit di alimentazione solare perfetto per le vostre specifiche esigenze di telecamere PTZ.