...

É possível transmitir metadados de "Humano/Veículo" identificados para um VMS de backend?

19 de maio de 2026 Por Han

Já vi muitos integradores perderem horas vasculhando filmagens brutas. Eles tinham câmeras inteligentes, mas nenhuma maneira de pesquisar por “pessoa” ou “carro” no backend. Isso é um problema real.

Sim, metadados identificados de humanos e veículos podem ser transmitidos em tempo real para um VMS de backend. A câmera envia dados XML estruturados através de um fluxo de metadados RTP separado, ao lado do vídeo. Isso permite que sua plataforma VMS realize pesquisas inteligentes, filtre por tipo de objeto e acione ações automatizadas — tudo sem reprocessar o vídeo no lado do servidor.

Transmissão de metadados de humanos e veículos para VMS de backend Transmissão de metadados de humanos e veículos para VMS de backend

Abaixo, detalho exatamente como isso funciona — desde os padrões de protocolo até os custos de largura de banda em 4G. Se você está planejando uma implantação distribuída com dezenas ou centenas de locais remotos, cada detalhe aqui importa. Vamos lá.

A Câmera Suporta o Perfil M do ONVIF para Comunicar Metadados de IA ao Meu VMS?

Muitos integradores assumem que, se uma câmera diz “compatível com ONVIF”, todos os recursos inteligentes funcionarão em qualquer VMS. Aprendi da maneira mais difícil que isso não é verdade. O perfil errado significa que seus metadados não vão a lugar nenhum.

O padrão mais amplamente adotado para transmitir metadados de análise de IA de uma câmera para um VMS de terceiros é ONVIF Perfil T1, não o Perfil M. O Perfil T define como os metadados de análise — incluindo classificações de humanos e veículos — são empacotados e transmitidos via RTP. O Perfil M é mais novo e ainda tem suporte limitado de VMS em 2024. Para implantações confiáveis entre marcas hoje, o Perfil T é sua aposta mais segura.

Comunicação de metadados do Perfil T do ONVIF com VMS Comunicação de metadados do Perfil T do ONVIF com VMS

Por que o Perfil T, Não o Perfil M?

Deixe-me esclarecer uma confusão comum. O ONVIF tem vários perfis. Cada um cobre um conjunto diferente de recursos. Aqui está uma comparação rápida:

Perfil ONVIF Propósito Principal Suporte a Metadados Adoção por VMS (2024)
Perfil S Streaming básico de vídeo Sem metadados de análise Muito alto
Perfil T Vídeo avançado + análise Sim — fluxo completo de metadados XML Alta
Perfil M Serviços de análise + metadados Sim — esquema mais rico Baixo a moderado

O Perfil M foi projetado especificamente para metadados e análise. No papel, é a melhor escolha. Mas, na prática, a maioria das principais plataformas VMS — Milestone, Genetec, Avigilon — tem suporte maduro para o Perfil T. A adoção do Perfil M está crescendo, mas ainda não chegou lá.

Portanto, se você estiver implantando câmeras em vários locais e conectando-as a um VMS de terceiros, sempre recomendo confirmar primeiro o suporte ao Perfil T.

Como o Perfil T Lida com Metadados?

O processo é simples:

  1. Processamento de IA na borda. O chip SoC integrado da câmera executa o modelo de IA. Ele detecta humanos, veículos e outros objetos em tempo real.
  2. Empacotamento XML. Os resultados da detecção — coordenadas da caixa delimitadora, classe do objeto (pessoa, carro, caminhão), pontuação de confiança — são encapsulados em um formato XML estruturado.
  3. Fluxo de metadados RTP. Esses dados XML são enviados como um fluxo RTP separado. Ele é executado em paralelo com seu fluxo de vídeo H.265 ou H.264.
  4. Sincronização de carimbo de data/hora. O Perfil T garante que os carimbos de data/hora dos metadados correspondam exatamente aos carimbos de data/hora do vídeo. Ao reproduzir uma gravação em seu VMS, as caixas delimitadoras se alinham perfeitamente com o quadro visual. Sem desvio. Sem atraso.

E os SDKs Privados?

Aqui está algo que vejo muito em campo. Se você estiver usando uma câmera de uma marca e um NVR ou VMS de outra marca, poderá encontrar um obstáculo. Muitos fabricantes — especialmente as grandes marcas chinesas — usam por padrão seus próprios protocolos de SDK privados. Suas câmeras se comunicam perfeitamente com seus próprios NVRs. Mas quando você tenta conectá-las ao Milestone ou ao Blue Iris, os metadados não são transmitidos.

A correção é simples, mas fácil de perder. Você precisa acessar as configurações de rede da câmera e habilitar manualmente o “Serviço de Análise ONVIF” opção. Em algumas versões de firmware, isso está desativado por padrão. Sem ele, a câmera transmitirá vídeo via ONVIF normalmente, mas o canal de metadados permanecerá fechado.

Na Loyalty-Secu, ativamos isso por padrão em todas as nossas câmeras PTZ. Nossa equipe de engenharia testa cada versão de firmware em conformidade com o Perfil T antes do envio. Se você estiver trabalhando com um VMS como Milestone XProtect ou Genetec Security Center, o fluxo de metadados deverá aparecer automaticamente assim que você adicionar a câmera usando o driver ONVIF.

Um Checklist Rápido Antes de Implantar

Antes de enviar câmeras para um local remoto, verifique estas três coisas:

  • O firmware da câmera suporta o Perfil T do ONVIF (não apenas o Perfil S).
  • A versão do driver do VMS é recente o suficiente para analisar metadados de análise.
  • A opção “Serviço de Análise ONVIF” está ativada na interface web da câmera.

Isso economiza uma visita técnica. E para locais no interior do Texas ou no norte do Canadá, uma visita técnica pode custar mais do que a própria câmera.

Meu VMS Pode Pesquisar os Metadados para Filtrar Gravações por Tipo de Veículo ou Aparência Humana?

Esta é a pergunta que mais ouço de integradores de sistemas. Eles não querem apenas alertas ao vivo. Eles querem voltar para terça-feira passada às 3 da manhã e encontrar todos os clipes que contêm uma caminhonete. Sem a pesquisa de metadados, isso significa assistir horas de filmagem manualmente.

Sim, se o seu VMS suportar a ingestão de metadados de análise, você poderá filtrar filmagens gravadas por tipo de objeto — como humano, carro, caminhão ou veículo de duas rodas. A câmera transmite tags de classificação dentro do fluxo de metadados. Seu VMS indexa essas tags e permite que você execute pesquisas filtradas em qualquer intervalo de tempo. Isso transforma horas de revisão manual em uma consulta de 30 segundos.

VMS pesquisa de metadados por tipo de veículo ou humano VMS pesquisa de metadados por tipo de veículo ou humano

Quais Campos de Metadados a Câmera Pode Enviar?

O fluxo de metadados carrega mais do que apenas “pessoa detectada”. Veja o que uma câmera de IA bem configurada pode transmitir para o seu backend:

Campo de Metadados Descrição Valor de Exemplo
Caixa Delimitadora Coordenadas de pixel do objeto detectado x:320, y:180, w:120, h:200
Classe do Objeto4 Tipo de objeto detectado Humano, Carro, Caminhão, Bicicleta
Pontuação de Confiança5 Quão certo o modelo de IA está 0.92 (92%)
Direção de Viagem Para onde o objeto está se movendo Norte, Sudeste
Tag de Comportamento Rótulo de evento baseado em regras Armadilha de arame cruzada7, Vadiagem8
Atributos Estendidos6 Detalhes avançados de aparência Cor do veículo: branco, Capacete: sim

Como Funciona a Indexação do VMS?

Quando o VMS recebe o fluxo de metadados, ele não apenas o exibe e o descarta. Um bom VMS irá indexar cada evento de metadados na linha do tempo do vídeo. Pense nisso como um mecanismo de busca para suas filmagens de vigilância.

Veja como o fluxo funciona na prática:

  1. A câmera detecta um caminhão branco entrando em uma zona restrita às 2h47.
  2. Ele envia um pacote de metadados XML com: classe do objeto = “caminhão”, cor = “branco”, comportamento = “intrusão”, timestamp = 02:47:13.
  3. O VMS armazena esses metadados junto com o segmento de vídeo correspondente.
  4. Mais tarde, um operador pesquisa: “Mostre-me todos os caminhões entre meia-noite e 6 da manhã na Câmera 7.”
  5. O VMS retorna uma lista de clipes com registro de data e hora. Cada clipe começa alguns segundos antes do evento de detecção.

Isso é o que a indústria chama de Pesquisa Inteligente3 ou Pesquisa Forense. Sem isso, seus operadores ficam apenas olhando para as telas. Com isso, eles se tornam investigadores.

E se o meu VMS não suportar pesquisa de metadados?

Nem todas as plataformas VMS lidam com metadados igualmente. Alguns NVRs de baixo custo podem receber o fluxo de metadados e exibir caixas delimitadoras ao vivo na tela. Mas eles não indexam os dados. Assim, você obtém a sobreposição ao vivo, mas nenhuma capacidade de pesquisa.

Se pesquisa forense2 é importante para o seu projeto — e para a maioria das implantações comerciais, é — você precisa confirmar que seu VMS suporta pesquisa de gravação baseada em metadados. Milestone XProtect Corporate e Genetec Security Center suportam isso. Blue Iris tem suporte mais limitado, mas ainda pode acionar gravações com base em eventos de metadados.

Para nossos clientes na Loyalty-Secu, sempre recomendo testar toda a cadeia antes de uma grande implantação. Podemos enviar uma unidade de amostra, você a conecta ao seu VMS no laboratório e verifica se a pesquisa funciona como você espera. Isso evita surpresas no local.

Uma nota sobre atributos estendidos

Atributos estendidos como cor do veículo ou tipo de roupa dependem muito do modelo de IA em execução na câmera. Nem toda câmera suporta isso. Nossas câmeras PTZ de rastreamento AI de lente dupla executam um modelo mais avançado que pode distinguir entre sedans, SUVs e caminhões. Mas uma câmera bullet básica com IA de nível de entrada pode apenas dizer “veículo” sem mais detalhes.

Sempre pergunte ao seu fornecedor: Quais classes de objetos específicas o seu modelo de IA produz? Não presuma. Obtenha a lista por escrito. Se a folha de especificações disser “Detecção Humana/Veículo”, pergunte se isso significa duas classes ou dez.

Os Metadados São Transmitidos como uma Sobreposição XML ou um Fluxo de Dados Separado de Alta Velocidade?

Tive clientes que confundiram duas coisas muito diferentes: a sobreposição visual que você vê na tela (as caixas coloridas desenhadas no vídeo) e o fluxo de dados estruturados real. Eles parecem semelhantes em um monitor, mas funcionam de maneiras completamente diferentes. Errar nisso pode causar problemas reais.

Os metadados são transmitidos como um fluxo de dados RTP separado, não como uma sobreposição visual gravada. Os metadados estruturados em XML viajam em seu próprio canal ao lado do fluxo de vídeo. Isso significa que o VMS recebe dados brutos e legíveis por máquina que ele pode indexar, pesquisar e agir — em vez de apenas pixels pintados na imagem.

Comparação de fluxo de metadados XML vs. sobreposição de vídeo Comparação de fluxo de metadados XML vs. sobreposição de vídeo

Por que essa distinção é importante

Deixe-me explicar por que isso não é apenas um detalhe técnico. Tem consequências reais para o seu projeto.

Se as caixas delimitadoras estiverem gravadas no vídeo (às vezes chamadas de “sobreposição OSD” ou “sobreposição de codec inteligente”), elas se tornam parte da imagem. Você pode vê-las durante a reprodução. Mas seu VMS não consegue lê-las. São apenas pixels coloridos. O VMS não tem ideia de que uma caixa na tela significa “caminhão”. Você perde toda a capacidade de pesquisa. Você perde toda a automação. Você volta a assistir às filmagens com seus próprios olhos.

Se os metadados forem enviados como um fluxo RTP separado, o VMS recebe dados estruturados que ele pode realmente usar. Ele pode:

  • Indexar eventos para pesquisa forense.
  • Acionar alarmes ou notificações com base no tipo de objeto.
  • Encaminhar metadados para uma plataforma de comando central para análise multissite.
  • Gerar relatórios: “A Câmera 12 detectou 347 veículos e 89 pedestres na semana passada.”

Como os Dois Fluxos Viajam Juntos

Aqui está uma visão simplificada do que sai da câmera:

Fluxo Protocolo Conteúdo Largura de banda
Fluxo de Vídeo RTP sobre RTSP (H.265) Quadros de vídeo compactados 2–8 Mbps (varia)
Fluxo de Metadados RTP sobre RTSP (XML) Dados do objeto, coordenadas, classes 10–50 Kbps
Fluxo de Áudio (opcional) RTP sobre RTSP (AAC/G.711) Áudio do microfone 32–128 Kbps

Observe a diferença de largura de banda. O fluxo de metadados é minúsculo em comparação com o vídeo. Isso é crítico para implantações 4G, que abordarei na próxima seção.

Configurando a Saída de Metadados

Na maioria das câmeras de nível profissional, você pode configurar a saída de metadados independentemente do fluxo de vídeo. Aqui estão as principais configurações a serem observadas:

Habilitar Metadados de Análise

Na interface web da câmera, encontre a seção “Evento Inteligente” ou “Análise de IA”. Deve haver um controle deslizante para “Saída de Metadados” ou “Fluxo de Análise”. Ligue-o.

Escolher o Tipo de Fluxo

Algumas câmeras permitem que você escolha entre:

  • Fluxo de metadados ONVIF — padrão, interoperável, funciona com VMS de terceiros.
  • Metadados do SDK privado — funciona apenas com o NVR ou software da mesma marca.

Para projetos entre marcas, escolha sempre ONVIF.

Desativar Sobreposições Gravadas (Se Necessário)

Se você estiver enviando metadados para um VMS que desenha suas próprias caixas delimitadoras, talvez queira desativar a sobreposição visual integrada da câmera. Caso contrário, você verá caixas duplas — uma da câmera e uma do VMS. Isso parece confuso e desorienta os operadores.

Na Loyalty-Secu, nosso firmware oferece controles separados para “Desenhar no Fluxo” e “Enviar Metadados”. Você pode ativar um, o outro ou ambos. Essa flexibilidade é importante ao integrar com diferentes plataformas VMS em diferentes projetos.

Casos de Borda a Observar

Existe um cenário em que as sobreposições gravadas são realmente úteis: quando você está gravando diretamente em um cartão SD dentro da câmera, sem nenhum VMS. Nesse caso, a sobreposição visual é a única maneira de ver os resultados da detecção durante a reprodução. Para locais solares fora da rede, onde o link 4G é pouco confiável, isso pode servir como backup. A câmera grava localmente com caixas delimitadoras visíveis e, quando o link retorna, ela carrega o fluxo de metadados para o VMS para indexação.

Quanta Largura de Banda 4G Adicional o Fluxo Contínuo de Metadados Consome por Hora?

É aqui que a matemática se torna real. Eu converso com integradores toda semana que estão implantando câmeras 4G alimentadas por energia solar em locais sem fibra, sem Wi-Fi e com planos de dados celulares caros. Cada megabyte conta. Eles querem saber: o fluxo de metadados vai estourar minha conta de dados?

Um fluxo contínuo de metadados normalmente consome entre 10 Kbps e 50 Kbps, o que se traduz em aproximadamente 4,5 MB a 22,5 MB por hora. Comparado a um fluxo de vídeo H.265 de 2–4 Mbps (que usa 900 MB a 1,8 GB por hora), o fluxo de metadados adiciona menos de 2% ao seu uso total de dados. É extremamente leve e não deve ser uma preocupação para orçamentos de dados 4G.

Consumo de dados 4G - Largura de banda do fluxo de metadados Consumo de dados 4G - Largura de banda do fluxo de metadados

Detalhando os Números

Deixe-me colocar isso em uma tabela para que você possa ver a comparação claramente:

Tipo de Dados Taxa de bits Dados por Hora Dados por 24 Horas
Vídeo H.265 (1080p, qualidade média) 2 Mbps ~900 MB ~21,6 GB
Vídeo H.265 (4MP, alta qualidade) 4 Mbps ~1,8 GB ~43,2 GB
Fluxo de Metadados (baixa atividade) 10 Kbps ~4,5 MB ~108 MB
Fluxo de Metadados (alta atividade) 50 Kbps ~22,5 MB ~540 MB
Fluxo de Áudio (G.711) 64 Kbps ~28,8 MB ~691 MB

O fluxo de metadados é um erro de arredondamento em comparação com o vídeo. Mesmo a 50 Kbps — o que significaria uma cena muito movimentada com muitos objetos detectados — você está olhando para cerca de meio gigabyte por dia. Isso não é nada.

A Economia Real: Streaming Orientado por Eventos

É aqui que os metadados se tornam uma ferramenta de economia, não apenas um custo. Muitos de nossos clientes configuram seus sistemas assim:

  1. Modo padrão: A câmera transmite apenas um subfluxo de baixa taxa de bits (resolução CIF ou D1, ~256 Kbps) mais o fluxo de metadados para o VMS. Total: cerca de 300 Kbps.
  2. Gatilho de evento: Quando a IA detecta um humano ou veículo, a câmera muda para o fluxo principal de alta definição (1080p ou 4MP) por 30–60 segundos.
  3. Retornar ao padrão: Após o término do evento, ele volta para o fluxo de baixa taxa de bits.

Essa abordagem pode reduzir seu uso mensal de dados 4G em 80% a 90% em comparação com o streaming Full HD 24 horas por dia, 7 dias por semana. O fluxo de metadados é o que torna isso possível. Sem ele, o VMS não saberia quando solicitar o fluxo de alta definição.

Considerações sobre MTU e Tamanho do Pacote em 4G

Existe um detalhe técnico que confunde as pessoas em redes celulares. Os pacotes XML de metadados podem variar de tamanho. Em uma cena tranquila com uma pessoa, o pacote é pequeno — algumas centenas de bytes. Mas em uma cena lotada com 30 ou 40 objetos detectados, a carga útil XML pode exceder 1400 bytes.

A maioria das redes 4G tem uma MTU (Unidade Máxima de Transmissão) de cerca de 1400 a 1500 bytes. Se um pacote de metadados exceder a MTU, ele é fragmentado. Às vezes, pacotes fragmentados são descartados pelo gateway celular. O resultado: seu VMS mostra caixas delimitadoras que piscam ou desaparecem aleatoriamente.

A correção é simples. Nas configurações de rede da câmera, defina a MTU para 1380 bytes. Isso dá espaço suficiente para a sobrecarga do 4G. Na Loyalty-Secu, definimos isso como padrão em todos os nossos modelos de câmeras PTZ 4G. Mas se você estiver usando outra marca, verifique essa configuração manualmente. Leva 10 segundos e pode economizar uma sessão de solução de problemas muito frustrante no local.

Otimizando para Locais Alimentados por Energia Solar

Para implantações alimentadas por energia solar, a eficiência de dados também afeta diretamente seu orçamento de energia. Transmitir menos dados significa que o modem 4G consome menos energia. Menos consumo de energia significa um painel solar e uma bateria menores. Esse efeito cascata é o motivo pelo qual projetamos nossos sistemas PTZ 4G em torno do streaming acionado por eventos desde o início.

Uma configuração típica para um canteiro de obras remoto ou fazenda:

  • Diurno (12 horas): Sub-fluxo + apenas metadados. Dados estimados: ~200 MB. Energia estimada para modem 4G: ~1,5W em média.
  • Noturno (12 horas): Mesma configuração, mas com menos eventos. Dados estimados: ~100 MB.
  • Explosões de eventos: Talvez 20 eventos por dia, cada um acionando 60 segundos de streaming HD. Dados estimados: ~600 MB.
  • Total diário: Menos de 1 GB. Gerenciável na maioria dos planos de dados 4G.

Este é o tipo de design de sistema que torna o monitoramento remoto prático — não apenas tecnicamente possível, mas economicamente viável.

Conclusão

Metadados de humanos e veículos fluem da câmera para o seu VMS como um fluxo XML leve e pesquisável. Custa quase nada em largura de banda, mas transforma a forma como você pesquisa, automatiza e gerencia a vigilância em sites distribuídos.


1. Saiba mais sobre o padrão ONVIF Perfil T para streaming avançado de metadados de vídeo e análise. ︎↩︎ 2. Descubra como os recursos de pesquisa forense em plataformas VMS permitem a recuperação rápida de eventos gravados com base em metadados. ︎↩︎ 3. Explore como a Pesquisa Inteligente em software VMS usa metadados para filtrar e localizar clipes de vídeo específicos. ︎↩︎ 4. Revise classes de objetos comuns usadas na detecção de objetos baseada em IA, como humano, carro, caminhão e bicicleta. ︎↩︎ 5. Saiba mais sobre pontuações de confiança em modelos de aprendizado de máquina e como elas indicam a certeza da previsão. ︎↩︎ 6. Entenda atributos de metadados estendidos, como cor do veículo, tipo de roupa e detecção de capacete. ︎↩︎ 7. Descubra como as análises de tripwire criam limites virtuais que acionam eventos quando cruzados. ︎↩︎ 8. Leia sobre detecção de vadiagem como uma regra comum de comportamento de análise de vídeo. ︎↩︎

Pronto para proteger seu projeto?

Obtenha especificações técnicas completas, preços de atacado e uma solução personalizada para suas necessidades específicas de PTZ e Solar.

Resposta em 24 horas

Precisa de uma solução solar sob medida para seu projeto?

Consulte nossos guias técnicos revisados por especialistas ou solicite um plano de configuração personalizado. Nossa equipe de engenharia o ajuda a encontrar o kit de energia solar perfeito para os requisitos específicos de sua câmera PTZ.