...

Comment le Hardware Watchdog assure-t-il le redémarrage automatique lors des déconnexions 4G ?

2 mai 2026 Par Han

J'ai vu trop de caméras 4G s'éteindre dans des zones reculées - et rester éteintes pendant des semaines parce que personne n'était là pour appuyer sur le bouton de réinitialisation.

Un chien de garde matériel est une puce de temporisation indépendante située à l'intérieur de la caméra. Il surveille le signal de battement de cœur du système. Si le processeur principal ne répond plus - en raison d'un blocage du module 4G, d'un plantage du micrologiciel ou d'un débordement de la mémoire - le chien de garde coupe l'alimentation physique et force un redémarrage complet. Aucun humain n'est nécessaire. Aucun roulement de camion n'est nécessaire.

Hardware Watchdog 4G PTZ camera auto reboot system Hardware Watchdog 4G PTZ camera auto reboot system

Ci-dessous, je détaille étape par étape le fonctionnement de ce mécanisme. J'aborde également la logique de vérification intelligente des liens, la journalisation du redémarrage et la temporisation qui empêche les boucles de redémarrage sans fin. Si vous déployez des caméras PTZ 4G dans des endroits où une seule visite sur site coûte plus cher que la caméra elle-même, cet article est fait pour vous.

Le Watchdog peut-il interroger un DNS public (comme 8.8.8.8) pour détecter une panne d'Internet ?

J'avais l'habitude de penser que le Watchdog matériel s'occupait de tout tout seul - y compris de vérifier si l'internet était toujours en service. Je me trompais.

Le Watchdog matériel lui-même ne fait pas de ping. Il se contente de surveiller le battement de cœur du processeur. Un service logiciel distinct - le script de surveillance des liens - effectue les tests de ping vers des serveurs DNS publics tels que 8.8.8.8 ou la passerelle de l'opérateur. Si les pings échouent à plusieurs reprises, ce script déclenche des actions de récupération. Le chien de garde est le dernier recours si tout le reste échoue.

Watchdog ping public DNS 4G link monitoring Watchdog ping public DNS 4G link monitoring

Fonctionnement du système à deux couches

Il s'agit de deux gardes qui travaillent à des heures différentes. Le premier garde est le processus de contrôle des liens. Il fonctionne au sein du système Linux et envoie des paquets ICMP ping à une adresse IP publique toutes les 30 à 60 secondes. Si le ping revient, tout va bien. Le gardien ne fait rien.

Mais si le ping échoue - par exemple, trois fois de suite - ce premier garde prend des mesures. Il peut redémarrer le service de numérotation 4G. Il peut envoyer une commande AT pour réinitialiser le module modem. Il tente d'abord une approche douce.

Le deuxième garde est le matériel Watchdog. Il se trouve sur une puce séparée. Il ne se préoccupe pas des résultats du ping. Une seule chose l'intéresse : “Le processeur principal m'a-t-il envoyé un signal de battement de cœur au cours des 180 dernières secondes ?” Si la réponse est négative, il débranche la prise d'alimentation. Redémarrage brutal. Tout redémarre à zéro.

L'importance de cette séparation

Voici pourquoi je pense que cette conception est intelligente. Le chien de garde matériel est volontairement simple. Il n'a aucune dépendance logicielle. Il ne peut pas se planter. Il ne peut pas se bloquer. Il ne fait que compter le temps. Si le processeur se bloque tellement que même le script de surveillance des liens cesse de fonctionner, le chien de garde fonctionne toujours.

Le script de surveillance des liens, quant à lui, est intelligent. Il peut faire la différence entre “le module 4G a perdu le signal pendant 10 secondes” et “toute la pile réseau est morte”. Il peut essayer des solutions douces avant de procéder à un redémarrage complet.

Qu'est-ce qui est contrôlé et quand ?

Type de contrôle Cible Fréquence Objectif
Ping ICMP 8.8.8.8 (Google DNS) Toutes les 30 à 60 secondes Confirmer l'accès public à l'internet
Ping de la passerelle Passerelle opérateur IP Toutes les 60 secondes Confirmer que la session de données 4G est active
Demande de commande AT Module 4G (interne) Toutes les 120 secondes Vérifier l'état de l'enregistrement et l'intensité du signal

Pour nos caméras PTZ chez Loyalty-Secu, je m'assure que les deux couches sont actives dès le départ. Vous ne devriez pas avoir à configurer cela vous-même. Mais si vous souhaitez modifier la cible de ping ou l'intervalle de vérification, vous pouvez le faire via l'interface web ou le fichier de configuration.

Combien de tentatives de connexion échouées déclencheront un cycle d'alimentation dur du modem ?

J'ai vu des caméras bon marché qui redémarrent après un seul ping raté. C'est une idée terrible. Un seul paquet échoué et tout le système redémarre, en plein milieu de l'enregistrement.

Dans un système correctement conçu, le rétablissement suit une approche progressive. En règle générale, trois échecs consécutifs du ping déclenchent un redémarrage progressif du service de numérotation 4G. En cas d'échec, le système met le module 4G hors tension après 5 échecs cumulés. Un redémarrage complet par le chien de garde ne se produit qu'après 10 à 15 minutes de perte totale du réseau - et non après un mauvais ping.

4G modem power cycle failed connection threshold Seuil d'échec de connexion du cycle d'alimentation du modem 4G

La stratégie de récupération à trois niveaux

Je dis toujours à mes clients - en particulier à ceux qui déploient des caméras dans les zones rurales d'Amérique du Nord - qu'une bonne caméra 4G ne devrait jamais passer directement à un redémarrage brutal. Le rétablissement doit être progressif. Voici comment je conçois l'escalade dans nos systèmes :

Niveau 1 : Réinitialisation douce de la connexion de données. Le moniteur de liaison détecte 3 échecs consécutifs de ping. Il met fin à la session de données PPP ou QMI en cours et en démarre une nouvelle. Cela permet de résoudre la plupart des déconnexions temporaires du côté de l'opérateur. La caméra reste sous tension. Aucune vidéo n'est perdue au cours de cette étape.

Niveau 2 : Cycle d'alimentation du module 4G. Si le niveau 1 ne résout pas le problème après deux tentatives, le système envoie un signal GPIO matériel pour couper l'alimentation du module 4G pendant 10 secondes, puis le rallumer. Cela oblige le modem à se réenregistrer auprès de l'opérateur cellulaire en repartant de zéro. Cela élimine tout blocage au niveau du micrologiciel à l'intérieur de la puce du modem.

Niveau 3 : Redémarrage complet du système via le chien de garde. Si le module 4G ne peut toujours pas se connecter après 15 minutes de tentatives au niveau 1 et au niveau 2, le script de surveillance de la liaison cesse délibérément d'alimenter le chien de garde matériel. La minuterie du chien de garde expire. Il coupe l'alimentation de toute la carte - CPU, mémoire, module 4G, tout - et redémarre le système à froid.

Pourquoi l'escalade graduelle permet-elle d'économiser de l'argent ?

Chaque niveau prend plus de temps mais résout un problème plus difficile. Le point essentiel est le suivant : un redémarrage complet prend de 60 à 90 secondes. Pendant ce temps, vous perdez la vidéo, vous perdez la position PTZ, vous perdez toute session d'alarme active. Un redémarrage complet n'est donc souhaitable que lorsque rien d'autre ne fonctionne.

Niveau de récupération Condition de déclenchement Mesures prises Temps d'arrêt
Niveau 1 - Réinitialisation progressive 3 échecs consécutifs de ping Redémarrer la session de données (PPP/QMI) 5-10 secondes
Niveau 2 - Cycle d'alimentation des modules Le niveau 1 échoue deux fois Coupure d'alimentation GPIO vers le module 4G 20-30 secondes
Niveau 3 - Redémarrage complet Pas de connexion pendant 15 minutes Le chien de garde coupe l'alimentation principale 60-90 secondes

J'ai testé cette séquence exacte sur nos unités PTZ solaires 4G dans des conditions réelles - zones à faible signal, fenêtres de maintenance de l'opérateur, événements d'étranglement de la carte SIM. Dans plus de 95% des cas, le problème est résolu au niveau 1 ou 2. Le redémarrage complet se produit rarement. Mais lorsqu'il se produit, il fonctionne à chaque fois.

Le Watchdog enregistrera-t-il la raison de chaque redémarrage pour mes rapports de maintenance ?

J'ai eu un jour un client au Canada qui n'arrêtait pas de me demander : “Han, l'appareil photo a encore redémarré hier soir. Est-ce l'opérateur ? Est-ce le matériel ? J'ai besoin de le savoir pour pouvoir rédiger mon rapport d'entretien”.”

Oui. Après chaque redémarrage, un système bien conçu écrit le motif du redémarrage dans le fichier EEPROM 1 - un type de mémoire non volatile qui survit aux coupures de courant. Vous pouvez consulter ce journal à distance. Il vous indiquera si le redémarrage a été causé par un dépassement du délai du chien de garde, une défaillance de la liaison 4G, une commande de redémarrage manuel ou une interruption de l'alimentation électrique.

Watchdog reboot log EEPROM maintenance report Journal de redémarrage du chien de garde Rapport de maintenance de l'EEPROM

Ce qui est enregistré et où

Dans nos caméras PTZ Loyalty-Secu, le journal de redémarrage est stocké à deux endroits. Le premier est la puce EEPROM intégrée. Il s'agit d'un petit morceau de mémoire qui conserve ses données même lorsque l'appareil est complètement éteint. Elle stocke un code court pour chaque événement de redémarrage, par exemple “WDT_TIMEOUT”, “LINK_FAIL”, “USER_REBOOT” ou “POWER_LOSS”.”

Le deuxième emplacement est le fichier journal du système sur la mémoire flash interne. Ce fichier est plus détaillé. Il comprend des horodatages, la dernière force de signal connue avant le redémarrage, le nombre de tentatives de ping qui ont échoué et le niveau de récupération qui était actif lorsque le système a abandonné.

Comment accéder aux journaux

Vous pouvez obtenir les journaux de trois façons. Premièrement, via l'interface Web de la caméra - il suffit de se connecter et d'aller sur la page de maintenance. Deuxièmement, par l'intermédiaire d'un VMS compatible ONVIF tel que Jalon 2 ou Iris bleu 3, Si la caméra prend en charge les rapports d'événements ONVIF. Troisièmement, par l'intermédiaire d'une plateforme de gestion à distance si vos caméras envoient des rapports à un serveur central via MQTT ou HTTP.

Un exemple concret de l'importance de cette question

Je vais vous raconter une histoire. Un client du Texas a déployé 20 de nos unités PTZ 4G solaires le long d'un pipeline. Au bout de trois mois, cinq caméras redémarraient chaque nuit vers 2 heures du matin. Les journaux ont montré que la cause était “LINK_FAIL” - et non “WDT_TIMEOUT”. Cela nous indiquait que l'unité centrale était en bon état. La connexion 4G baissait.

J'ai regardé plus profondément dans les journaux. L'intensité du signal juste avant chaque panne était d'environ -105 dBm - très faible. L'opérateur effectuait des travaux de maintenance sur une tour voisine entre 1 heure et 3 heures du matin chaque nuit. Une fois que nous avons su cela, le client a appelé l'opérateur, a confirmé l'horaire de maintenance et a ajusté le timing du chien de garde pour qu'il attende plus longtemps avant de redémarrer. Le problème a été résolu. Aucun déplacement de camion n'a été nécessaire.

Sans les registres, mon client aurait supposé que les caméras étaient cassées. Il aurait peut-être envoyé une équipe pour remplacer le matériel. Cela lui aurait coûté des milliers d'euros, pour un problème qui n'était même pas imputable à la caméra.

Codes de motif de redémarrage courants

Code journal Signification Action suggérée
WDT_TIMEOUT L'unité centrale s'est bloquée, le chien de garde a forcé le redémarrage. Vérifier la version du micrologiciel, la mettre à jour si nécessaire
LINK_FAIL Connexion 4G perdue pendant plus de 15 minutes Vérifier l'intensité du signal, la position de l'antenne
USER_REBOOT Redémarrage manuel via le web ou une commande Aucune action n'est nécessaire
PERTE D'ALIMENTATION L'alimentation électrique est tombée en dessous du seuil Vérifier l'état du panneau solaire et de la batterie
MODULE_RESET Le module 4G a été mis hors tension (niveau 2) Généralement auto-résolu, fréquence du moniteur

Le système dispose-t-il d'une “temporisation” pour éviter les boucles de redémarrage sans fin pendant les pannes ?

J'ai déjà vu ce scénario cauchemardesque : une tour de transmission tombe en panne pendant six heures et l'appareil photo redémarre toutes les 15 minutes, encore et encore, jusqu'à ce que la batterie soit déchargée.

Oui. Un système Watchdog correctement conçu comprend un délai d'attente. Après un certain nombre de redémarrages consécutifs (généralement 3 à 5), le système prolonge le temps d'attente entre les tentatives de redémarrage. Cela évite à la caméra de vider sa batterie lors d'une panne de courant prolongée. Certains systèmes intègrent également un système de détection de l'épuisement de la batterie qui bloque les redémarrages lorsque la tension de la batterie est trop faible.

Watchdog delay timer reboot loop prevention Retard du chien de garde prévention de la boucle de redémarrage

Pourquoi les boucles de redémarrage sont dangereuses

Chaque fois qu'une caméra 4G redémarre, le module 4G passe par une séquence gourmande en énergie. Il allume la radio. Il recherche les antennes-relais à proximité. Il tente de s'enregistrer sur le réseau. Il négocie une session IP. Tout ce processus consomme un courant élevé - parfois 2A ou plus pendant 30 à 60 secondes.

Si vous utilisez l'énergie solaire avec une batterie, ces 30 à 60 secondes de consommation élevée s'accumulent rapidement. Cinq redémarrages en une heure peuvent consommer plus d'énergie que l'appareil photo n'en utilise en fonctionnement normal pendant la même période. Si le temps est nuageux, ou si c'est l'hiver et que les heures de clarté sont courtes, la batterie s'épuise. Une fois que la tension tombe en dessous du minimum, l'appareil photo s'éteint complètement. Vous vous retrouvez alors avec un appareil photo éteint qui ne reviendra pas tant que le soleil n'aura pas suffisamment rechargé la batterie, ce qui peut prendre une journée entière.

Fonctionnement de la minuterie de recul

Le délai d'attente est simple. Après le premier redémarrage, le système attend les 15 minutes normales avant d'essayer un autre redémarrage si la connexion échoue toujours. Après le deuxième redémarrage, il attend 30 minutes. Après le troisième, il attend 60 minutes. Après le quatrième, il attend 2 heures. Cette procédure est la suivante recul exponentiel 4 maintient l'appareil photo en vie suffisamment longtemps pour qu'il puisse survivre à une longue panne.

Détection des coupures de courant : Le protecteur silencieux

Je souhaite mettre l'accent sur une caractéristique que la plupart des acheteurs ne demandent pas, mais qu'ils devraient demander. Elle s'appelle détection des baisses de tension. Avant de déclencher un redémarrage, le chien de garde vérifie la tension de la batterie. Si la tension est inférieure à un seuil de sécurité - par exemple, 11,4 V pour un système de 12 V - le chien de garde reporte le redémarrage. Il attend que la tension remonte au-dessus de 11,8 V avant d'autoriser le redémarrage.

Ce point est essentiel pour les déploiements solaires. Pendant la phase de recherche de signal du module 4G, le pic de courant peut provoquer une chute de tension. Si la batterie est déjà faible, cette chute peut faire planter le système au milieu du démarrage. La détection du brown-out permet d'éviter ce problème. La caméra reste dans un état de veille à faible consommation jusqu'à ce qu'elle ait suffisamment de jus pour effectuer un cycle de démarrage complet en toute sécurité.

Ce que vous devez demander à votre fournisseur

Si vous vous approvisionnez en caméras PTZ 4G en Chine, voici mon conseil. Posez trois questions précises à votre usine :

  1. Le chien de garde dispose-t-il d'une temporisation en cas de redémarrages répétés ?
  2. Le système vérifie-t-il la tension de la batterie avant de déclencher un redémarrage ?
  3. Quel est le nombre maximum de redémarrages autorisés par heure ?

Si l'usine ne peut pas répondre clairement à ces questions, l'implémentation du chien de garde est probablement basique - une simple minuterie sans intelligence. C'est parfait pour les caméras alimentées par le réseau. Mais pour les déploiements 4G solaires dans les zones reculées, vous avez besoin de la version intelligente.

Chez Loyalty-Secu, j'ai conçu nos systèmes solaires PTZ avec ces trois protections intégrées. La minuterie d'arrêt, la détection de panne sèche et une limite de redémarrage configurable. Car je sais que pour des clients comme David, une caméra morte dans un champ éloigné n'est pas seulement un inconvénient. C'est un projet raté et une réputation ternie.

Conclusion

Le Watchdog matériel garantit le redémarrage de votre caméra 4G lorsqu'elle se bloque. Associé à la surveillance intelligente des liaisons, à la récupération par paliers et à l'enregistrement des redémarrages, il permet aux sites distants de rester en ligne, sans avoir à recourir à des camions coûteux.


1. Mémoire non volatile EEPROM pour l'enregistrement des raisons du redémarrage. 2. Jalon Intégration des événements ONVIF et des journaux Watchdog. 3. Surveillance des événements du chien de garde Blue Iris PTZ. 4. Algorithme de recul exponentiel pour la prévention des boucles de redémarrage. 5. Contrôle de la connectivité internet basé sur le ping ICMP. 6. Conception d'un circuit de minuterie Watchdog pour Linux embarqué. 7. Récupération des sessions de données PPP vs QMI pour les modules 4G. 8. Commutation d'alimentation GPIO pour la réinitialisation du module 4G. 9. Circuit de détection de la panne sèche pour les caméras alimentées par l'énergie solaire. 10. Gestion à distance MQTT pour les rapports de journaux Watchdog.

Prêt à sécuriser votre projet ?

Obtenez des spécifications techniques complètes, des prix de gros et une solution personnalisée pour vos besoins spécifiques en matière de PTZ et d'énergie solaire.

Réponse dans les 24 heures

Vous avez besoin d'une solution solaire sur mesure pour votre projet ?

Consultez nos guides techniques revus par des experts ou demandez un plan d'installation personnalisé. Notre équipe d'ingénieurs vous aide à trouver le kit d'alimentation solaire idéal pour vos besoins spécifiques en matière de caméras PTZ.