Ho visto troppe telecamere PTZ solari remote diventare nere perché Modulo 4G1 si sono bloccate — e non c'era nessuno a premere il pulsante di reset.
Un watchdog hardware non monitora direttamente lo stato in tempo reale del modulo 4G. Monitora il battito cardiaco del sistema principale. Se la CPU principale o il sistema operativo si bloccano — inclusi i blocchi causati da fallimenti dello stack 4G — il watchdog forza un reset hardware completo. Il monitoraggio effettivo dello stato 4G (intensità del segnale, registrazione di rete, integrità del collegamento dati) è gestito da demoni software in esecuzione sul processore principale, non dal chip watchdog stesso.

La maggior parte degli acquirenti presume che il watchdog hardware stia monitorando tutto. Non è così. Comprendere questa lacuna è fondamentale se si distribuiscono telecamere PTZ in luoghi dove nessuno può raggiungerle per riavviarle. Lasciate che vi spieghi esattamente come funziona ogni livello, cosa fa effettivamente il watchdog e cosa dovreste pretendere dal vostro fornitore.
Indice dei contenuti
Il Watchdog Verifica la Risposta del Comando “AT” dal Modem Ogni 60 Secondi?
Pensavo che il watchdog hardware stesse inviando comandi AT al modem da solo. Non funziona così.
Il watchdog hardware stesso non invia comandi AT. È un semplice circuito timer. Un demone software sul processore principale invia comandi AT come AT, AT+CREG?, o AT+CSQ al modem a intervalli regolari. Se il modem smette di rispondere, il software smette di alimentare il watchdog, e il watchdog attiva quindi un reset hardware.

Come Funziona Effettivamente la Catena Software-Hardware
Vi guiderò attraverso la sequenza reale. Il watchdog hardware è un dispositivo molto semplice. Ha un contatore. Il contatore conta. Se il software reimposta il contatore prima che trabocchi, non succede nulla. Se il contatore trabocca, il watchdog tira la linea di reset verso il basso e riavvia l'intero sistema.
Il watchdog non ha una porta UART. Non ha la capacità di analizzare i comandi AT. Non sa cosa significa AT+CREG? . Non sa cos'è un modem.
Chi invia quindi i comandi AT? Un processo software — di solito un demone Linux5 o un thread di monitoraggio dedicato — viene eseguito sul SoC principale. Questo processo esegue le seguenti operazioni:
- Apre la porta seriale collegata al modem 4G (di solito
/dev/ttyUSB0o simile). - Invia
ATe attendeOK. - Se
OKritorna, il firmware del modem è attivo. - Invia
AT+CREG?per verificare la registrazione alla rete. - Invia
AT+CSQper verificare la potenza del segnale. - Se tutti i controlli superano, il demone alimenta il watchdog (scrive su
/dev/watchdogo commuta un pin GPIO).
Cosa succede quando il modem si blocca
Se il firmware del modem si blocca, il comando AT non riceve risposta. Il demone lo rileva. Può riprovare 3 volte. Se tutti i tentativi falliscono, il demone ha due opzioni:
| Tipo di errore | Risposta del software | Ruolo del Watchdog |
|---|---|---|
| Timeout comando AT (firmware modem bloccato) | Il daemon tenta di resettare il modem tramite controllo alimentazione GPIO | Il watchdog non è ancora coinvolto |
| Reset modem fallito, il daemon stesso va in crash | Il daemon smette di alimentare il watchdog | Overflow del timer del watchdog → riavvio completo del sistema |
| Kernel panic del sistema operativo principale causato dal driver modem USB | Nessun processo può alimentare il watchdog | Overflow del timer del watchdog → riavvio completo del sistema |
Il punto chiave: il watchdog è la ultima linea di difesa, non il primo soccorritore. Il daemon software fa il lavoro intelligente. Il watchdog fa il lavoro brutale.
La domanda dei 60 secondi
Succede ogni 60 secondi? Dipende dal design del firmware. Nella maggior parte dei router 4G industriali e delle telecamere PTZ con cui ho lavorato, l'intervallo di polling è configurabile, tipicamente tra 30 secondi e 5 minuti. Il timeout del watchdog4 è solitamente impostato su un periodo più lungo (come 90-120 secondi) per evitare riavvii falsi durante temporanei problemi di rete.
Se il tuo fornitore dice “il watchdog controlla i comandi AT ogni 60 secondi”, chiedi loro di chiarire: è il daemon software che esegue il polling ogni 60 secondi, o è il timer del watchdog impostato a 60 secondi? Sono due cose molto diverse.
L'Hardware Può Resettare il Modem Indipendentemente dal Sistema Operativo Principale se lo Stack Cellulare si Blocca?
Questa è la domanda che mi tiene sveglio la notte. Se il kernel Linux va in crash, qualcosa può ancora salvare la connessione 4G?
Sì, ma solo se il design hardware include un percorso di reset dedicato. Un sistema correttamente progettato conferisce al watchdog hardware il controllo diretto sull'alimentazione o sul pin di reset del modem, indipendentemente dal sistema operativo principale. Quando il timer del watchdog va in overflow, può interrompere l'alimentazione del modem tramite un interruttore MOSFET o portare a livello basso il pin RESET_N del modem, senza che sia necessario alcun software in esecuzione.

Due livelli di reset hardware
Non tutte le implementazioni watchdog sono uguali. C'è una grande differenza tra un watchdog di base e un watchdog industriale correttamente progettato.
Livello 1: Reset dell'intero sistema (di base)
Nella maggior parte delle telecamere PTZ economiche, il watchdog può fare solo una cosa: resettare l'intero sistema. Il modem, il SoC principale, l'encoder video, tutto si riavvia insieme. Questo funziona, ma è lento. Un avvio completo del sistema può richiedere 60-90 secondi. Durante questo periodo, non hai video né connettività.
Livello 2: Reset indipendente del modem (avanzato)
Nei design migliori, specialmente nei gateway 4G industriali e nei sistemi PTZ solari di fascia alta, il MCU watchdog ha una linea GPIO separata collegata al circuito di controllo dell'alimentazione del modem 4G. Ciò consente un recupero a più stadi:
| Fase di reset | Azione | Tempo di recupero | Impatto sul sistema |
|---|---|---|---|
| Fase 1: Reset software | Il software invia AT+CFUN=1,1 per riavviare il modem | 10-15 secondi | Nessuna interruzione del sistema |
| Fase 2: Reset hardware | Il MCU watchdog porta il pin RESET_N a livello basso per 500 ms | 15–20 secondi | Il sistema principale rimane in funzione |
| Fase 3: Ciclo di alimentazione | Il watchdog MCU interrompe il MOSFET, disattiva il VCC del modem per 3–5 secondi | 20-30 secondi | Il sistema principale rimane in funzione |
| Fase 4: Riavvio completo | Il watchdog va in overflow, riavvia l'alimentazione dell'intero sistema | 60-90 secondi | Tutto si riavvia |
Perché questo è importante per i siti solari remoti
In una distribuzione ad energia solare3, ogni riavvio costa energia. Un riavvio completo del sistema assorbe corrente di picco dalla batteria. Se la batteria è già scarica (giornata nuvolosa, inverno), un riavvio completo potrebbe far scendere la tensione al di sotto della soglia operativa minima del modem, causando un ciclo di avvio.
Un watchdog ben progettato con reset indipendente del modem può risolvere l'80% dei problemi 4G senza toccare il sistema principale. L'encoder video continua a funzionare. Il controller del motore PTZ rimane inizializzato. Solo il modem si riavvia.
Cosa chiedere al fornitore
Quando valuti una telecamera PTZ o un sistema solare 4G dalla Cina, poni queste domande specifiche:
- Il watchdog MCU ha un GPIO separato collegato al controllo di alimentazione del modem 4G?
- Il watchdog può resettare solo il modem senza riavviare l'intero SoC?
- Qual è la durata del ciclo di alimentazione per il modem (quanto tempo viene interrotto il VCC)?
- 1. Il modem è alimentato tramite un interruttore MOSFET 2. o solo tramite il GPIO del SoC (che non funzionerà se il SoC è bloccato)?6 3. Se il fornitore non può rispondere a queste domande, il watchdog probabilmente esegue solo reset dell'intero sistema. Questo è accettabile per molti progetti, ma non è ideale per le installazioni solari off-grid dove ogni watt conta.
4. Ho avuto siti che si sono riavviati 5 volte in una notte. Senza log, non avevo idea se fosse un problema di segnale, un problema hardware o un problema di alimentazione.
Il Watchdog Registrerà la “Intensità del Segnale” e la “Cell ID” Prima di Attivare un Riavvio Forzato?
5. Un watchdog hardware di base non registra alcun dato: non ha memoria per i log. Tuttavia, un sistema watchdog avanzato con un MCU dedicato e memoria non volatile (EEPROM o flash) può registrare l'ultima intensità del segnale nota (RSSI/RSRP), Cell ID, motivo del riavvio e tensione della batteria prima di attivare un reset. Questi dati sono fondamentali per la diagnostica remota.
6. Registrazione del watchdog dell'intensità del segnale e dell'ID cella prima del riavvio.

8. Senza log, ogni riavvio è un mistero. Sai che il dispositivo è andato offline ed è tornato. Ma non sai perché. È stato un crash del firmware del modem? Un segnale debole che ha causato al modem la ricerca infinita di una torre? Una bassa tensione della batteria che ha causato il brown-out del modem?
9. Con la registrazione pre-riavvio, ottieni una traccia forense. Ecco cosa dovrebbe registrare un buon sistema:
10. Cosa dovrebbe essere registrato
11. Un demone di monitoraggio ben progettato dovrebbe scrivere i seguenti dati nella memoria non volatile
12. smette di alimentare il watchdog: prima 13. Timestamp
- 14. dell'ultima connessione di rete riuscita 15. RSSI / RSRP / SINR
- 16. — metriche di qualità del segnale da 17. AT+QENG
AT+CSQo18. Cell ID e LAC - 19. — a quale torre cellulare era connesso il modem (da — a quale torre cellulare era connesso il modem (da
AT+CREG?oAT+CEREG?) - Codice del motivo del riavvio — è stato un timeout AT, un errore di registrazione di rete, un timeout del collegamento dati o una bassa tensione?
- Tensione della batteria al momento del guasto
- Temperatura del modem (se disponibile tramite comando AT)
- Numero di tentativi di riavvio consecutivi
Dove sono archiviati questi dati?
Il chip watchdog hardware stesso (come un TPS3823 o MAX6369) non ha memoria. È solo un timer e un'uscita di reset. La registrazione deve essere eseguita da uno dei seguenti:
- Il demone software — scrive su un file nella memoria flash del sistema principale prima di attivare un riavvio. Rischio: se il kernel è crashato, il demone non può scrivere nulla.
- L'MCU watchdog — se il watchdog è implementato come un microcontrollore separato (come un STM32 o ATtiny), può avere la propria EEPROM. Il sistema principale invia periodicamente dati di stato all'MCU tramite I2C o UART. L'MCU memorizza l'ultimo stato noto. Anche se il sistema principale si blocca, l'MCU ha ancora i dati.
Come accedere ai log da remoto
Dopo che il sistema si è riavviato e riconnesso alla rete 4G, il software di monitoraggio dovrebbe:
- Leggere i log di riavvio memorizzati dall'EEPROM o dalla flash.
- Caricarli sul tuo server cloud o sulla piattaforma VMS.
- Avvisarti via email o notifica push con il motivo del riavvio e i dati del segnale.
Questo trasforma un riavvio cieco in informazioni utili. Se vedi che ogni riavvio avviene quando l'RSRP scende al di sotto di -110 dBm, sai che hai bisogno di un'antenna migliore o di una torre diversa. Se ogni riavvio avviene quando la tensione della batteria scende al di sotto di 11,2 V, sai che hai bisogno di una batteria o di un pannello solare più grandi.
| Campo di log | Comando Sorgente | Valore Diagnostico |
|---|---|---|
| RSRP / RSSI | AT+CSQ o AT+QENG="servingcell" | Identifica il segnale debole come causa principale |
| ID Cella / LAC | AT+CEREG? | Rileva problemi di handover della torre |
| Tensione Batteria | Lettura ADC dal MCU watchdog | Identifica loop di avvio correlati all'alimentazione |
| Motivo del Riavvio | Flag di stato del demone software | Distingue il crash del modem dal crash del sistema operativo |
| Riavvii consecutivi | Contatore in EEPROM | Attiva la modalità di protezione deep-sleep |
Come Impedisco al Watchdog di Riavviare Durante un Aggiornamento Firmware Legittimo?
Una volta ho "brickato" una fotocamera perché il watchdog l'aveva riavviata a metà aggiornamento firmware. La flash era stata scritta a metà. Il dispositivo non è mai più tornato.
Prima di avviare un aggiornamento del firmware2, il software deve disabilitare il timer watchdog o estendere il suo timeout a un valore più lungo della durata dell'aggiornamento. La maggior parte dei sistemi Linux supporta questo tramite l'interfaccia /dev/watchdog utilizzando WDIOC_SETTIMEOUT Chiamata ioctl. Per watchdog hardware senza controllo software, il processo di aggiornamento deve continuare ad alimentare il watchdog a intervalli regolari durante l'aggiornamento.

Il problema dell'aggiornamento del firmware
Un aggiornamento del firmware (specialmente un aggiornamento OTA7 su 4G) può richiedere da 5 a 30 minuti a seconda delle dimensioni del file e della velocità della connessione. Durante questo periodo, il sistema è impegnato nella scrittura sulla memoria flash. Potrebbe non eseguire le normali attività di monitoraggio. Potrebbe non alimentare il watchdog.
Se il timeout del watchdog è impostato su 120 secondi e la scrittura del firmware richiede 10 minuti, il watchdog riavvierà il sistema al segno dei 2 minuti. La flash è stata scritta a metà. Il bootloader non riesce a trovare un'immagine valida. Il dispositivo è bloccato. Ora è necessario inviare qualcuno sul posto con un programmatore JTAG o una console seriale.
Questo non è un rischio teorico. L'ho visto accadere sul campo.
Tre strategie per prevenire questo
Strategia 1: Disabilitare il watchdog durante l'aggiornamento
Sui sistemi Linux, è possibile disabilitare il watchdog scrivendo il carattere magico V a /dev/watchdog e quindi chiudendo il descrittore del file. Questo dice al driver del watchdog di fermare il timer.
Rischio: Se il processo di aggiornamento stesso si arresta in modo anomalo, non c'è nessun watchdog a recuperare il sistema. Stai volando senza una rete di sicurezza.
Strategia 2: Estendere il timeout del watchdog
Un approccio migliore è estendere il timeout del watchdog a un valore più lungo della durata massima prevista dell'aggiornamento. Ad esempio, impostarlo a 30 minuti prima di iniziare l'aggiornamento, quindi reimpostarlo a 120 secondi dopo il completamento dell'aggiornamento.
Rischio: Se il sistema si arresta in modo anomalo durante l'aggiornamento per un motivo non correlato all'aggiornamento stesso, aspetterai 30 minuti prima che il watchdog si riavvii. Ma almeno il watchdog è ancora attivo.
Strategia 3: Alimentare il watchdog dal processo di aggiornamento
L'approccio più robusto è far sì che il processo di aggiornamento del firmware stesso alimenti il watchdog a intervalli regolari. Dopo che ogni blocco di dati è stato scritto sulla flash, il processo di aggiornamento scrive su /dev/watchdog per reimpostare il timer.
Rischio: Minimo. Il watchdog rimane attivo con il suo timeout normale. Se il processo di aggiornamento si blocca, il watchdog riavvierà il sistema. Il requisito fondamentale è che il tuo bootloader supporti partizioni A/B8 lo switching o disponga di un meccanismo di rollback, in modo che una scrittura parziale non renda il dispositivo inutilizzabile.
Cosa chiedere al tuo fornitore
Se la tua telecamera PTZ supporta aggiornamenti firmware OTA tramite 4G (e dovrebbe farlo, per le installazioni remote), chiedi al tuo fornitore:
- Cosa succede al watchdog durante un aggiornamento firmware?
- Il processo di aggiornamento alimenta il watchdog o lo disabilita?
- Il bootloader supporta partizioni A/B o rollback in caso di aggiornamento fallito?
- Il fornitore ha testato un'interruzione di corrente durante l'aggiornamento firmware? Il dispositivo si ripristina?
Queste domande distinguono i produttori seri dagli assemblatori che si limitano a montare componenti su una scheda. Una telecamera inutilizzabile in un sito solare remoto può costare 500-2000€ in spese di intervento sul campo, molto più della telecamera stessa.
Conclusione
Il watchdog hardware è la tua ultima linea di difesa, non la prima. Riavvia il sistema quando tutto il resto fallisce. Per un monitoraggio 4G reale — controlli del segnale, reset del modem e logging pre-riavvio — hai bisogno di demoni software che lavorino insieme al watchdog. Richiedi entrambi al tuo fornitore.
1. Panoramica della tecnologia cellulare 4G e degli standard dei moduli. ︎↩︎ 2. Informazioni generali sul firmware e sulle procedure di aggiornamento. ︎↩︎ 3. Basi dei sistemi di energia solare per apparecchiature remote. ︎↩︎ 4. Nota applicativa tecnica sui timer watchdog nei sistemi embedded. ︎↩︎ 5. Spiegazione dei processi in background nei sistemi Unix-like. ︎↩︎ 6. Come vengono utilizzati i MOSFET per lo switching di potenza nei circuiti. ︎↩︎ 7. Definizione di aggiornamenti firmware over-the-air per dispositivi connessi. ︎↩︎ 8. Spiegazione degli aggiornamenti di sistema A/B per un avvio affidabile dopo aggiornamenti falliti. ︎↩︎