Ich habe zu viele PTZ-Kameras unter Druck abstürzen sehen. Die Ursache? Nicht genug RAM, um das zu bewältigen, was das System gleichzeitig tatsächlich tun muss.
Die RAM-Kapazität bestimmt direkt, wie stabil eine PTZ-Kamera bleibt, wenn mehrere Benutzer, NVRs und KI-Funktionen gleichzeitig Videostreams abrufen. Mehr RAM bedeutet größere Frame-Puffer, mehr Platz für Netzwerkverbindungen und eine bessere Widerstandsfähigkeit gegen Lags, Frame-Verluste und Systemabstürze bei gleichzeitigem Zugriff.

In diesem Artikel werde ich genau aufschlüsseln, wie RAM in eingebetteten Überwachungskameras 1 in einer PTZ-Kamera während des Multi-Stream-Zugriffs funktioniert. Ich werde reale Absturzszenarien, Puffer-Mechanismen, KI-Speicheranforderungen und das, was Sie testen sollten, bevor Sie eine Großbestellung aufgeben, behandeln. Wenn Sie PTZ-Kameras aus China beziehen und Ihre Projekte mehrere NVRs oder Fernzuschauer umfassen, ist dies der Artikel, den Sie vor Ihrem nächsten Kauf lesen müssen.
Inhaltsübersicht
Stürzt meine Kamera ab, wenn fünf Benutzer versuchen, den 4K-Stream gleichzeitig anzusehen?
Diese genaue Frage stellte mir letztes Jahr ein Systemintegrator aus Texas. Er hatte drei NVRs und zwei mobile Apps, die auf eine Kamera zugriffen. Die Kamera fiel alle paar Stunden offline.
Ja, es kann abstürzen. Jeder gleichzeitige Betrachter benötigt seinen eigenen Netzwerkpuffer im RAM. Wenn die Kamera nur 256 MB DDR hat, können fünf gleichzeitige 4K-Verbindungen den Speicher vollständig füllen, was zum Zusammenbruch des Netzwerkstacks und zum Neustart der Kamera führt.

Was passiert in der Kamera, wenn sich fünf Benutzer verbinden?
Jedes Mal, wenn ein Benutzer eine Live-Ansicht öffnet, erstellt die Kamera eine neue TCP- oder UDP-Sitzung. Jede Sitzung benötigt Speicher für Socket-Daten, Paketwiederzusammensetzung und eine Sendewarteschlange. Stellen Sie sich das wie das Öffnen von fünf Browser-Tabs auf einem alten Laptop vor – irgendwann friert das System einfach ein.
Hier ist, was die Kamera gleichzeitig verwalten muss:
- Hauptstrom-Kodierung (4K, H.265, 8–12 Mbps)
- Nebenstrom-Kodierung (D1 oder 720p, 512 Kbps–2 Mbps)
- Fünf separate Sende-Puffer, einer für jeden Betrachter
- ISP-Verarbeitung (Weißabgleich, Rauschunterdrückung, WDR)
- RTSP/ONVIF-Protokollbehandlung für jede Sitzung
Wie RAM pro Verbindung aufgebraucht wird
| Komponente | Ungefährer RAM-Verbrauch pro Verbindung | Anmerkungen |
|---|---|---|
| TCP/RTSP-Socket-Puffer | 2–8 MB | Hängt von den OS-Einstellungen ab |
| Frame-Sendewarteschlange | 10–30 MB | Höher für 4K-Hauptstream |
| Protokoll-Overhead (ONVIF, RTMP) | 1–3 MB | Jedes Protokoll fügt seine eigene Schicht hinzu |
| Gesamt pro Verbindung | ~15–40 MB | 5 Benutzer = 75–200 MB nur für die Netzwerkkommunikation |
Auf einer Kamera mit nur 256 MB Gesamtspeicher DDR könnten allein diese fünf Verbindungen 60–80 % des verfügbaren Speichers beanspruchen. Das lässt fast nichts für die Kodierung, ISP oder den Linux-Kernel selbst übrig. Das Ergebnis ist, dass der Linux-Kernel OOM killer 2 Prozesse beendet, um zu überleben. Manchmal beendet er den Streaming-Dienst. Manchmal stürzt das gesamte System ab und startet neu.
Warum der Absturz oft zum ungünstigsten Zeitpunkt passiert
Der Absturz passiert normalerweise nicht sofort. Er passiert, wenn es einen Spitzenwert gibt. Ein Auto fährt durch das Bild, die Bitrate springt von 6 Mbps auf 12 Mbps, und plötzlich benötigen alle fünf Sende-Puffer doppelt so viel Platz. Das ist der Moment, in dem der Kamera der RAM ausgeht und eine oder mehrere Verbindungen abbricht – oder sie komplett neu startet.
Ich sage meinen Kunden immer: Wenn Ihr Projekt mehr als drei gleichzeitige Zuschauer benötigt, akzeptieren Sie nichts unter 512 MB DDR. Für fünf oder mehr, drängen Sie auf 1 GB. Der Preisunterschied auf dem Mainboard ist gering. Die Kosten für eine Anfahrt zu einem abgelegenen Standort, um eine tote Kamera neu zu starten, sind es nicht.
Bietet 2 GB RAM eine flüssigere PTZ-Reaktion als ein Standardmodell mit 512 MB?
Ich habe Side-by-Side-Vergleiche in unserem Labor in Shenzhen durchgeführt. Der Unterschied in der PTZ-Reaktion ist real, aber es geht nicht nur um die RAM-Größe – es geht darum, was sonst noch gleichzeitig um diesen RAM kämpft.
Eine Kamera mit 2 GB RAM bietet eine spürbar flüssigere PTZ-Steuerung unter hoher Last, da das System genügend Speicherreserven für Motorsteuerungsbefehle, Videokodierung und Netzwerk-Streaming hat, ohne um denselben begrenzten Pufferplatz konkurrieren zu müssen.

Warum die PTZ-Steuerung bei Kameras mit wenig RAM träge reagiert
Wenn Sie einen Schwenk- oder Neigebefehl von Ihrem Joystick oder VMS senden, reist dieser Befehl über das Netzwerk, wird von der Firmware der Kamera analysiert und löst dann den Motorcontroller aus. Diese gesamte Kette läuft im RAM. Auf einer Kamera, die bereits 90 % ihres Speichers für Video-Streaming und KI verwendet, muss der PTZ-Befehl in der Warteschlange warten. Sie drücken “nach links schwenken”, und die Kamera reagiert eine halbe Sekunde später. In der Sicherheit kann eine halbe Sekunde bedeuten, dass man einen Verdächtigen aus den Augen verliert.
Der eigentliche Engpass: Speicherkonflikte
Das Problem ist nicht, dass die PTZ-Steuerung selbst viel RAM benötigt. Das tut sie nicht. Das Problem ist Speicherkonflikte. Wenn der DDR-Bus beschäftigt ist, große 4K-Videobilder zwischen ISP, Encoder und Netzwerk-Stack zu verschieben, bleiben die kleinen PTZ-Steuerdatenpakete stecken und warten auf ihre Runde. Mehr Gesamtspeicher bedeutet, dass das System separate Speicherbereiche für verschiedene Aufgaben vorhalten kann. Der Motorcontroller erhält seinen eigenen Bereich. Die Videopipeline erhält ihren eigenen Bereich. Sie treten sich nicht mehr auf die Füße.
Für ein tieferes Verständnis lesen Sie diese Erklärung von DDR-Speicherbandbreite und -konflikten 3.
Was ich in unseren Labortests beobachtet habe
Wir haben einen einfachen Test durchgeführt. Wir hatten ein 512-MB-Modell und ein 1-GB-Modell aus derselben SoC-Familie. Beide streamten einen 4K-Hauptstream plus einen 720p-Substream. Beide hatten eine grundlegende Personenerkennung laufen. Wir sendeten kontinuierlich PTZ-Preset-Tour-Befehle und überwachten die Reaktionslatenz.
- Das 512-MB-Modell hatte eine durchschnittliche Reaktionszeit von 320 ms, mit Spitzenwerten von bis zu 800 ms bei Szenen mit hoher Bewegung.
- Das 1-GB-Modell erreichte durchschnittlich 110 ms, wobei Spitzenwerte nie 200 ms überschritten.
Die Quintessenz ist klar. Wenn Ihr Projekt eine aktive PTZ-Nachverfolgung beinhaltet – insbesondere mit KI-Autofollow – benötigen Sie genügend RAM, damit die Motorbefehle niemals ausgebremst werden.
Wie verhindert der Speicherpuffer den Verlust von Frames bei der Aufnahme mit hoher Bitrate?
Ich habe Aufnahmen von Baustellen gesehen, bei denen der wichtigste Moment – ein Einbruch, eine Fahrzeugkollision – genau in dem Moment eintrat, als das Video zu einer Wand aus grünen Pixeln wurde. Das ist Frame-Verlust, und er hängt fast immer mit dem Puffer-Management zusammen.
Der Speicherpuffer fungiert als Stoßdämpfer zwischen der Encoder-Ausgabe und der Netzwerk- oder Speichergeschwindigkeit. Wenn die Bitrate bei komplexen Szenen Spitzenwerte erreicht, speichert ein größerer RAM-Puffer diese zusätzlichen Frames in einer Warteschlange, anstatt sie zu verwerfen, und verhindert so die Green-Screen-Artefakte und eingefrorenen Frames, die kritische Aufnahmen ruinieren.

Wie Frame-Pufferung tatsächlich funktioniert
Innerhalb der Kamera gibt der Encoder komprimierte Videoframes mit variabler Rate aus. In einer ruhigen Szene – einem Parkplatz bei Nacht – kann die Bitrate bei 2 Mbit/s liegen. Aber wenn ein LKW durchfährt, Scheinwerfer über das Bild streifen, Regen beginnt zu fallen oder eine Menschenmenge erscheint, kann die Bitrate in weniger als einer Sekunde auf 10–15 Mbit/s ansteigen.
Der Netzwerkanschluss kann Daten nur mit einer festen Geschwindigkeit ausgeben. Wenn der Encoder plötzlich mehr Daten produziert, als das Netzwerk senden kann, müssen diese zusätzlichen Daten irgendwohin. Sie gelangen in den RAM-Puffer. Wenn der Puffer groß genug ist, warten die Daten sicher, bis das Netzwerk aufholt. Wenn der Puffer zu klein ist, werden die ältesten Frames überschrieben oder die neuesten Frames verworfen. In beiden Fällen verlieren Sie Aufnahmen.
Die Mathematik hinter der Puffergröße
Hier ist ein vereinfachter Überblick darüber, was während eines Bitratenanstiegs passiert:
| Szenario | Bitratenanstieg | Netzwerkgeschwindigkeit | Benötigter Puffer für 2-Sekunden-Spitze |
|---|---|---|---|
| 1080p, ruhige Szene | 4 Mbit/s → 8 Mbit/s | 100 Mbit/s (reichlich vorhanden) | ~2 MB |
| 4K, moderate Bewegung | 8 Mbit/s → 20 Mbit/s | 100 Mbit/s (immer noch OK) | ~5 MB |
| 4K, komplexe Szene + Regen | 10 Mbps → 35 Mbps | 100 Mbps (Netzwerk ist in Ordnung, aber Encoder-Ausgabe ist sprunghaft) | ~9 MB |
| 4K + 2 Sub-Streams + KI | 15 Mbps → 40 Mbps gesamt | Netzwerk überlastet oder WLAN | ~15–25 MB |
Diese Zahlen gelten pro Stream, pro Verbindung. Multiplizieren Sie sie mit der Anzahl der gleichzeitigen Zuschauer, und Sie werden sehen, warum 256 MB RAM schnell aufgebraucht sind.
Warum “Smart Buffer Management” genauso wichtig ist wie die reine Größe
Selbst bei ausreichend RAM muss die Firmware ihn gut verwalten. Eine schlecht geschriebene Firmware könnte einen festen 4-MB-Puffer pro Stream zuweisen und ihn nie vergrößern. Eine gut gestaltete Firmware passt die Puffergrößen dynamisch an die aktuelle Bitrate und die Netzwerkbedingungen an. Bei Loyalty-Secu verwendet unsere Linux-basierte Firmware eine adaptive Pufferzuweisung. Wenn ein Bitratenanstieg erkannt wird, leiht sich das System vorübergehend ungenutzten Speicher von Aufgaben mit niedrigerer Priorität. Deshalb bestehen unsere Kameras 72-Stunden-Stresstests ohne einen einzigen Frame-Drop, selbst bei 4K 30fps mit drei gleichzeitigen Zuschauern.
Kann der RAM komplexe KI-Metadaten verarbeiten, während 4K-Video mit 30 Bildern pro Sekunde gestreamt wird?
Diese Frage wird mir immer häufiger gestellt, da jedes Projekt mittlerweile KI benötigt – Personenerkennung, Fahrzeugklassifizierung, Linienüberschreitung, Gesichtserfassung. Die Frage ist nicht, ob die KI funktioniert. Die Frage ist, ob sie funktioniert gleichzeitig mit allem anderen.
Ja, aber nur, wenn die Kamera über genügend RAM verfügt, um die KI-Modellgewichte, die Inferenzpuffer pro Frame und die Video-Streaming-Pipeline gleichzeitig zu speichern. Auf Kameras mit 512 MB oder weniger führt die Aktivierung komplexer KI-Funktionen beim Streaming von 4K bei 30fps oft dazu, dass entweder die KI-Genauigkeit sinkt oder der Videostream stottert.

Wo KI RAM frisst
KI-Verarbeitung auf einer Kamera ist nicht wie das Ausführen einer App auf Ihrem Telefon. Die Kamera lädt das gesamte neuronale Netzwerkmodell beim Hochfahren in den RAM. Für ein einfaches Modell zur Personenerkennung können das 20–50 MB sein. Für ein fortschrittlicheres Modell, das Personen, Fahrzeuge und Gesichter erkennt, können es 80–150 MB sein. Und dieser Speicher bleibt die gesamte Zeit, in der die Kamera läuft, belegt.
Zusätzlich zum Modell selbst benötigt die KI-Engine Arbeitsspeicher für jeden Frame, den sie verarbeitet:
- Eingangs-Framepuffer: Eine Kopie des aktuellen Videobilds, skaliert auf die Eingabegröße des Modells. Für ein 4K-Bild, das auf 640×640 herunter skaliert wird, sind das etwa 1,2 MB.
- Zwischenliegende Merkmalskarten: Die Schichten innerhalb des neuronalen Netzes erzeugen während der Inferenz temporäre Daten. Dies kann je nach Modellkomplexität 30–100 MB beanspruchen.
- Ausgangs-Metadatenpuffer: Begrenzungsrahmenkoordinaten, Objektklassifizierungen, Konfidenzwerte, Tracking-IDs. Klein pro Frame, aber es summiert sich, wenn es für die Ereignissuche gespeichert wird.
Der Konflikt zwischen KI und Streaming
Hier liegt das Kernproblem. Sowohl der Videokodierer als auch die KI-Engine müssen dieselben Videobilder aus dem RAM lesen. Auf einem System mit wenig RAM kämpfen sie um die DDR-Bandbreite. Der DDR-Controller kann nur eine Leseanfrage gleichzeitig bedienen. Wenn die KI-Engine eine intensive Inferenz durchführt – Millionen von Parametern aus dem RAM liest – kann der Kodierer für einige Millisekunden ins Stocken geraten. Bei 30 Bildern pro Sekunde hat jedes Bild nur 33 ms Zeit. Ein 5-ms-Stillstand bedeutet, dass der Kodierer seine Frist verpasst und Sie ein verworfenes Bild oder einen ruckelnden Stream erhalten.
Wie wir dieses Problem bei Loyalty-Secu lösen
Unser Ansatz ist die Verwendung von SoCs mit dedizierten NPU-Speicherpfaden (Neural Processing Unit) in Kombination mit 1 GB oder mehr DDR. Dies gibt der KI-Engine eine eigene Leitung für den Zugriff auf den RAM, ohne die Videopipeline zu blockieren. Wir optimieren auch unsere KI-Modelle durch Quantisierung – die Umwandlung von 32-Bit-Gleitkommagewichten in 8-Bit-Ganzzahlen –, was die RAM-Nutzung des Modells um 75 % bei minimalem Genauigkeitsverlust reduziert.
Mehr erfahren über Modellquantisierung für Edge-KI 4 um zu verstehen, wie diese Technik den Speicherbedarf reduziert.
Was Sie Ihren Lieferanten fragen sollten
Wenn eine Fabrik Ihnen sagt, dass ihre Kamera “KI unterstützt”, stellen Sie ihr diese Fragen:
- Wie hoch ist die Gesamtkapazität des DDR?
- Wie viel RAM verbraucht das KI-Modell zur Laufzeit?
- Kann die KI mit voller Genauigkeit laufen, während die Kamera den 4K-Hauptstream plus einen Substream an zwei gleichzeitige Betrachter streamt?
- Haben Sie dies unter einem 24-Stunden-Belastungsszenario getestet?
Wenn sie diese Fragen nicht klar beantworten können, ist die KI-Funktion wahrscheinlich ein Kontrollkästchen auf einem Datenblatt und keine reale Fähigkeit.
| RAM-Kapazität | KI-Fähigkeit | 4K-Streaming-Stabilität mit KI aktiviert |
|---|---|---|
| 256 MB | Nur grundlegende Bewegungserkennung | Instabil bei mehr als 1 Zuschauer |
| 512 MB | Erkennung von Menschen/Fahrzeugen | Stabil bei 2–3 Zuschauern, gelegentliche Verzögerungen bei intensiven Szenen |
| 1 GB+ | Vollständige KI-Suite (Gesicht, Fahrzeug, Verhalten) | Stabil bei 5+ Zuschauern, geeignet für Edge-Computing-Projekte |
Als Benchmark-Referenz lesen Sie bitte diesen Vergleich von Edge-KI-Prozessoren für die Überwachung 5.
Schlussfolgerung
Die RAM-Kapazität ist der versteckte Faktor, der darüber entscheidet, ob Ihre PTZ-Kamera stabil bleibt oder abstürzt, wenn reale Multi-Stream-Lasten auftreten. Fragen Sie nach den Spezifikationen, führen Sie die Stresstests durch und vertrauen Sie niemals allein einem Datenblatt.
1. Verständnis der Speicheranforderungen für Videoüberwachungs-SoCs. ︎↩︎ 2. Wie der Linux-Kernel Prozesse unter Speicherdruck beendet. ︎↩︎ 3. Technischer Hinweis zu DDR-Speicherbandbreite und -konflikten. ︎↩︎ 4. TensorFlow Lite-Anleitung zur Post-Training-Quantisierung für Edge-KI. ︎↩︎ 5. Benchmark-Vergleich von Edge-KI-Prozessoren für die Überwachung. ︎↩︎