أتلقى هذا السؤال كثيرًا من مدمجي الأنظمة الذين يحتاجون إلى بيانات إحداثيات حية على خلاصات الفيديو الخاصة بهم. هذا مهم لأن الإعداد الخاطئ يمكن أن يدمر دليلك أو يعطل سير عملك.
نعم، يمكن تراكب إحداثيات تتبع XY في الوقت الفعلي مباشرة على بث RTSP. هناك طريقتان رئيسيتان: حرق OSD على مستوى الأجهزة، والذي يختم الإحداثيات بشكل دائم في كل إطار فيديو، وتراكب البيانات الوصفية الديناميكي، الذي يرسل بيانات الإحداثيات كمسار منفصل بجانب الفيديو. كل طريقة تناسب احتياجات المشاريع المختلفة.

يعتمد الاختيار الصحيح على هدفك النهائي. إذا كنت بحاجة إلى دليل مقاوم للتلاعب، فقم بحرقه. إذا كنت بحاجة إلى بيانات مرنة وتفاعلية لـ VMS الخاص بك أو برنامج مخصص، فاستخدم البيانات الوصفية. أدناه، سأفصل الأسئلة الأكثر شيوعًا التي يطرحها عملاؤي حول هذا الموضوع. سأشارك أيضًا التحديات الواقعية التي نحلها في عمليات نشر كاميرات PTZ الشمسية التي تعمل بتقنية 4G.
جدول المحتويات
هل سيتم حرق مربعات تحديد AI بشكل دائم في دليل فيديو 4K المسجل؟
هذا قلق أسمعه من كل مدير مشروع تقريبًا. لا أحد يريد اكتشاف بعد ستة أشهر من النشر أن لقطات الأدلة الخاصة بهم إما تفتقر إلى بيانات مهمة أو مزدحمة بصناديق لا يمكنهم إزالتها.
إذا قمت بتمكين خيار “حرق معلومات الأحداث الذكية” في البرنامج الثابت للكاميرا، فنعم، سيتم تضمين مربعات تحديد AI وإحداثيات XY بشكل دائم في كل إطار مسجل. هذا يعني أن البيانات تصبح جزءًا من محتوى البكسل. لا يمكن لأحد إزالتها أو تغييرها بعد التسجيل. هذا مثالي للأدلة الجنائية ولكنه غير قابل للعكس.

كيف يعمل حرق OSD الصلب فعليًا
دعني أشرح ما يحدث داخل الكاميرا عند تشغيل هذه الميزة. معالج إشارة الصورة (ISP)8 هو الشريحة التي تعالج الصورة الأولية من المستشعر. قبل أن يقوم ISP بتمرير الصورة إلى مشفر H.265، فإنه يرسم مربع التحديد ونص الإحداثيات مباشرة على بكسلات الصورة. بحلول الوقت الذي يقوم فيه المشفر بضغط الإطار، تكون هذه الصناديق مجرد جزء من الصورة. لا تختلف عن الطابع الزمني في الزاوية.
هذا يعني أن كل جهاز يقوم بتشغيل الفيديو سيرى الصناديق. لا يهم إذا كنت تستخدم VLC5, ، أو مسجل فيديو رقمي رخيص، أو نظام VMS عالي الجودة مثل علامة فارقة4. البيانات مرئية دائمًا.
متى تستخدم الحرق ومتى تتجنبه
هذا هو السؤال الرئيسي: من هو المستخدم النهائي الخاص بك؟
إذا كان عميلك وكالة إنفاذ قانون، أو وحدة دوريات حدود، أو مشغل بنية تحتية حرجة، فهم غالبًا ما يتطلبون توثيق أحداث الكشف بصريًا في اللقطات نفسها. في المحكمة، يمكن للمحامي أن يشير إلى الشاشة ويقول: “اكتشف النظام دخيلاً عند إحداثيات البكسل (1423، 876) في الساعة 02:14:07 صباحًا”. هذه أدلة قوية.
ولكن إذا كان عميلك مشغل مدينة ذكية يغذي الفيديو إلى منصة ذكاء اصطناعي مركزية للتحليل الثانوي، فإن المربعات المحروقة تصبح ضوضاء. قد يحاول نظام الذكاء الاصطناعي الثانوي اكتشاف مربع الإحاطة نفسه ككائن. لقد رأيت هذا يحدث. إنه يخلق إيجابيات خاطئة.
سلامة الأدلة مقابل المرونة التحليلية
| العامل | OSD محروق بشكل دائم | فيديو نظيف (بدون حرق) |
|---|---|---|
| القبول في المحكمة | عالٍ — البيانات مقاومة للتلاعب | يتطلب سجل بيانات وصفية منفصل كدليل |
| تحليل الذكاء الاصطناعي الثانوي | ضعيف — المربعات تتداخل مع الاكتشاف | ممتاز — إطارات نظيفة لإعادة المعالجة |
| تأثير التخزين | زيادة طفيفة (~1-2%) | لا يوجد تأثير |
| تحكم المستخدم | لا يوجد بعد التسجيل | تحكم كامل عبر VMS |
| توافق التشغيل | عام | يعتمد على دعم بيانات VMS الوصفية |
توصيتي: إذا كان مشروعك يخدم غرضين (دليل + تحليلات)، قم بتسجيل تيارين. استخدم التيار الرئيسي مع الحرق للتخزين الدليل. استخدم التيار الفرعي النظيف لخلفية الذكاء الاصطناعي الخاصة بك. يدعم برنامجنا الثابت هذا التكوين المزدوج التيار فورًا.
هل يمكنني تشغيل/إيقاف تراكب إحداثيات XY من خلال إعدادات OSD للكاميرا؟
كان لدي عميل في تكساس العام الماضي أراد إظهار الإحداثيات أثناء المراقبة الحية ولكن إخفائها تمامًا أثناء التشغيل لمراجعة خصوصية عملائه. افترض أن تبديلًا بسيطًا سيتعامل مع الأمر. الواقع أكثر تعقيدًا.
نعم، يمكنك تشغيل أو إيقاف تراكب إحداثيات XY عبر قائمة OSD للكاميرا، ولكن فقط إذا كنت تستخدم طريقة تراكب البيانات الوصفية. إذا اخترت طريقة الحرق الثابت، فإن التبديل يؤثر فقط على الإطارات المستقبلية. لا يمكنه إزالة الإحداثيات من الإطارات المسجلة بالفعل. للحصول على مرونة كاملة في التشغيل/الإيقاف، فإن نهج البيانات الوصفية هو الخيار الصحيح.

فهم سلوكي التبديل
عندما تدخل إلى إعدادات OSD للكاميرا وتجد خيار “التراكب الذكي” أو “عرض الذكاء الاصطناعي”، فإن ما يحدث عند قلبه يعتمد كليًا على طريقة التراكب التي يستخدمها برنامجك الثابت.
السيناريو أ - وضع الحرق الثابت: تقوم بإيقاف تشغيل التبديل. تتوقف الكاميرا عن رسم المربعات على الإطارات الجديدة. ولكن كل إطار تم تسجيله قبل تلك اللحظة لا يزال يحتوي على المربعات المحروقة. لا يوجد تراجع. فكر في الأمر مثل الكتابة بقلم تحديد دائم على صورة. يمكنك التوقف عن الكتابة، ولكن لا يمكنك محو ما هو موجود بالفعل.
السيناريو ب - وضع البيانات الوصفية: تقوم بإيقاف تشغيل التبديل. لا تزال الكاميرا ترسل تيار البيانات الوصفية (إحداثيات XY بتنسيق XML أو JSON). ولكن معاينة الكاميرا نفسها تتوقف عن عرض التراكب. يمكن لـ VMS الخاص بك أن يقرر بشكل مستقل ما إذا كان سيعرض الإحداثيات. هذا يمنحك تحكمًا طبقة بطبقة.
خيارات قائمة OSD في برنامجنا الثابت
برنامجنا كاميرات PTZ7 يوفر تحكمًا دقيقًا في ما يتم عرضه. إليك ما يمكنك تكوينه:
- عرض مربع التحديد: تشغيل / إيقاف
- نص الإحداثيات (X، Y): تشغيل / إيقاف
- تسمية تصنيف الكائن (شخص، مركبة، إلخ): تشغيل / إيقاف
- درجة الثقة: تشغيل / إيقاف
- رقم تعريف التتبع: تشغيل / إيقاف
يمكن تبديل كل من هذه بشكل مستقل. لذلك إذا أراد عميلك فقط رؤية معرف التتبع والمربع المحيط ولكن ليس الإحداثيات الأولية، فهذا إعداد بسيط للبرامج الثابتة.
خطأ شائع أراه في الميدان
يقوم العديد من المدمجين بتكوين تراكب OSD أثناء اختبارات المختبر وينسون تعديله قبل النشر. ثم يشتكي المستخدم النهائي: “لماذا أرى أرقامًا في كل مكان على شاشتي؟” أو ما هو أسوأ، يقومون بإيقاف تشغيل كل شيء أثناء الإعداد ثم بعد ستة أشهر يسألون: “أين بيانات الإحداثيات الخاصة بي؟”
نصيحتي: قم بإنشاء قائمة مرجعية للتكوين لكل مشروع. وثّق بالضبط أي التراكبات قيد التشغيل، وأيها متوقفة، وما إذا كنت تستخدم وضع الحرق أو البيانات الوصفية. احفظ ملف التكوين. تدعم كاميراتنا تصدير واستيراد التكوين، لذلك يمكنك استنساخ الإعدادات عبر مئات الوحدات.
ملخص سلوك التبديل
| الإجراء | وضع الحرق الثابت | وضع تراكب البيانات الوصفية |
|---|---|---|
| تبديل إيقاف التشغيل في OSD | يتوقف الحرق على الإطارات الجديدة فقط | يتوقف العرض على معاينة الكاميرا؛ لا تزال البيانات الوصفية تنتقل |
| تبديل التشغيل في OSD | يستأنف الحرق على الإطارات الجديدة | يستأنف العرض على معاينة الكاميرا |
| التأثير على التسجيلات السابقة | لا تغيير - الصناديق دائمة | لا تغيير - يتم دائمًا تخزين البيانات الوصفية بشكل منفصل |
| تحكم مستقل عن VMS | غير ممكن | ممكن تمامًا |
كيف يساعد تراكب الإحداثيات فريقي في تنسيق استجابات PTZ اليدوية؟
في مشاريع أمنية محيطية كبيرة، غالبًا ما أرى انفصالًا بين المشغل الذي يكتشف التهديد والفريق الميداني الذي يستجيب. يقول المشغل: “إنه على الجانب الأيسر من الشاشة”. هذا عديم الفائدة عندما تغطي الكاميرا خط سياج بطول 2 كيلومتر.
تمنح طبقة الإحداثيات XY مشغليك لغة رقمية دقيقة للتواصل حول مواقع الأهداف. بدلاً من الأوصاف الغامضة، يمكن لغرفة التحكم الخاصة بك الاتصال لاسلكيًا بالفريق الميداني بزوايا دوران وإمالة دقيقة مشتقة من بيانات XY. هذا يقلل وقت تنسيق الاستجابة بشكل كبير ويلغي التخمين في التحكم اليدوي في PTZ.

من إحداثيات البكسل إلى المواقع في العالم الحقيقي
إليك كيف تعمل سير العمل فعليًا في نظام مُعد بشكل جيد. يكتشف الذكاء الاصطناعي للكاميرا شخصًا عند إحداثيات البكسل (1423، 576) في إطار 1920 × 1080. يعرف البرنامج الثابت أن زاوية الدوران الحالية هي 127.4 درجة وزاوية الإمالة هي -8.2 درجة. كما أنه يعرف أن مجال الرؤية عند مستوى التقريب الحالي هو 6.3 درجة أفقيًا.
باستخدام الرياضيات البسيطة، يحسب البرنامج الثابت أن الهدف يبعد حوالي 1.2 درجة إلى يمين مركز الإطار و 0.5 درجة فوق المركز. ثم يُخرج الاتجاه المطلق: دوران 128.6 درجة، إمالة -7.7 درجة. هذا هو ما يتم عرضه على الطبقة أو إرساله عبر البيانات الوصفية.
لماذا هذا مهم للتجاوز اليدوي
في العديد من أنظمتنا عمليات نشر 4G الشمسية PTZ الشمسية1, ، تعمل الكاميرا في وضع التتبع التلقائي معظم الوقت. ولكن هناك لحظات يحتاج فيها المشغل إلى تولي التحكم اليدوي. ربما فقد الذكاء الاصطناعي الهدف خلف شجرة. ربما هناك هدفان ويريد المشغل التركيز على الهدف الثاني.
بدون بيانات الإحداثيات، يتعين على المشغل مسح المشهد بصريًا، وتخمين مكان ذهاب الهدف، وتحريك PTZ يدويًا. مع بيانات الإحداثيات، يرى المشغل آخر موقع معروف - على سبيل المثال، دوران 214.3 درجة، إمالة -3.1 درجة - ويمكنه إدخال هذه الأرقام مباشرة في وحدة تحكم PTZ. تدعم بعض منصات VMS حتى “النقر للانتقال إلى الإحداثيات”، مما يجعل هذا فوريًا.
التنسيق بين كاميرات متعددة
يصبح هذا أقوى عندما يكون لديك كاميرات PTZ متعددة تغطي نفس المنطقة من زوايا مختلفة. إذا أبلغت الكاميرا A عن هدف في اتجاه جغرافي 214 درجة، يمكن للكاميرا B أن تدور تلقائيًا إلى نفس الاتجاه. أو يمكن للمشغل أن يأمر الكاميرا B يدويًا بالنظر إلى 214 درجة. تجعل طبقة الإحداثيات هذه عملية تسليم بين الكاميرات الممكنة دون الحاجة إلى أن يتذكر المشغل أي كاميرا تغطي أي منطقة.
سيناريو واقعي: مراقبة خط الأنابيب في غرب تكساس
يقوم أحد عملائنا بمراقبة ممر خط أنابيب بطول 15 ميلًا باستخدام ست وحدات PTZ تعمل بالطاقة الشمسية. تغطي كل كاميرا حوالي 2.5 ميل. عندما تكتشف الكاميرا 3 مركبة بالقرب من خط الأنابيب عند إحداثيات محددة، يرى المشغل قيم الدوران/الإمالة على الشاشة. يتصل لاسلكيًا بشاحنة الدورية: “هدف عند الكاميرا 3، اتجاه 187 درجة، على بعد حوالي 800 متر من تقاطع طريق الوصول.” يعرف فريق الدورية بالضبط إلى أين يذهبون. قبل أن يكون لديهم طبقات إحداثيات، كان الاتصال اللاسلكي هو: “الكاميرا 3 ترى شيئًا على الجانب الأيمن.” كان فريق الدورية يقود السيارة لمدة 20 دقيقة في محاولة للعثور عليه.
هذا هو الفرق الذي تحدثه بيانات الإحداثيات. إنها تحول التنبيهات الغامضة إلى معلومات قابلة للتنفيذ.
هل يؤثر التراكب على كفاءة ضغط H.265 لبث الفيديو المباشر؟
هذا هو السؤال الذي يفصل المشترين العاديين عن المهندسين الجادين. كل مدمج نظام أعمل معه ويدير عمليات نشر 4G محدودة النطاق الترددي يسأل هذا. ويجب عليهم ذلك. لأنه في موقع يعمل بالطاقة الشمسية مع بطاقة SIM 4G، كل كيلوبت مهم.
يعتمد التأثير على طريقة الطبقة التي تستخدمها. يضيف OSD المحروق نصًا وصناديق عالية التباين إلى الصورة، مما يقلل قليلاً من كفاءة ضغط H.265 لأن المشفر يجب أن يحافظ على هذه الحواف الحادة. الزيادة عادة ما تكون 3-8٪ في معدل البت. طبقة البيانات الوصفية لها تأثير صفري على ضغط الفيديو لأن بيانات الإحداثيات تنتقل في قناة منفصلة وخفيفة الوزن.

لماذا يؤثر الحرق على الضغط (قليلاً)
يُعد H.265 (HEVC) جيدًا جدًا في ضغط المشاهد الطبيعية. العشب والسماء والأشجار والطرق - تتميز هذه بتدرجات سلسة وحركة يمكن التنبؤ بها. يستغل المُرمّز هذا القدرة على التنبؤ لتحقيق نسب ضغط عالية.
ولكن عندما تقوم بحرق نصوص حادة وعالية التباين وأشكال هندسية (مثل مربعات التحديد) في الصورة، فإنك تُدخل عناصر لا يمكن للمُرمّز التنبؤ بها جيدًا. تسمية “X:1423 Y:576” بيضاء على خلفية داكنة تُنشئ حوافًا صلبة تتطلب المزيد من البتات لتشفيرها بدقة. يتعين على المُرمّز إنفاق بتات إضافية للحفاظ على قابلية قراءة تلك الأحرف.
ما مقدار النطاق الترددي الإضافي الذي نتحدث عنه؟
في اختباراتنا المعملية، هذا ما قسناه على مشهد خارجي نموذجي بدقة 1080 بكسل، 25 إطارًا في الثانية،, H.265 الملف الشخصي الرئيسي6:
| تكوين التراكب | متوسط معدل البت | زيادة مقابل نظيف |
|---|---|---|
| لا يوجد تراكب (فيديو نظيف) | 2.8 ميجابت في الثانية | خط الأساس |
| الطابع الزمني فقط | 2.85 ميجابت في الثانية | +1.8% |
| الطابع الزمني + 1 مربع تحديد + نص XY | 2.92 ميجابت في الثانية | +4.3% |
| الطابع الزمني + 5 مربعات تحديد + نص XY | 3.03 ميجابت في الثانية | +8.2% |
| تراكب البيانات الوصفية (بدون حرق) | 2.8 ميجابت في الثانية + 3 كيلوبت في الثانية بيانات وصفية | ~0% على تدفق الفيديو |
كما ترى، فإن مربع تحديد واحد أو اثنين بالكاد يُحدث فرقًا. ولكن إذا كنت تراقب تقاطعًا مزدحمًا مع أكثر من 10 اكتشافات متزامنة، فإن زحف معدل البت يتراكم. على اتصال 4G مع حد شهري للبيانات، يمكن أن تكلف هذه الزيادة البالغة 8% على مدار 30 يومًا عميلك أموالًا حقيقية.
مشكلة ميزانية النطاق الترددي لشبكة 4G
دعني أضع هذا في المنظور الصحيح. خطة شريحة SIM 4G نموذجية لجهاز إنترنت الأشياء الصناعي في الولايات المتحدة تمنحك 50-100 جيجابايت شهريًا. عند بث مستمر بسرعة 2.8 ميجابت في الثانية، تستهلك حوالي 900 جيجابايت شهريًا. من الواضح أن لا أحد يبث على مدار الساعة طوال أيام الأسبوع بأقصى معدل بت على شبكة 4G. أنت تستخدم التسجيل المشغل بالحركة، ومعدل البت التكيفي، ونوافذ البث المجدولة.
ولكن حتى مع هذه التحسينات، فإن زيادة معدل البت بنسبة 8% تعني استهلاك بيانات أكثر بنسبة 8%. على نشر 100 كاميرا، هذا أمر مهم.
نهجنا: جدولة التراكب الذكي
لهذا السبب قمنا ببناء ميزة تسمى ‘جدولة التراكب الذكي’2 في البرنامج الثابت لدينا. تعمل بهذه الطريقة:
- أثناء أحداث الإنذار, ، تقوم الكاميرا تلقائيًا بتمكين حرق الإحداثيات بحيث تحتوي مقطع الدليل على بيانات مرئية كاملة.
- أثناء المراقبة العادية (لا يوجد إنذار)، تقوم الكاميرا بتعطيل الحرق وترسل الإحداثيات فقط عبر قناة البيانات الوصفية.
- يحدث الانتقال في غضون GOP (مجموعة صور)9, ، وهي عادةً ثانيتان.
هذا يمنحك أفضل ما في العالمين. تحتوي مقاطع الأدلة الخاصة بك على إحداثيات محروقة للمحكمة. تظل لقطات المراقبة الروتينية الخاصة بك نظيفة وفعالة من حيث عرض النطاق الترددي. ويظل فاتورة بيانات 4G الخاصة بك تحت السيطرة.
مزامنة PTS عبر شبكات 4G
هناك تفصيل فني آخر مهم لنشر شبكات 4G. عندما ترسل الكاميرا بث الفيديو وبث البيانات الوصفية عبر اتصال 4G، يمكن أن يتسبب تذبذب الشبكة في وصولهما إلى VMS في أوقات مختلفة. قد يصل إطار الفيديو متأخرًا بمقدار 500 مللي ثانية، ولكن حزمة البيانات الوصفية الصغيرة تصل في الوقت المحدد.
إذا قامت VMS الخاصة بك بتركيب البيانات الوصفية بشكل ساذج عند وصولها، فستظهر المربع المحيط “يسبق” الهدف. يتحرك المربع قبل الشخص. هذا يبدو معطلاً.
يقوم البرنامج الثابت لدينا بحل هذه المشكلة باستخدام مزامنة PTS (طابع زمني للعرض)3. تحمل كل حزمة بيانات وصفية نفس الطابع الزمني تمامًا مثل إطار الفيديو الذي تنتمي إليه. يقوم نظام إدارة الفيديو (VMS) بتخزين كلا التدفقين مؤقتًا ومحاذاتهما حسب الطابع الزمني قبل العرض. النتيجة: يظل مربع التحديد ثابتًا على الهدف، حتى مع اتصال 4G متقطع في حقل نفط ناءٍ في تكساس.
الخاتمة
تراكب إحداثيات XY على تدفقات RTSP قابل للتحقيق بالكامل. اختر الحرق الثابت للأدلة التي لا يمكن العبث بها. اختر تراكب البيانات الوصفية للمرونة وتوفير عرض النطاق الترددي. طابق الطريقة مع الاحتياجات الحقيقية لمشروعك.
1. كاميرات PTZ تعمل بالطاقة الشمسية تستخدم شبكات خلوية 4G للمراقبة عن بعد. ︎↩︎ 2. ميزة البرامج الثابتة التي تتيح الحرق فقط أثناء الإنذارات لتوفير عرض النطاق الترددي. ︎↩︎ 3. الطابع الزمني المستخدم لمزامنة تدفقات الفيديو والبيانات الوصفية للحفاظ على المحاذاة. ︎↩︎ 4. منصة برامج إدارة الفيديو الشهيرة التي تدعم تراكب البيانات الوصفية. ︎↩︎ 5. مشغل وسائط مفتوح المصدر يمكنه عرض تدفقات الفيديو مع التراكبات. ︎↩︎ 6. معيار ضغط الفيديو المعروف أيضًا باسم HEVC، المستخدم للبث الفعال للفيديو. ︎↩︎ 7. كاميرا قادرة على التحريك والإمالة والتقريب، تستخدم عادة في المراقبة. ︎↩︎ 8. شريحة تعالج بيانات الصورة الأولية قبل الترميز، حيث يحدث الحرق. ︎↩︎ 9. تسلسل الإطارات في الفيديو المضغوط المستخدم لكفاءة الترميز. ︎↩︎