أدير مئات من كاميرات PTZ الشمسية 4G1 في مواقع خارج الشبكة. في الشهر الماضي، ارتفعت فاتورة بياناتي بنسبة 40%. احتجت إلى معرفة ما إذا كان تتبع الذكاء الاصطناعي2 هو السبب.
يعمل التتبع التلقائي بالذكاء الاصطناعي بالكامل على شريحة الكاميرا المحلية، لذا فإن التتبع نفسه يستهلك صفر بيانات 4G. تأتي تكلفة البيانات الحقيقية من ما يحدث بعد تشغيل التتبع - تحميلات الفيديو السحابية3, ، ومجموعات اللقطات، وجلسات المعاينة المباشرة. تضيف البيانات الوصفية وحدها أقل من 1% إلى عرض النطاق الترددي الخاص بك.

أدناه، سأوضح بالتفصيل أين تذهب بياناتك بالضبط، وكم تكلف كل إجراء، وكيفية الحفاظ على فاتورة 4G4 تحت السيطرة عبر عمليات النشر واسعة النطاق. دعنا ندخل في التفاصيل.
جدول المحتويات
هل يتم ضغط البيانات الوصفية للذكاء الاصطناعي بشكل منفصل عن دفق الفيديو لتوفير عرض النطاق الترددي؟5
اعتقدت سابقًا أن البيانات الوصفية مجمعة داخل دفق الفيديو وتستهلك خطة بياناتي. كنت مخطئًا. فهم كيفية انتقال البيانات الوصفية غيّر طريقة ميزانيتي لبيانات 4G.
نعم، يتم التعامل مع البيانات الوصفية للذكاء الاصطناعي بشكل منفصل عن دفق الفيديو. تقوم الكاميرا SoC6 بإنشاء حزم إحداثيات صغيرة - مواضع مربعات التحديد، ومعرفات الكائنات، والطوابع الزمنية - تنتقل كبيانات خفيفة الوزن جنبًا إلى جنب مع الفيديو. هذه الحزم صغيرة جدًا لدرجة أنها بالكاد تظهر في استخدام بياناتك.

كيف تنتقل بيانات التعريف فعليًا
لفهم هذا بوضوح، تحتاج إلى معرفة ما يحدث داخل الكاميرا. تقوم شريحة الذكاء الاصطناعي بكل العمل الشاق محليًا. تكتشف شخصًا أو مركبة، وترسم مربعًا محيطًا، وتحسب الإحداثيات. هذه الإحداثيات مجرد أرقام. قد تبدو بيانات التعريف لإطار واحد كالتالي: {x: 320, y: 240, w: 80, h: 160, class: "إنسان", confidence: 0.92}. هذا بضع مئات من البايتات على الأكثر.
من ناحية أخرى، فإن بث الفيديو هو شيء مختلف تمامًا. حتى التدفق الفرعي7 بمعدل 0.5 ميجابت في الثانية يولد حوالي 3.75 ميجابايت في الدقيقة. التدفق الرئيسي8 بمعدل 2 ميجابت في الثانية؟ هذا 15 ميجابايت في الدقيقة. توجد بيانات التعريف في قناة منفصلة - يتم إرسالها عادةً عبر بروتوكول خفيف الوزن مثل JSON9 عبر MQTT10 أو تنسيق ثنائي خاص.
مقارنة الحجم: بيانات التعريف مقابل الفيديو
| نوع البيانات | الحجم في الثانية | الحجم في الساعة | أقل من 1% من إجمالي عرض النطاق الترددي |
|---|---|---|---|
| بيانات التعريف بالذكاء الاصطناعي (إحداثيات + تسميات) | ~1–2 كيلوبايت | ~3.6–7.2 ميجابايت | < 1% |
| فيديو الدفق الفرعي (0.5 ميجابت في الثانية) | ~62.5 كيلوبايت | ~225 ميجابايت | ~15–20% |
| فيديو الدفق الرئيسي (2 ميجابت في الثانية) | ~250 كيلوبايت | ~900 ميجابايت | 80–85% |
كما ترى، البيانات الوصفية غير مرئية تقريبًا مقارنة بالفيديو. حتى لو كان جهازك يتتبع 100 حدث في اليوم ويرسل بيانات وصفية لكل منها، فأنت تنظر إلى ما مجموعه 5-10 ميجابايت. هذا أقل من مقطع فيديو واحد مدته 30 ثانية.
لماذا هذا مهم لميزانية 4G الخاصة بك
هذه هي النقطة الأساسية. إذا أخبرك شخص ما أن “تتبع الذكاء الاصطناعي يستهلك الكثير من البيانات”، فهو يخلط بين منطق التتبع والفيديو الذي يتم تشغيله بواسطة التتبع. البيانات الوصفية نفسها ليست مشكلتك. مشكلتك هي ما يفعله جهازك بهذه البيانات الوصفية - هل يقوم بتحميل مقطع فيديو؟ هل يرسل 10 لقطات؟ هل يقوم بتنشيط تطبيقك حتى تفتح بثًا مباشرًا؟
أنا دائمًا أقول لعملائي: افصل تكلفة البيانات الوصفية عن تكلفة الفيديو في ذهنك. بمجرد القيام بذلك، يمكنك اتخاذ قرارات ذكية بشأن الإجراءات التي تريد تمكينها وتلك التي تريد إيقافها.
هل يمكنني تعطيل تحميل البيانات الوصفية مع الاحتفاظ بتتبع الذكاء الاصطناعي المحلي نشطًا؟
كان لدي عميل في تكساس أراد تتبع الذكاء الاصطناعي على 200 كاميرا شمسية ولكن بدون نقل بيانات سحابية على الإطلاق. سألني هذا السؤال بالضبط. كانت الإجابة مفاجئة له.
نعم، يمكنك بالتأكيد تشغيل تتبع الذكاء الاصطناعي محليًا مع تعطيل جميع عمليات تحميل البيانات الوصفية. خوارزمية التتبع موجودة على معالج الكاميرا. ستظل تكتشف الأهداف وتصنفها وتتبعها - لن ترسل أي بيانات إلى هاتفك أو منصتك السحابية إلا إذا طلبت ذلك.

فهم الطبقتين من تتبع الذكاء الاصطناعي
فكر في تتبع الذكاء الاصطناعي على أنه يتكون من طبقتين منفصلتين. الطبقة الأولى هي المحرك المحلي. هذه هي الشبكة العصبية التي تعمل على نظام SoC الخاص بالكاميرا. تقوم بمعالجة كل إطار، وتحديد البشر أو المركبات، وإرسال أوامر المحرك إلى آلية PTZ11 . تستخدم هذه الطبقة صفر نطاق ترددي للشبكة. تعمل سواء كانت بطاقة SIM الخاصة بك نشطة أم لا.
الطبقة الثانية هي طبقة الإشعارات والتحميل. هذا هو المكان الذي تقرر فيه الكاميرا: “هل يجب أن أخبر شخصًا ما بما رأيته للتو؟” تتعامل هذه الطبقة مع الإشعارات الفورية، وبث البيانات الوصفية إلى التطبيقات، وتحميل اللقطات، ونقل مقاطع الفيديو. لديك سيطرة كاملة على هذه الطبقة من خلال واجهة تكوين الكاميرا.
خيارات التكوين التي يجب أن تعرفها
تقدم معظم كاميرات PTZ الاحترافية، بما في ذلك كاميراتنا في Loyalty-Secu، تحكمًا دقيقًا في ما يتم إرساله وما يبقى محليًا. إليك تفصيل للإعدادات النموذجية:
| الميزة | هل يمكن تعطيله؟ | تأثير البيانات عند التمكين | تأثير البيانات عند التعطيل |
|---|---|---|---|
| تتبع الذكاء الاصطناعي المحلي (التحكم في المحرك) | لا (يعمل دائمًا عند التمكين) | 0 ميجابايت (يعمل محليًا) | غير متاح |
| تحميل البيانات الوصفية (مربعات التحديد إلى التطبيق) | نعم | ~1–2 كيلوبايت/ثانية | 0 ميجابايت |
| إشعار الدفع12 مع لقطة | نعم | ~100 كيلوبايت لكل حدث | 0 ميجابايت |
| تحميل مقطع فيديو للحدث | نعم | 5–20 ميجابايت لكل حدث | 0 ميجابايت |
| معاينة مباشرة على التطبيق | نعم (يبدأها المستخدم) | 3.75–15 ميجابايت في الدقيقة | 0 ميجابايت |
استراتيجية “المحلي فقط”
بالنسبة للنشر على نطاق واسع، غالبًا ما أوصي بما أسميه استراتيجية “المحلي فقط”. إليك كيفية عملها. تقوم بتمكين تتبع الذكاء الاصطناعي على جميع الكاميرات. تتبع الكاميرات الأهداف، وتسجل كل شيء محليًا بطاقة SD13, ، والاحتفاظ بسجل لجميع الأحداث. لكنهم لا يرسلون شيئًا عبر 4G إلا إذا طلبت ذلك تحديدًا.
عندما تحتاج إلى مراجعة حادث، فإنك تتصل بالكاميرا عن بُعد وتسحب المقطع الذي تحتاجه فقط. بهذه الطريقة، تدفع فقط مقابل البيانات التي تستخدمها بالفعل - وليس مقابل آلاف التحميلات الآلية التي لا يشاهدها أحد.
يعمل هذا النهج بشكل جيد بشكل خاص للمواقع البعيدة مثل المزارع ومناطق البناء ومحطات مراقبة خطوط الأنابيب. هذه أماكن نادرة ولكنها مهمة للأحداث. لا تحتاج إلى تنبيهات في الوقت الفعلي لكل أرنب يمر أمام الكاميرا. تحتاج إلى لقطات موثوقة عندما يحدث شيء ما بالفعل.
متى يجب عليك الاحتفاظ بتحميل البيانات الوصفية؟
هناك حالات يكون فيها تعطيل تحميل البيانات الوصفية فكرة سيئة. إذا كنت تراقب محيطًا عالي الأمان وتحتاج إلى تنبيهات فورية، فأنت تريد هذا الإشعار الفوري. الحيلة هي التصفية بقوة. قم بتعيين الكاميرا لإرسال إشعارات للبشر والمركبات فقط. تجاهل كل شيء آخر. بهذه الطريقة، تحصل على التنبيهات المهمة دون الغرق في الإنذارات الكاذبة.
كم ميغابايت من البيانات الإضافية ستضيفها يوم تتبع مزدحم إلى فاتورتي؟
أجريت اختبارًا واقعيًا على إحدى كاميرات PTZ الشمسية التي تعمل بتقنية 4G في موقع بناء. أعطتني النتائج صورة واضحة تمامًا عن مكان ذهاب البيانات بالضبط.
في يوم مزدحم به 50 حدث تتبع، تضيف البيانات الوصفية للذكاء الاصطناعي وحدها أقل من 5 ميجابايت إلى فاتورتك. ولكن إذا أدى كل حدث إلى تحميل فيديو مدته 30 ثانية، فإن نفس اليوم يمكن أن يكلفك 250-1000 ميجابايت - اعتمادًا على إعدادات جودة البث الخاصة بك.

تفصيل سيناريو واقعي
دعني أريك يومًا مزدحمًا نموذجيًا في موقع بناء. تم ضبط الكاميرا لتتبع البشر والمركبات. بين الساعة 7 صباحًا و 6 مساءً، تكتشف وتتتبع حوالي 50 حدثًا. البعض عمال يمشون عبر الإطار. البعض شاحنات تصل. القليل منها إنذارات كاذبة من الظلال أو الأعلام التي تهب في الريح.
إليك ما تكلفك به كل خيار تكوين من حيث البيانات:
السيناريو أ: البيانات الوصفية فقط (لا يوجد تحميل فيديو)
إذا كنت ترسل البيانات الوصفية فقط وإشعارًا فوريًا صغيرًا لكل حدث، فإن تكلفة البيانات الإجمالية لليوم تكون ضئيلة. خمسون حدثًا بحوالي 100 كيلوبايت لكل منها (إشعار + صورة مصغرة) تساوي حوالي 5 ميجابايت. هذا لا شيء. يمكنك تشغيل هذا لمدة شهر كامل واستخدام أقل من 200 ميجابايت.
السيناريو ب: البيانات الوصفية + مقاطع فيديو الأحداث
الآن دعنا نقول إنك قمت بتمكين تحميل مقاطع الأحداث التي مدتها 30 ثانية بجودة البث الفرعي. يبلغ حجم كل مقطع حوالي 5 ميجابايت. خمسون حدثًا تعني 250 ميجابايت في يوم واحد. على مدار شهر، هذا 7.5 جيجابايت. إذا كنت تستخدم جودة البث الرئيسي، فإن كل مقطع يقفز إلى 15-20 ميجابايت. خمسون حدثًا تكلفك الآن 750-1000 ميجابايت في اليوم. هذا 22-30 جيجابايت شهريًا من كاميرا واحدة.
السيناريو ج: البيانات الوصفية + المقاطع + المعاينة المباشرة
هذا هو المكان الذي تصبح فيه الأمور باهظة الثمن. إذا قمت أيضًا بفتح المعاينة المباشرة 10 مرات في اليوم لمدة دقيقتين في كل مرة بجودة البث الرئيسي، فإنك تضيف 300 ميجابايت أخرى في اليوم. بالاقتران مع مقاطع الأحداث، يمكنك بسهولة الوصول إلى 1.3 جيجابايت في اليوم من كاميرا واحدة.
| السيناريو | الأحداث / اليوم | البيانات لكل حدث | الإجمالي اليومي | 1. الإجمالي الشهري |
|---|---|---|---|---|
| 2. أ: البيانات الوصفية + الدفع فقط | 50 | ~100 كيلوبايت | ~5 ميجابايت | 3. ~150 ميجابايت |
| 4. ب: البيانات الوصفية + مقاطع البث الفرعي | 50 | ~5 ميجابايت | 5. ~250 ميجابايت | 6. ~7.5 جيجابايت |
| 7. ج: البيانات الوصفية + مقاطع البث الرئيسي + معاينة مباشرة | 50 | 8. ~20 ميجابايت + معاينة | 9. ~1.3 جيجابايت | 10. ~39 جيجابايت |
11. كيف تختار السيناريو المناسب لنشرك
12. بالنسبة لمعظم عملائي من الشركات إلى الشركات (B2B)، يعتبر السيناريو أ أو ب هو الحل الأمثل. يعمل السيناريو أ للمواقع منخفضة المخاطر حيث تحتاج فقط إلى معرفة أن شيئًا ما قد حدث. يعمل السيناريو ب للمواقع متوسطة المخاطر حيث تريد دليلاً مرئيًا دون فتح بث مباشر.
13. يجب حجز السيناريو ج للمواقع عالية الأمان حيث يكون الاستجابة في الوقت الفعلي أمرًا بالغ الأهمية. حتى في هذه الحالة، أوصي باستخدام البث الفرعي للمعاينة المباشرة. فهو يقلل بيانات المعاينة الخاصة بك بنسبة 80٪ ولا تزال الجودة جيدة بما يكفي لرؤية ما يحدث.
14. التأثير المضاعف على نطاق واسع
15. هذا هو ما يقلق ديفيد ميلر في الليل. إذا كان لديك 1000 كاميرا وكل واحدة تعمل بالسيناريو ج، فأنت تنظر إلى 39 تيرابايت من بيانات الجيل الرابع (4G) شهريًا. بأسعار شركات الاتصالات الأمريكية النموذجية، قد يكلف ذلك 50,000 دولار - 100,000 دولار شهريًا في البيانات وحدها. بالتحويل إلى السيناريو أ، تنخفض تكلفة بياناتك الشهرية إلى حوالي 150 جيجابايت إجمالاً - ربما 500 دولار - 1000 دولار. هذا فرق 100 مرة. التكوين هو كل شيء.
هل يقوم خادم P2P بتصفية البيانات الوصفية المتكررة قبل إرسالها إلى تطبيقي المحمول؟
16. شاهدت مرة تطبيقي يتلقى 15 تنبيه تتبع متطابق تقريبًا في دقيقتين - كلها من نفس الشخص الذي يمشي ببطء عبر موقف سيارات. عندها بدأت أسأل عن التصفية من جانب الخادم.
17. نعم، خادم P2P مصمم جيدًا 18. يمكنه ويجب عليه تصفية البيانات الوصفية المكررة قبل وصولها إلى تطبيقك. هذا يعني دمج الأحداث المكررة، وقمع التنبيهات المتكررة لنفس الهدف، وإعادة توجيه التغييرات الهامة في الحالة فقط - مثل دخول شخص جديد إلى المشهد أو مغادرة هدف متتبع للإطار.14 19. خادم P2P يصفّي البيانات الوصفية المكررة تطبيق الهاتف المحمول كاميرا PTZ.

ما تبدو عليه “البيانات الوصفية الزائدة” بالفعل
عندما تتعقب كاميرا شخصًا يمشي عبر منطقة تبلغ مساحتها 100 متر، فإنها تُنشئ بيانات وصفية مستمرة. ينتج كل إطار إحداثيات محدثة. إذا كانت الكاميرا تعمل بسرعة 25 إطارًا في الثانية، فهذا يعني 25 مجموعة من الإحداثيات في الثانية. خلال حدث تتبع مدته 30 ثانية، تُنشئ الكاميرا 750 نقطة بيانات لشخص واحد يقوم بشيء واحد - المشي.
لا يحتاج تطبيقك إلى جميع نقاط البيانات الـ 750. يحتاج إلى معرفة: “دخل شخص ما المنطقة أ في الساعة 10:32 صباحًا، وتحرك عبر المنطقة ب، وخرج في الساعة 10:33 صباحًا.” هذه ثلاث نقاط بيانات، وليس 750. يقوم خادم P2P الذكي بضغط هذا الجدول الزمني في ملخص حدث واحد.
كيف يعمل التصفية من جانب الخادم
تحدث عملية التصفية على عدة مراحل. أولاً، يستقبل الخادم البيانات الوصفية الأولية من الكاميرا. ثم يطبق منطق إزالة التكرار. إذا ظهر معرف الكائن نفسه في إطارات متتالية مع تغيير طفيف في الموضع، يدمج الخادم تلك الإطارات في حدث واحد. يقوم بإنشاء حدث جديد فقط عندما يتغير شيء مهم - يظهر كائن جديد، أو يغير كائن موجود اتجاهه بشكل حاد، أو يغادر كائن الإطار.
التصفية من جانب الحافة مقابل التصفية من جانب الخادم
هناك مكانان يمكن أن تحدث فيهما التصفية. الأول هو على الكاميرا نفسها - وهذا يسمى التصفية من جانب الحافة15. يمكن تكوين البرنامج الثابت للكاميرا للإبلاغ عن الأحداث الجديدة فقط، وليس التحديثات المستمرة. هذا هو النهج الأكثر كفاءة من حيث البيانات لأن البيانات الزائدة لا تغادر الكاميرا أبدًا.
الثاني هو على خادم الترحيل P2P. هذا مفيد عندما ترسل الكاميرا بيانات أولية ولكنك تريد أن يقوم الخادم بتنظيفها قبل إعادة توجيهها إلى التطبيق. يمنحك هذا النهج مزيدًا من المرونة لأنك يمكنك تغيير قواعد التصفية على الخادم دون تحديث البرنامج الثابت للكاميرا.
في Loyalty-Secu، تدعم كاميراتنا كلا النهجين. بالنسبة لنشر شبكات الجيل الرابع (4G)، أوصي دائمًا بالتصفية من جانب الحافة كخط الدفاع الأول. يجب أن تكون الكاميرا ذكية بما يكفي لمعرفة أن إرسال 750 تحديثًا للإحداثيات لشخص واحد يمشي هو إهدار. يجب أن ترسل تنبيهًا واحدًا عند اكتشاف الشخص، وملخصًا واحدًا عند مغادرة الشخص. هذا كل شيء.
التأثير على خطة البيانات الخاصة بك وسلامتك العقلية
التصفية ليست فقط لتوفير البيانات. إنها لتوفير انتباهك. إذا كنت تدير 200 كاميرا وكل واحدة ترسل 50 تنبيهًا غير مصفى يوميًا، فأنت تتعامل مع 10000 إشعار يوميًا. لا يمكن لأحد معالجة ذلك. تتوقف عن قراءتها. تفوتك التنبيه الوحيد الذي يهم حقًا.
التصفية الجيدة تحول 10000 حدث أولي إلى ربما 500 تنبيه مفيد. كل تنبيه يخبرك بشيء مفيد. كل تنبيه يستحق انتباهك. وكل تنبيه يكلف جزءًا صغيرًا من البيانات التي ستستهلكها 10000 دفعة أولية.
بالنسبة لـ David وغيره من مدمجي الأنظمة الذين يديرون أساطيل كبيرة، هذه ليست ميزة لطيفة أن تكون موجودة. إنها ضرورة. عند تقييم مورد كاميرا، اسألهم: “كيف يتعامل نظامك مع البيانات الوصفية الزائدة؟” إذا لم يتمكنوا من إعطائك إجابة واضحة، فهذه علامة حمراء.
الخاتمة
تكلف البيانات الوصفية لتتبع الذكاء الاصطناعي لا شيء تقريبًا من حيث البيانات. تأتي نفقات الجيل الرابع (4G) الحقيقية الخاصة بك من تحميلات الفيديو والمعاينات الحية. قم بالتصفية بذكاء، وقم بالتكوين بعناية، وستظل فاتورتك منخفضة.
1. تعرف على كاميرات PTZ الشمسية بتقنية 4G المستخدمة في تطبيقات المراقبة خارج الشبكة. ︎↩︎ 2. افهم أساسيات التتبع التلقائي للأهداف المدعوم بالذكاء الاصطناعي في كاميرات المراقبة. ︎↩︎ 3. تعرف على كيفية زيادة تخزين الفيديو السحابي لاستخدام البيانات في أنظمة المراقبة. ︎↩︎ 4. قارن خطط وبيانات الجيل الرابع (4G) وتكاليفها لنشر الكاميرات على نطاق واسع. ︎↩︎ 5. فهم تقنيات ضغط البيانات الوصفية لتقليل استخدام عرض النطاق الترددي. ︎↩︎ 6. اكتشف كيف يدمج نظام على شريحة (System-on-Chip) معالجة الذكاء الاصطناعي محليًا في الكاميرات. ︎↩︎ 7. اقرأ عن تقنية التدفق المزدوج (dual-stream) وكيف تستخدم التدفقات الفرعية (sub-streams) عرض نطاق ترددي أقل. ︎↩︎ 8. فهم جودة الفيديو للتدفق الرئيسي (main-stream) وتأثيرها على استهلاك البيانات. ︎↩︎ 9. اكتشف كيف تقوم هياكل JSON بتنظيم البيانات الوصفية لسهولة التحليل والإرسال. ︎↩︎ 10. استكشف بروتوكول المراسلة خفيف الوزن المستخدم بشكل شائع لنقل البيانات الوصفية لإنترنت الأشياء (IoT). ︎↩︎ 11. تعرف على كاميرات التحريك والإمالة والتقريب (Pan-Tilt-Zoom) وقدراتها على التتبع الآلي. ︎↩︎ 12. استكشف كيف تقوم الإشعارات الفورية (push notifications) بتوصيل التنبيهات واستخدام البيانات المرتبطة بها. ︎↩︎ 13. اكتشف كيف يمكن للتسجيل المحلي على بطاقة SD تقليل احتياجات بيانات السحابة. ︎↩︎ 14. فهم كيف تدير خوادم الترحيل من نظير إلى نظير (peer-to-peer relay servers) تدفقات البيانات من الكاميرا إلى التطبيق. ︎↩︎ 15. شاهد كيف يقلل التصفية على حافة الكاميرا (camera edge) من تحميل البيانات ويوفر عرض النطاق الترددي. ︎↩︎