...

هل يعتمد اكتشاف البشر على إعادة تعريف الهوية لكامل الجسم أم مجرد نموذج للرأس والكتفين؟

25 مايو 2026 بواسطة هان

أتلقى هذا السؤال كثيرًا من المدمجين الذين يحددون مواصفات مشاريع أمن المحيط. الإجابة مهمة لأنها تؤثر بشكل مباشر على معدل الإنذارات الكاذبة5 وثقة عميلك.

لا يعتمد نظامنا على نموذج واحد. يستخدم نهجًا لدمج ميزات متعددة يجمع بين اكتشاف كامل الجسم8 للحصول على اكتساب الهدف بعيد المدى، ونموذج للرأس والكتفين لتصفية الإنذارات الكاذبة قصيرة المدى، وإعادة التعريف للتتبع المستمر عبر الانسدادات. تتعامل كل طبقة مع مهمة مختلفة.

خوارزمية الذكاء الاصطناعي لكاميرا PTZ لاكتشاف البشر خوارزمية الذكاء الاصطناعي لكاميرا PTZ لاكتشاف البشر

أدناه، سأوضح كيف تعمل كل طبقة اكتشاف في عمليات النشر الحقيقية، ومتى يعطي كل نموذج الأولوية، وكيف يمكنك ضبط الخوارزمية لموقع مشروعك المحدد. دعني أقدم لك التفاصيل.

هل يمكن للكاميرا تحديد شخص جالس أو يزحف على الأرض بدقة؟

هذا مصدر قلق حقيقي. في مواقع البناء والمزارع، لا يقف الأشخاص دائمًا بشكل مستقيم. إذا كانت الكاميرا تبحث فقط عن شكل بشري واقف، فستفوت الأحداث الهامة.

نعم، يمكن للكاميرا اكتشاف شخص جالس أو يزحف. يستخدم نموذج اكتشاف كامل الجسم شبكة عصبية التفافية (CNN) تم تدريبها على آلاف الأوضاع غير القياسية. يتعرف على النسب الهندسية البشرية ونسب الأطراف، وليس مجرد صورة ظلية مستقيمة. عندما يكون الوضع غامضًا، يعمل نموذج الرأس والكتفين كفحص ثانوي.

اكتشاف شخص جالس يزحف كاميرا PTZ اكتشاف شخص جالس يزحف كاميرا PTZ

كيف يتعامل اكتشاف كامل الجسم مع الأوضاع غير القياسية

لا يبحث نموذج كامل الجسم عن قالب واحد “لشخص واقف”. يقوم بتحليل نسب الجسم وزوايا الأطراف وأنماط الحركة. الشخص الذي يزحف لا يزال لديه نسبة رأس إلى جذع، وطول ذراع، وطول ساق تتناسب مع الهندسة البشرية. تم تدريب شبكة CNN على مجموعات بيانات تتضمن أوضاع الجلوس، والانحناء، والزحف.

في تجربتي مع مدمجي أمن المزارع، يأتي سيناريو الزحف أكثر مما قد تعتقد. غالبًا ما يحاول المتسللون البقاء منخفضين بالقرب من الأسوار. تتعامل خوارزميتنا مع هذا لأنها تستخرج نقاط المفاتيح الهيكلية حتى عندما يكون الجسم أفقيًا. يقوم النظام بتعيين مواضع المفاصل والتحقق مما إذا كان الهيكل العام يتطابق مع هيكل عظمي بشري.

دور تحليل الحركة

الكشف عن الوضعية الثابتة وحدها لا يكفي. يحلل النظام أيضًا أنماط الحركة. يتحرك الشخص الزاحف بشكل مختلف عن الكلب أو كرة الثلج المتدحرجة. يبحث الخوارزمية عن:

  • سرعة الحركة بالنسبة لحجم الجسم
  • أنماط مفصل الأطراف (تحرك الذراعين والساقين في دورات متناوبة)
  • تغييرات الاتجاه التي تشير إلى التنقل المتعمد

متى يصبح الكشف صعبًا؟

هناك حالات استثنائية. إذا كان الشخص ملتفًا في كرة ضيقة وثابتًا تمامًا، فقد يستغرق النظام وقتًا أطول لتصنيف الهدف. في هذه المواقف، ستحتفظ منطق التتبع التلقائي للكاميرا بموضع PTZ وتنتظر الحركة قبل تأكيد التنبيه. هذا يمنع السلبيات الكاذبة دون إغراق اتصال 4G بأجهزة إنذار غير مؤكدة.

أداء الكشف عن الوضعية حسب المسافة

الوضعية نطاق الكشف الموثوق الحد الأدنى لمتطلبات البكسل مستوى الثقة
الوقوف/المشي 20م – 100م 32×64 بكسل عالية
الجلوس/الانحناء 10م – 60م 48×48 بكسل عالية
الزحف/الاستلقاء 5م – 40م 64×32 بكسل متوسط-عالي
ملتف/ثابت 3م – 20م 48×48 بكسل متوسط

النقطة الرئيسية هنا هي أن الأوضاع غير القياسية تحتاج إلى المزيد من البكسلات في الإطار. هذا هو السبب في أن التقريب البصري 40X7 مهم. يكتشف النظام هدفًا محتملاً بزاوية واسعة، ثم يقوم بالتقريب للحصول على كثافة بكسل كافية لتصنيف الوضعية.

كيف تحسن إعادة تعريف هوية المشاة من اتساق التتبع عندما يغير الشخص اتجاهه؟

تتبع شخص يسير في خط مستقيم أمر سهل. التحدي الحقيقي هو عندما يستديرون، أو يختبئون خلف عمود، أو يغيرون ملابسهم بخلع سترة. يفقد تتبع الحركة القياسي الهدف في هذه اللحظات.

يحل Re-ID هذه المشكلة عن طريق استخراج متجه ميزات من مظهر الهدف - لون الملابس، شكل الجسم، الملحقات، والمشية. عندما يظهر الشخص مرة أخرى بعد انسداد أو تغيير اتجاه، يقارن النظام الكشف الجديد مع متجهات الميزات المخزنة. إذا كانت درجة المطابقة أعلى من الحد، يستأنف التتبع فورًا دون إعادة تشغيل تنبيه جديد.

تتبع المشاة Re-ID كاميرا PTZ انسداد تتبع المشاة Re-ID كاميرا PTZ انسداد

ماذا يحدث بدون Re-ID

بدون Re-ID، يستخدم المتتبع الأساسي توقع الموضع. يخمن أين سيكون الهدف في الإطار التالي بناءً على السرعة والاتجاه. عندما يستدير الشخص 180 درجة، يفشل التوقع. يرى النظام بعد ذلك كائنًا “جديدًا” يتحرك في الاتجاه المعاكس. هذا يسبب مشكلتين:

  1. قد تتأرجح كاميرا PTZ في الاتجاه الخاطئ، مما يؤدي إلى فقدان الهدف تمامًا.
  2. يقوم النظام بإنشاء تنبيه ثانٍ لنفس الشخص، مما يهدر عرض النطاق الترددي على اتصال 4G الخاص بك.

كيف يعمل استخراج متجه الميزات

تقوم شريحة الذكاء الاصطناعي في كاميرتنا بتشغيل شبكة تضمين خفيفة الوزن جنبًا إلى جنب مع نموذج الكشف. لكل هدف بشري مؤكد، تقوم بإنشاء متجه ميزات بأبعاد 128 أو 256. فكر في هذا كبصمة رقمية لمظهر الشخص.

هذا المتجه يرمز إلى:

  • كتل الألوان السائدة (لون القميص، لون البنطال)
  • أنماط النسيج (خطوط، سادة، سترة عاكسة)
  • نسب الجسم (نسبة الطول إلى العرض، عرض الكتفين)
  • الأشياء المحمولة (حقيبة ظهر، صندوق أدوات)

عملية المطابقة

عند انقطاع التتبع، يقوم النظام بتخزين آخر متجه ميزات معروف. للمدة من 30 إلى 60 ثانية التالية (قابلة للتكوين)، تتم مقارنة كل اكتشاف بشري جديد في الإطار مقابل هذا المتجه المخزن. تستخدم المقارنة تشابه جيب التمام1. إذا تجاوزت النتيجة 0.75 (قابلة للتعديل)، يربط النظام الاكتشاف الجديد بالمسار الحالي.

قيود إعادة التعريف التي يجب الانتباه إليها

إعادة التعريف ليست مثالية. إنها تواجه صعوبة عندما:

  • يرتدي عدة أشخاص زيًا موحدًا متطابقًا (شائع في مواقع البناء)
  • تتغير الإضاءة بشكل كبير بين الاكتشاف وإعادة الاكتشاف
  • يخلع الشخص أو يضيف طبقة خارجية كبيرة

في سيناريوهات الزي الموحد، أوصي بتمكين تحليل المشي2 كميزة تكميلية. حتى عندما يرتدي عاملان نفس السترة، تختلف أنماط مشيهما بما يكفي للنظام للحفاظ على مسارات منفصلة.

إعادة التعريف مقابل تتبع الحركة البسيط

الميزة تتبع الحركة البسيط تتبع إعادة التعريف
يتعامل مع تغيير الاتجاه لا - يفقد الهدف نعم - يطابق بالمظهر
يتعامل مع الانسداد المؤقت جزئي - 1-2 ثانية كحد أقصى نعم - حتى 60 ثانية
فصل الأهداف المتعددة ضعيف — غالبًا ما تتبادل المعرفات قوي — متجهات فريدة لكل شخص
تكلفة الحوسبة منخفض جدًا معتدل
أفضل حالة استخدام مجال مفتوح، هدف واحد مواقع معقدة، أشخاص متعددون

هل سيؤدي الذكاء الاصطناعي إلى تشغيل تنبيه إذا كانت أرجل الشخص أو جذعه فقط مرئية في الإطار؟

يحدث هذا أكثر مما يتوقع الناس. قد يُظهر الشخص خلف جدار نصفي أو سياج أو آلة متوقفة أجزاءً جزئية من الجسم فقط. إذا كان نظامك يحتاج إلى جسم كامل لتشغيله، فلديك نقطة عمياء.

نعم، سيقوم النظام بتشغيل تنبيه عند رؤية جزء من الجسم. تم تصميم نموذج الرأس والكتفين خصيصًا لسيناريوهات الجزء العلوي من الجسم فقط. بالنسبة للحالات التي يظهر فيها الجزء السفلي من الجسم فقط (الساقين مرئيتين أسفل حاجز)، يستخدم نموذج الجسم الكامل اكتشاف أزواج الأطراف — التعرف على ساقين بأنماط مشي بشرية كدليل كافٍ لتصنيف الهدف كإنسان.

كاميرا أمنية بتقنية الذكاء الاصطناعي للكشف عن الأجزاء الجزئية من الجسم كاميرا أمنية بتقنية الذكاء الاصطناعي للكشف عن الأجزاء الجزئية من الجسم

كيف يعمل الكشف الجزئي عمليًا

يقوم خط أنابيب الكشف بتشغيل مصنفات متعددة بالتوازي. لا ينتظر “شخصًا كاملاً” واحدًا” مربع محيط4. بدلاً من ذلك، يبحث عن مجموعات أجزاء الجسم التي تنتمي إحصائيًا إلى إنسان.

الجزء العلوي من الجسم فقط (الرأس، الكتفين، الجذع)

هذه هي الحالة الأسهل. تم بناء نموذج الرأس والكتفين لهذا السيناريو بالضبط. الشكل المقلوب “U” لرأس وكتفي الإنسان هو أحد أكثر الأشكال تميزًا في الطبيعة. لا يوجد حيوان أو شيء شائع يكرره بنفس الحجم والنسب.

عندما يكون الجزء العلوي من الجسم مرئيًا فقط:

  • يقوم النظام بتشغيل مصنف الرأس والكتفين أولاً
  • إذا تجاوزت الثقة 0.8، يتم التشغيل فورًا
  • ثم يحاول PTZ التكبير أو التحريك للكشف عن المزيد من الهدف للتأكيد الثانوي

الجزء السفلي من الجسم فقط (الساقين، القدمين)

هذا أصعب. قد يكون شكلان عموديان يتحركان بأنماط متناوبة عبارة عن ساقين بشريتين، ولكنهما قد يكونان أيضًا أعمدة سياج تتأرجح في الرياح. يستخدم النظام ثلاث عمليات تحقق:

  1. نسبة العرض إلى الارتفاع: للساقين البشريتين نسبة عرض إلى ارتفاع محددة تختلف عن أعمدة أو دعامات السياج.
  2. المفصل: تنثني الساقان عند الركبة. يبحث النظام عن تغيرات دورية في الزاوية في نقطة منتصف.
  3. تردد المشي: المشي البشري له إيقاع يتراوح تقريبًا بين 1.5 و 2.5 خطوة في الثانية. يتحقق النظام مما إذا كان تردد الحركة يقع ضمن هذا النطاق.

إذا نجحت عمليات التحقق الثلاث، يصنف النظام الهدف على أنه “إنسان محتمل” ويطلق تنبيهًا منخفض الثقة. ثم يأمر الكاميرا المتحركة بإعادة التموضع للحصول على زاوية أفضل.

الجذع فقط (بدون رأس، بدون أرجل)

هذا هو سيناريو الكشف الجزئي الأكثر تحديًا. قد يكون الجذع بدون رأس أو أطراف لشخص خلف جدار، أو قد يكون جسمًا متحركًا مثل عربة. في هذه الحالة، يقوم النظام بما يلي:

  • يصنف الكشف على أنه “غير مؤكد”
  • يثبت الكاميرا المتحركة على الهدف لمدة 3-5 ثوانٍ
  • ينتظر ظهور أي جزء إضافي من الجسم
  • إذا لم تظهر أي أدلة إضافية، فإنه يسجل الحدث ولكنه لا يرسل تنبيهًا عبر 4G

هذا النهج المتدرج يحافظ على انخفاض استخدام بيانات الهاتف المحمول مع الاستمرار في التقاط التهديدات المحتملة.

تكوين الحساسية لموقعك

بالنسبة للمواقع التي تحتوي على العديد من سيناريوهات العرض الجزئي (المستودعات، المجمعات المسورة)، أوصي بخفض الحد الأدنى لعتبة الثقة من 0.8 إلى 0.65 وتمكين وضع الكشف “للجسم الجزئي” في البرنامج الثابت. هذا يزيد من الحساسية على حساب المزيد من التنبيهات للمراجعة. بالنسبة لعمليات النشر في الحقول المفتوحة حيث تكون الأجسام الكاملة مرئية دائمًا تقريبًا، احتفظ بالعتبة الافتراضية لتقليل الضوضاء.

هل يقلل نموذج الرأس والكتفين من الإنذارات الكاذبة التي تسببها الحيوانات الكبيرة في مواقع المزارع؟

عمليات النشر في المزارع هي أسوأ حالة للإنذارات الكاذبة. الغزلان والقيوط والكلاب الكبيرة والماشية كلها تثير كشف الحركة الأساسي. إذا كان كل حيوان يعبر يولد إشعارًا فوريًا عبر 4G في الساعة 3 صباحًا، فسيقوم عميلك بتعطيل النظام في غضون أسبوع.

نعم، نموذج الرأس والكتفين يقلل بشكل كبير من الإنذارات الكاذبة التي تسببها الحيوانات. الفرق الرئيسي هو الهندسة الهيكلية: لدى البشر أكتاف أفقية متعامدة على رقبة عمودية، مما يشكل شكل “U” مقلوب. لا يوجد حيوان رباعي الأرجل يكرر هذا الهيكل. حتى الحيوانات الكبيرة مثل الغزلان أو الخيول لديها خط مائل من الرقبة إلى الظهر يقوم النموذج بتصفيته بشكل صريح.

كاميرا أمنية للمزرعة إنذار كاذب فلتر حيوانات كاميرا أمنية للمزرعة إنذار كاذب فلتر حيوانات

لماذا تخدع الحيوانات أنظمة الكشف الأساسية

يعتمد الكشف الأساسي عن الحركة وحتى بعض أنظمة “الكشف عن البشر” منخفضة المستوى على حجم مربع الإحاطة البسيط كمرشح أساسي لها. غزال كبير على بعد 30 مترًا ينتج مربع إحاطة بحجم مشابه لحجم إنسان على بعد 50 مترًا. بدون تحليل الشكل، لا يمكن للنظام التمييز بينهما.

تستخدم بعض الكاميرات الاقتصادية كاشفًا أحادي المرحلة يتحقق فقط مما إذا كان “هذا الكائن كبيرًا بما يكفي ويتحرك؟”. هذا النهج يفشل تمامًا في المزارع والمواقع الريفية.

كيف يحل نهجنا متعدد الطبقات هذه المشكلة

تعمل خط أنابيب الكشف لوضع المزرعة على النحو التالي:

  1. مشغل الحركة: يتحرك شيء ما في الإطار. يستيقظ النظام.
  2. مرشح مسبق لكامل الجسم: هل نسبة العرض إلى الارتفاع للكائن وسرعة حركته متسقة مع الإنسان؟ إذا كانت الإجابة بنعم، تابع. إذا تحرك الكائن على أربع أرجل أو كان له محور جسم أفقي، يتم تمييزه على أنه “حيوان” ويتم قمعه.
  3. تأكيد الرأس والكتفين: هل يُظهر الجزء العلوي من الكائن نمط “U” المقلوب؟ هذا هو الفحص الحاسم.
  4. التحقق من الحجم: هل حجم بكسل الكائن ضمن النطاق المتوقع للإنسان على هذا البعد؟ (باستخدام البعد البؤري المعروف للكاميرا وزاوية الميل لتقدير المسافة.)

الاختلافات الهيكلية بين الحيوانات والبشر

نموذج الرأس والكتفين يستغل الاختلافات التشريحية الأساسية:

  • البشر: رقبة عمودية، خط كتف أفقي، رأس متمركز فوق الكتفين
  • الغزلان/الخيول: الرقبة تمتد للأمام بزاوية 45-60 درجة، لا يوجد خط كتف أفقي
  • الكلاب/القيوط: الرأس أمام مركز الجسم، وعرض الكتفين ضيق بالنسبة لطول الجسم
  • الدببة (واقفة): الأقرب إلى الشكل البشري، ولكن نسبة الكتف إلى الرأس ووضع الذراع يختلفان بشكل كبير

تقليل الإنذارات الكاذبة في العالم الحقيقي

بناءً على بيانات ميدانية من تركيبات المزارع في تكساس وألبرتا، فإن تمكين مرشح الرأس والكتف يقلل من الإنذارات الكاذبة التي تسببها الحيوانات بنسبة 85-95%. عادة ما تأتي نسبة 5-15% المتبقية من الإنذارات الكاذبة من:

  • الدببة واقفة (نادرة ولكن ممكنة)
  • الطيور الكبيرة تهبط على أعمدة السياج عن قرب (الظل يشبه الرأس لفترة وجيزة)
  • فزاعات أو دمى (يتم اكتشافها بشكل صحيح على أنها “شبيهة بالبشر” - لا يمكن للنظام معرفة أنها ليست حقيقية)

تكوين المزرعة الموصى به

الإعداد القيمة الموصى بها السبب
وضع الكشف أولوية الرأس والكتف يقوم بتصفية الحيوانات رباعية الأرجل بفعالية
الحد الأدنى لحجم البكسل 40×40 يتجاهل الحيوانات الصغيرة (الأرانب، الطيور)
حساسية الحركة متوسط يقلل من تشغيلات الرياح/النباتات
فترة تهدئة التنبيه 30 ثانية يمنع التنبيهات المتكررة من نفس الحيوان
وضع الليل ليزر الأشعة تحت الحمراء + مساعدة حرارية يحافظ على وضوح الشكل في الظلام

لمشاريع المزارع، أقترح أيضًا ضبط علامة “قمع الحيوانات” في البرنامج الثابت. هذا يضيف 200 مللي ثانية إضافية من وقت المعالجة لكل اكتشاف ولكنه يقلل حجم الإنذارات الكاذبة بمقدار عشرة أضعاف. في اتصال 4G حيث تكلف كل تنبيه عرض النطاق الترددي والبطارية، فإن هذه المقايضة تستحق العناء في كل مرة.

الخاتمة

اكتشاف الإنسان في كاميرات PTZ6 ليس خوارزمية واحدة - بل هو نظام طبقي. اكتشاف كامل الجسم يتعامل مع المدى الطويل. تصفية الرأس والكتفين تقضي على الإنذارات الكاذبة. يحافظ Re-ID على التتبع عبر الانسدادات. معًا، يقدمون أداءً موثوقًا به عبر مشاريع المزارع والبناء وأمن المحيط.


1. تعريف واستخدام التشابه الجيبي لمقارنة متجهات الميزات في الاسترجاع والمطابقة. ︎↩︎ 2. تعلم كيف تُستخدم أنماط المشي كقياسات حيوية لتحديد هوية الإنسان. ︎↩︎ 3. فهم نسبة العرض إلى الارتفاع في معالجة الصور لاكتشاف وتصنيف الكائنات. ︎↩︎ 4. مفهوم مربعات التحديد المستخدمة في اكتشاف الكائنات لتحديد مواقع الكائنات داخل الصورة. ︎↩︎ 5. التعريف العام للإنذارات الكاذبة وتأثيرها على موثوقية نظام الأمان. ︎↩︎ 6. مقدمة لكاميرات التحريك والإمالة والتكبير وتطبيقاتها في المراقبة. ︎↩︎ 7. شرح التكبير البصري مقابل التكبير الرقمي في أجهزة التصوير. ︎↩︎ 8. فهم أساسيات اكتشاف الأشخاص بكامل الجسم في رؤية الكمبيوتر. ︎↩︎

هل أنت مستعد لتأمين مشروعك؟

احصل على المواصفات الفنية الكاملة، وأسعار الجملة، والحل المخصص لمتطلباتك الخاصة من أجهزة PTZ والطاقة الشمسية.

الاستجابة خلال 24 ساعة

هل تحتاج إلى حل شمسي مصمم خصيصاً لمشروعك؟

راجع الأدلة الفنية التي يراجعها الخبراء لدينا أو اطلب خطة إعداد مخصصة. يساعدك فريقنا الهندسي على مطابقة مجموعة أدوات الطاقة الشمسية المثالية لمتطلبات كاميرا PTZ الخاصة بك.