التعرف على الوجه في الممارسة: 21 خطوة
التعرف على الوجه في الممارسة: 21 خطوة
Anonim
Image
Image

هذا موضوع أنا مفتون به للغاية ، لدرجة أنه يجعلني أفقد النوم: رؤية الكمبيوتر ، واكتشاف الأشياء والأشخاص من خلال نموذج مدرب مسبقًا.

الخطوة 1: مقدمة

مقدمة
مقدمة

سنستخدم خوارزمية YoloV3 لتشغيل تطبيق وتشغيل المشروع.

لقد عملت مع الشبكة العصبية منذ 15 عامًا ويمكنني القول إنها كانت أوقاتًا "صعبة" ، نظرًا للموارد المتاحة في ذلك الوقت.

الخطوة 2: الموارد المستخدمة

كاميرا لوجيتك C270

· الحاسوب

· NVIDIA GeForce GTX 1660

الخطوه 3:

صورة
صورة

الخطوة 4: المتطلبات الأساسية

المتطلبات الأساسية
المتطلبات الأساسية
المتطلبات الأساسية
المتطلبات الأساسية

لتشغيل الشبكات العصبية العميقة (DNN) ، من الضروري استخدام الحوسبة المتوازية ، مع وحدة معالجة الرسومات (GPU).

لذلك ستحتاج إلى بطاقة فيديو قوية من NVIDIA وتشغيل الخوارزمية باستخدام CUDA API (مجموعة تعليمات GPU الافتراضية).

لتشغيل الخوارزمية ، يجب أولاً تثبيت الحزم التالية:

- محرك بطاقة الفيديو NVIDIA

- كودا

- CUDNN (مكتبة الشبكة العصبية العميقة CUDA)

- OpenCV

الخطوة 5: متطلبات الكمبيوتر

متطلبات الكمبيوتر
متطلبات الكمبيوتر

الخطوة 6: إعداد YOLO

قم بإعداد YOLO
قم بإعداد YOLO

الكشف باستخدام نموذج مدرب مسبقًا

افتح الجهاز وأدخل الأوامر أعلاه.

الخطوة 7: تعديل MakeFile

تعديل MakeFile
تعديل MakeFile

قم بتعديل ملف "MakeFile" كما في الشكل أعلاه ، لأننا سنستخدم معالجة GPU و CUDNN و OpenCV. بعد التعديل ، قم بتشغيل الأمر "make".

الخطوة 8: انتظر حتى يكتمل

انتظر حتى يكتمل
انتظر حتى يكتمل

سيجمع الأمر "make" في الخطوة 7 كل شيء لتستخدمه الخوارزميات ، ويستغرق تشغيله بعض الوقت.

الخطوة 9: لأجهزة الكمبيوتر التي لا تتوافق مع المتطلبات

لأجهزة الكمبيوتر التي لا تتوافق مع المتطلبات
لأجهزة الكمبيوتر التي لا تتوافق مع المتطلبات

إذا لم يكن الكمبيوتر وبطاقة الفيديو لديك بنفس القوة أو إذا كنت تريد أداءً أفضل ، فقم بتغيير الملف "cfg /yolov3.cfg".

تم استخدام التكوين أعلاه في هذا المشروع.

الخطوة 10: YOLO V3.0

يولو V3
يولو V3

عادةً ما تقوم أنظمة الكشف بتطبيق النموذج على صورة في عدة مواقع ومقاييس مختلفة.

يطبق YOLO شبكة عصبية واحدة على الصورة بأكملها. تقسم هذه الشبكة الصورة إلى مناطق وتوفر مربعات محيطية واحتمالات لكل منطقة.

تتمتع YOLO بالعديد من المزايا. ترى الصورة ككل ، لذلك يتم إنشاء تنبؤاتها من خلال السياق العام في الصورة.

يقوم بعمل تنبؤات بتقييم شبكة واحدة ، على عكس R-CNN الذي يقوم بآلاف التقييمات لصورة واحدة.

إنه أسرع 1000 مرة من R-CNN وأسرع 100 مرة من Fast R-CNN.

الخطوة 11: تشغيل YOLO

تشغيل YOLO
تشغيل YOLO
تشغيل YOLO
تشغيل YOLO

لتشغيل YOLO ، ما عليك سوى فتح الجهاز في مجلد "darknet" وإدخال الأمر.

يمكنك تشغيل YOLO بأربع طرق:

· صورة

· صور متعددة

· الجري (كاميرا ويب)

· فيديو

الخطوة 12: YOLO V3 - صورة

YOLO V3 - صورة
YOLO V3 - صورة

ضع الصورة التي تريدها في مجلد "البيانات" داخل darknet وبعد ذلك قم بتشغيل الأمر أعلاه بتعديل اسم الصورة.

الخطوة 13: YOLO V3 - إدخال الصورة

YOLO V3 - إدخال الصورة
YOLO V3 - إدخال الصورة

الخطوة 14: YOLO V3 - صورة الإخراج

YOLO V3 - إخراج الصورة
YOLO V3 - إخراج الصورة

الخطوة 15: YOLO V3 - صور متعددة

YOLO V3 - صور متعددة
YOLO V3 - صور متعددة

ضع الصور في مجلد ما ، وبدلاً من توفير مسار الصورة ، اتركها فارغة وقم بتشغيل الأمر كما ترى أعلاه (في اليسار).

بعد ذلك ، سيظهر شيء مثل الشكل في اليمين ، فقط ضع مسار الصورة وانقر على "دخول" وكرر هذه الخطوات لعدة صور.

الخطوة 16: YOLO V3 - WebCam

YOLO V3 - كاميرا الويب
YOLO V3 - كاميرا الويب

قم بتشغيل الأمر أعلاه وبعد تحميل الشبكة ، ستظهر كاميرا الويب.

الخطوة 17: YOLO V3 - فيديو

YOLO V3 - فيديو
YOLO V3 - فيديو

ضع الفيديو الذي تريده في مجلد "البيانات" داخل darknet وبعد ذلك قم بتشغيل الأمر أعلاه بتعديل اسم الفيديو.

الخطوة 18: YOLO V3 - EXPO3D Video 1

YOLO V3 - فيديو EXPO3D 1
YOLO V3 - فيديو EXPO3D 1

الخطوة 19: YOLO V3 - Video EXPO3D 2

YOLO V3 - فيديو EXPO3D 2
YOLO V3 - فيديو EXPO3D 2

الخطوة 20: YOLO V3 - Video EXPO3D 3

YOLO V3 - فيديو EXPO3D 3
YOLO V3 - فيديو EXPO3D 3

الخطوة 21: تنزيل ملف PDF

تنزيل ملف PDF (باللغة البرتغالية البرازيلية)