نظام كامارا مدرك لمكبر الصوت (SPACS): 8 خطوات

جدول المحتويات:

الخطوة 1: المواد
الخطوة 2: الأجهزة - الطباعة ثلاثية الأبعاد
الخطوة 3: الأجهزة - المكونات الإلكترونية
الخطوة 4: البرمجيات
الخطوة 5: البرمجيات - الصوت
الخطوة 6: البرمجيات - كشف الوجه والتحدث
الخطوة 7: البرنامج - محرك دوار
الخطوة 8: التحسينات المستقبلية

2025 مؤلف: John Day | [email protected]. آخر تعديل: 2025-01-23 12:54

تخيل مكالمة جماعية حيث تحيط عدة مكبرات صوت بكاميرا واحدة. غالبًا ما نواجه حيث غالبًا ما تفشل زاوية الرؤية المحدودة للكاميرا في التحديق في الشخص الذي يتحدث. هذا القيد على الأجهزة يقلل بشكل كبير من تجربة المستخدم. إذا تمكنت الكاميرا من التحديق في مكبرات الصوت النشطة ، فسيكون الجمهور البعيد أكثر انخراطًا في محادثة أثناء المكالمة. في هذا المشروع ، نقترح نظام كاميرا (نموذج أولي) يكتشف ويتبع السماعة النشطة عن طريق توجيه الكاميرا نحو السماعة. يستخدم النظام كلاً من النهج المرئي والمسموع. عندما يتم الكشف عن الوجوه من الكاميرا ، فإنها تحدد الشخص الذي يتحدث وتحسب زاوية التدوير. عندما لا يتم اكتشاف الوجوه بالزاوية الحالية ، يبحث النظام عن مكبر الصوت بناءً على اتجاه الإشارات الصوتية التي تصل.

الخطوة 1: المواد

ريشة Adafruit nRF52840 Express X 1

www.adafruit.com/product/4062

مضخم ميكروفون كهربائي - MAX4466 X 2

www.adafruit.com/product/1063

محرك سيرفو صغير X 1

www.adafruit.com/product/169

هاتف Android الذكي X 1

الخطوة 2: الأجهزة - الطباعة ثلاثية الأبعاد

للتنفيذ السريع ، قررنا طباعة العبوات ثلاثية الأبعاد التي نحتاجها. هناك نوعان من المكونات الرئيسية للمرفقات ؛ منصة دوارة وحامل هاتف ذكي. استخدمنا القرص الدوار من هذا الرابط (https://www.thingiverse.com/thing:141287) ، حيث يوفر علبة Arduino في الأسفل وطاولة دوارة يمكن توصيلها بمحرك مؤازر. استخدمنا حامل هاتف ذكي من هذا الرابط (https://www.thingiverse.com/thing:2673050) ، وهو قابل للطي وقابل لتعديل الزاوية بحيث يسمح لنا بمعايرة الزاوية بشكل ملائم. يوضح الشكل أدناه الأجزاء المطبوعة ثلاثية الأبعاد مجمعة معًا.

الخطوة 3: الأجهزة - المكونات الإلكترونية

هناك أربعة مكونات سلكية ؛ ريشة Adafruit وميكروفونات ومحرك. بالنسبة للعبوة المدمجة ، قمنا بلحام الأسلاك (الدوائر الرمادية) دون استخدام لوح التجارب. يصف أدناه مخطط الدائرة والقطعة الأثرية الفعلية.

الخطوة 4: البرمجيات

يستخدم نظامنا بشكل أساسي المعلومات المرئية من التعرف على الوجوه لمتابعة المتحدث لأنه أكثر دقة. لكي تحصل الريشة على معلومات مرئية من تطبيق Android ، نستخدم Bluetooth Low Energy كطريقة اتصال رئيسية.

عند اكتشاف أي وجه ، يحسب التطبيق الزاوية التي يحتاجها المحرك لتدويرها لتركيز السماعة في مركز الإطار. لقد حللنا السيناريوهات المحتملة وتعاملنا مع ما يلي:

إذا تم اكتشاف الوجه (الوجه) والتحدث ، فإنه يحسب نقطة المنتصف للسماعات ويعيد الزاوية النسبية إلى الريش.
إذا تم اكتشاف وجه (وجوه) ولم يتحدث أي منهم ، فإنه يحسب أيضًا نقطة منتصف الوجوه ويعيد الزاوية وفقًا لذلك.
إذا لم يتم اكتشاف أي وجه ، يقوم النظام بتغيير منطق تتبع السماعات من المرئي إلى الصوت.

يوجد برنامج SPACS على

الخطوة 5: البرمجيات - الصوت

الصوت (YH)

لتحديد مصدر الصوت الوارد ، حاولنا أولاً استخدام فارق التوقيت بين الميكروفونات. لكنها لم تكن دقيقة بالقدر الذي توقعناه لأن معدل أخذ العينات (~ 900 هرتز) من Arduino Leopard ، حيث اختبرنا الإشارات الصوتية ، كان بطيئًا بحيث لا يمكنه التقاط الفارق الزمني بين الميكروفونات التي يبلغ طولها 10 سم.

قمنا بتغيير الخطة لاستخدام فرق الشدة بين إشارتا صوت الإدخال. ونتيجة لذلك ، تأخذ الريشة إشارتين صوتيتين وتعالجهما لاكتشاف مصدر الصوت. يمكن وصف المعالجة بالخطوات التالية:

خذ المدخلات من اثنين من الميكروفونات واطرح الإزاحة للحصول على اتساع الإشارات.
قم بتجميع القيم المطلقة للسعات لكل MIC لـ 500 بيك آب.
احفظ اختلاف القيم المتراكمة في قائمة الانتظار التي تحتوي على 5 فتحات.
إرجاع مجموع قوائم الانتظار كقيمة الفرق النهائية.
قارن القيمة النهائية بالحدود لتقرر مصدر الصوت.

لقد وجدنا العتبة من خلال رسم القيمة النهائية في ظروف مختلفة بما في ذلك الصوت القادم من اليسار واليمين. علاوة على عتبات القيمة النهائية ، قمنا أيضًا بتعيين عتبة أخرى لمتوسط السعات المتراكمة في الخطوة 2 لتصفية الضوضاء.

الخطوة 6: البرمجيات - كشف الوجه والتحدث

للتعرف على الوجوه ، استخدمنا ML Kit for Firebase التي أصدرتها Google (https://firebase.google.com/docs/ml-kit). توفر ML Kit واجهة برمجة تطبيقات اكتشاف الوجه التي تعيد المربع المحيط لكل وجه ومعالمه ، بما في ذلك العيون والأنف والأذنان والخدين ونقاط مختلفة على الفم. بمجرد اكتشاف الوجوه ، يتتبع التطبيق حركة الفم لتحديد ما إذا كان الشخص يتحدث أم لا. نحن نستخدم نهجًا بسيطًا قائمًا على العتبة والذي ينتج عنه أداء موثوق. لقد استفدنا من حقيقة أن حركة الفم تزداد أفقيًا وعموديًا عندما يتحدث الشخص. نحسب المسافة الرأسية والأفقية للفم ونحسب الانحراف المعياري لكل مسافة. المسافة طبيعية لحجم الوجه. يشير الانحراف المعياري الأكبر إلى التحدث. هذا النهج له قيود على أن كل نشاط يتضمن حركة الفم ، بما في ذلك الأكل والشرب أو التثاؤب ، يمكن التعرف عليه على أنه حديث. لكن لديها معدل سلبي كاذب منخفض.

الخطوة 7: البرنامج - محرك دوار

لم يكن دوران المحرك مباشرًا كما توقعنا بسبب التحكم في سرعة الدوران. للتحكم في السرعة ، نعلن عن متغير عداد عام يسمح للمحرك بالدوران فقط عندما يصل المتغير إلى قيمة معينة. لقد أعلنا أيضًا عن متغير عالمي آخر يشير إلى ما إذا كان المحرك يتحرك لإعلام الميكروفونات حتى يتمكن من تجنب الصوت الصادر من دوران المحرك.

الخطوة 8: التحسينات المستقبلية

أحد القيود هو أن المحرك يصبح متذبذبًا في زوايا معينة. يبدو أن المحرك ليس قويًا بما يكفي للتغلب على عزم الدوران الناتج عن تدوير الهاتف الذكي. يمكن حلها باستخدام محرك أكثر قوة أو ضبط موضع الهاتف الذكي باتجاه مركز الدوران لتقليل عزم الدوران.

يمكن تحسين اكتشاف الاتجاه الصوتي باستخدام طريقة أكثر تعقيدًا. نود أن نجرب نهجًا لتشكيل الحزمة الصوتية لتحديد اتجاه الصوت الوارد. لقد حاولنا مع وقت وصول الإشارات الصوتية. لكن معدل أخذ عينات الريشة محدود لاكتشاف فارق التوقيت عندما تكون الميكروفونات على بعد حوالي 10 سم فقط.

الجزء الأخير المفقود من هذا النموذج الأولي هو تقييم قابلية الاستخدام. إحدى الطرق الواعدة للتقييم هي دمج النظام مع النظام الأساسي الحالي لمكالمات الفيديو ومراقبة ردود المستخدمين. ستساعد هذه الردود على تحسين النظام وإجراء التكرار التالي لهذا النموذج الأولي.

موصى به:

كيفية عمل Tone Control LM358 لمكبر الصوت 2.1: 7 خطوات (بالصور)

كيفية عمل Tone Control LM358 لـ Amplifier 2.1: لذلك على قناة Youtube الخاصة بي ، يسأل الكثير من الناس عن كيفية دمج مضخمين في واحد. يستخدم مكبر الصوت الأول لسماعات الأقمار الصناعية ويستخدم مكبر الصوت الثاني لمكبرات الصوت مضخم الصوت. يمكن تسمية تكوين تثبيت مكبر الصوت هذا بـ Amp

كيفية جعل الترانزستور 3055 لمكبر الصوت: 8 خطوات

كيف تصنع 3055 ترانزستور إلى مكبر صوت: مرحبًا يا صديق ، سأقوم اليوم بصنع مكبر صوت باستخدام 3055 ترانزستور معدني ، فلنبدأ ،

8550 الترانزستور لمكبر الصوت: 8 خطوات

8550 Transistor to Audio Amplifier: مرحبًا يا صديقي ، سأقوم اليوم بصنع مكبر صوت باستخدام الترانزستور 8550 هذه هي أسهل طريقة لصنع مكبر صوت ، فلنبدأ ،

كيفية توصيل وإعداد نظام Mini HiFi Shelf (نظام الصوت) بشكل صحيح: 8 خطوات (بالصور)

كيفية الاتصال بشكل صحيح وإعداد نظام Mini HiFi Shelf (نظام الصوت): أنا شخص يستمتع بالتعلم عن الهندسة الكهربائية. أنا مدرسة ثانوية في مدرسة آن ريتشاردز للقائدات الشابات. أنا أجعل هذه التعليمات لمساعدة أي شخص يريد الاستمتاع بموسيقاهم من Mini LG HiFi Shelf Syste

جعل مكبر الصوت يربك لمكبر الجيتار: 11 خطوة

جعل مكبر الصوت يربك لمضخم الجيتار: كيفية جعل مكبر الصوت يربك مضخم الجيتار

نظام كامارا مدرك لمكبر الصوت (SPACS): 8 خطوات

جدول المحتويات:

الخطوة 1: المواد

الخطوة 2: الأجهزة - الطباعة ثلاثية الأبعاد

الخطوة 3: الأجهزة - المكونات الإلكترونية

الخطوة 4: البرمجيات

الخطوة 5: البرمجيات - الصوت

الخطوة 6: البرمجيات - كشف الوجه والتحدث

الخطوة 7: البرنامج - محرك دوار

الخطوة 8: التحسينات المستقبلية

موصى به:

كيفية عمل Tone Control LM358 لمكبر الصوت 2.1: 7 خطوات (بالصور)

كيفية جعل الترانزستور 3055 لمكبر الصوت: 8 خطوات

8550 الترانزستور لمكبر الصوت: 8 خطوات

كيفية توصيل وإعداد نظام Mini HiFi Shelf (نظام الصوت) بشكل صحيح: 8 خطوات (بالصور)

جعل مكبر الصوت يربك لمكبر الجيتار: 11 خطوة

بناء بنك الطاقة في 2 دولار: 7 خطوات (بالصور)

قم ببناء جهاز مستشعر درجة حرارة Apple HomeKit (DHT22) باستخدام RaspberryPI و DHT22: 11 خطوة

PropHelix - عرض POV ثلاثي الأبعاد: 8 خطوات (بالصور)

6 واط + 6 واط مكبر صوت بلوتوث محمول: 6 خطوات

نقل الطاقة بملفتي تسلا: 7 خطوات (بالصور)

اصنع الفريت الخاص بك لتحسين المجالات المغناطيسية: 9 خطوات

إيقاف ومراقبة CNC عن بُعد: 11 خطوة (مع صور)

الحد الأدنى من برنامج Raspberry Pi Torrent Machine التعليمي: 4 خطوات (بالصور)

Drawbot !: 6 خطوات (بالصور)

دروس بصرية لصانع الروايات باستخدام Ren’Py: 5 خطوات

صندوق بومبوكس محمول يدوي الصنع: 20 خطوة (مع صور)

التعرف على الصور باستخدام TensorFlow على Raspberry Pi: 6 خطوات

Visuino Pro Macchina Interface OBDII ابدأ وميض LED: 3 خطوات

زرع الشعاب المرجانية: 4 خطوات (بالصور)

محفظة IoT (المحفظة الذكية مع Firebeetle ESP32 و Arduino IDE وجدول بيانات Google): 13 خطوة (بالصور)

مقياس Wi-Fi الذكي (مع ESP8266 و Arduino IDE و Adafruit.io و IFTTT): 18 خطوة (بالصور)