جدول المحتويات:

أضف صوت بدء تشغيل إلى Google AIY Voice Kit: 6 خطوات (بالصور)
أضف صوت بدء تشغيل إلى Google AIY Voice Kit: 6 خطوات (بالصور)

فيديو: أضف صوت بدء تشغيل إلى Google AIY Voice Kit: 6 خطوات (بالصور)

فيديو: أضف صوت بدء تشغيل إلى Google AIY Voice Kit: 6 خطوات (بالصور)
فيديو: Установите Google Assistant на Raspberry Pi 2024, يوليو
Anonim
Image
Image
الخطوة 2: تحقق من ملف Voicehat.py لمزيد من المعلومات
الخطوة 2: تحقق من ملف Voicehat.py لمزيد من المعلومات

هذا البرنامج التعليمي بسيط جدًا. لقد كنت أستمتع حقًا بـ Google AIY Voice Kit ، لكنني أحب حقًا في جهاز Google Home العادي الخاص بي الضوضاء التي يصدرونها لتأكيد أنهم يستمعون بنشاط. لم يتم الإعداد افتراضيًا في أي من الأمثلة التي تم تحميلها مسبقًا على صورة AIY Voice Kit.

أقوم أيضًا بتضمين رابط إلى بدء تشغيل الأسهم وتأكيد الضوضاء التي سجلتها من جهاز Google Home الفعلي الخاص بي باستخدام مسجل Zoom الخاص بي.

هنا نذهب - أول تعليمات لي!

الخطوة 1: المواد والملفات المطلوبة

  1. مجموعة أدوات Google AIY الصوتية التي تعمل بكامل طاقتها - لإعداد مجموعة أدواتك ، تفضل بزيارة صفحة AIY Voice Kit الرسمية.
  2. القدرة على الوصول إلى محطة Pi الخاصة بك عبر SSH أو VNC أو باستخدام شاشة ولوحة مفاتيح
  3. ملف. Wav الذي تريد تشغيله عندما يستمع Pi للإدخال الصوتي - إذا لم تكن تستخدم ملفًا مخصصًا ، فقم بتنزيل ملف St art Talking القياسي هنا أو قم بتنزيله من الرابط المرفق.
  4. (اختياري) محرر صوت يمكنه تحويل الملفات وتغيير معدل البت والعينة

الخطوة 2: الخطوة 2: تحقق من ملف Voicehat.py لمزيد من المعلومات

الأهمية

لا أستخدم أحدث صورة في مجموعة الأدوات الصوتية الخاصة بي والتي تتضمن رمز كل من مجموعة أدوات الصوت والرؤية (أي aiyprojects-2018-01-03.img). أنا أستخدم الرمز من فرع Voice Kit الذي يمكن العثور عليه في Google AIY Raspbian GitHub. رأيي الشخصي هو فقط استخدام فرع Voice Kit لتبسيط الأمر ولست بحاجة إلى التعامل مع رمز Vision عندما تعمل مع حزمة الصوت الخاصة بك

الانتقال …

هذه الخطوة ليست إلزامية تمامًا ، ولكنها ستوضح لك المكان الذي دفنت فيه Google التعليمات الخاصة بهذا العمل إذا كنت تريد اتخاذ هذه الخطوة إلى الأمام أو فهم سبب عمل الكود الذي أقوم بإضافته.

pi @ raspberry: cd AIY-voice-kit-python / src / aiy /

ثم سنقوم بفحص ملف voicehat.py في هذا المجلد:

pi @ raspberry: ~ / AIY-voice-kit-python / src / aiy / sudo nano voicehat.py

تُظهر الصورة المرفقة أين يمكنك التعرف على واجهات مستخدم الحالة وكيفية استخدام صوت أثناء المشغل.

حسنًا ، دعنا الآن نضيف بعض التعليمات البرمجية إلى أحد ملفات الأمثلة لتشغيل هذا الشيء.

الخطوة 3: الخطوة 3: أضف رمز صوت المشغل إلى الكود التجريبي

الخطوة 3: أضف رمز صوت المشغل إلى الشفرة التجريبية
الخطوة 3: أضف رمز صوت المشغل إلى الشفرة التجريبية

أولاً ، انتقل إلى مجلد AIY-voice-kit-python وقم بتشغيل الكود المصدري

قرص مضغوط AIY- مجموعة صوت- بيثون

مصدر البيئة / بن / التنشيط

قرص مضغوط src

ثم استخدم "sudo nano" في "assistant_grpc_demo.py" أو "assistant_library_demo.py"

الاختلاف بين الملفين هو أن assistant_grpc_demo.py يستخدم الزر لتشغيل مساعد Google ويستخدم Assistant_library_demo.py كلمة التنشيط "Ok، Google" لتشغيل مساعد Google.

لكل من هذين الملفين ، تحتاج فقط إلى إضافة سطر واحد من التعليمات البرمجية:

status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav')

يفترض هذا أنك وضعت صوت البداية في المجلد / home / pi / وقمت بتسميته googlestart.wav. قم بتغييرها بناءً على ما قمت بتسميته ملفك وأينما كنت.

سطر الكود الذي نبحث عنه أدناه:

status_ui.status ("مستمع")

نريد إضافة سطر جديد من التعليمات البرمجية قبل هذا السطر من التعليمات البرمجية …

بالنسبة لمثال "assistant_library_demo.py" ، يمكن العثور عليه هنا:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# والآن أضف الكود الخاص بنا status_ui.set_trigger_sound_wave ('home / pi / googlestart.wav') status_ui.status ('listen')

بالنسبة لمثال "assistant_grpc_demo.py" ، يمكن العثور عليه هنا:

button.wait_for_press ()

# والآن أضف حالة الكود الخاص بنا status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav') status_ui.status ('استماع')

يفترض هذا أنك وضعت صوت البداية في المجلد / home / pi / وقمت بتسميته googlestart.wav. قم بتغييرها بناءً على ما قمت بتسميته ملفك وأينما كنت.

اضغط على CTRL-X & Y لحفظ كل شيء.

*** ملاحظة: لقد وجدت شيئًا أخرق قليلاً. بالنسبة لـ "assistant_library_demo.py" ، يبدو أن إضافة صوت المشغل لا تحدث أي فرق في وظيفة التعرف على الكلام. بالنسبة لـ'ssist_grpc_demo.py 'على الرغم من ذلك ، يبدو أنه عندما يكون لديك صوت المشغل مطبقًا ، فإنه يقطع الكلمة الأولى أو كلمتين قلتهما. لست متأكدا تماما لماذا. لا تزال تحاول معرفة ذلك.

الخطوة 4: الخطوة 4: قم بتشغيل الكود وتأكد من أن كل شيء على ما يرام

pi @ raspberry: cd AIY-voice-kit-python

وتحميل Virtualenv

pi @ raspberry: ~ / AIY-voice-kit-python $ source env / bin / Activ

وتشغيله!

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / assistant_library_demo.py

أو

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / assistant_grpc_demo.py

قل الآن "Okay، Google" أو اضغط على هذا الزر وشاهد ما إذا كان يعمل!

ستساعدك الصفحة التالية في معرفة ما إذا كان لديك ملف مخصص خاص بك ومعدلات البت والعينات المناسبة لملف.wav الخاص بك

الخطوة 5: الخطوة 5: قم بإنشاء ملف wav الخاص بك

الخطوة 5: قم بإنشاء ملف wav الخاص بك
الخطوة 5: قم بإنشاء ملف wav الخاص بك

إذا لم تكن مهتمًا باستخدام ملف.wav الخاص بي لصوت بدء تشغيل Google Home القياسي ، فستحتاج إلى إنشاء ملف.wav الخاص بك. استغرق الأمر قليلًا من التجربة والخطأ للحصول على معدل البت والعينة الصحيحين للعمل من أجلي.

لقد استخدمت Logic Pro X للقيام بجميع عمليات التحرير (في الصورة) ، وهي منصة عمل صوتية مكتملة لإنشاء الموسيقى وإنتاجها. هناك خياران وجدتهما مناسبين هما Switch أو MediaHuman Audio Converter. أفترض أنه يمكنك القيام بذلك باستخدام Garageband إذا كان لديك جهاز Mac ، لكنني لم أجرب ذلك.

هناك ثلاثة أجزاء رئيسية من ملفك مطلوبة للعمل مع الشفرة التجريبية.

  1. يجب أن يكون ملف صوتي أحادي
  2. يجب أن يكون معدل العينة 32000
  3. يجب أن يكون ملف.wav
  4. (اختياري) دقة 16 بت عملت بشكل أفضل بالنسبة لي

الخطوة 6: الخطوة 6: إضافة صوت التأكيد؟

هذا هو المكان الذي أكون فيه عالقًا إذا كان لدى أي شخص أي أفكار. أرغب في إضافة ضوضاء التأكيد إذا تعرف النظام على الإدخال الصوتي كما هو الحال في صفحة Google الرئيسية العادية.

لقد أرفقت ضوضاء تأكيد المخزون أدناه لراحتك.

يتمتع!

موصى به: