جدول المحتويات:

Sistem De Conversație Bazat Pe Inteligență Artificială: 6 خطوات
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 خطوات

فيديو: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 خطوات

فيديو: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 خطوات
فيديو: Machine intelligence makes human morals more important | Zeynep Tufekci 2024, شهر نوفمبر
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

مؤلف: ستانوت نيكولاي رادو

Grupa: 333 AB

ملحوظة: ٨

الخطوة 1: وصف الوظيفة

الوصف الوظيفي
الوصف الوظيفي

في المبادئ التوجيهية للنظام الأساسي

asistenților inteligeni pentru casă de tipul Google Assistant și Amazon Alexa ، useizatorii pot da comenzi vocale aparatului ، iar acesta va răspunde sau va face o anumită acțiune ، n funcție de cerinele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3، datorită faptului că dispune de Wi-Fi، acest lucru permițând conectarea la serviciul cloud Amazon، care va da „inteligen“sistemului.

Folosind serviciul de cloud și inteligen الاصطناعيةă de la Amazon، acest dispozitiv va avea o funcional الناحية العملية المطابقة لـ Amazon Alexa. مثال على ذلك نموذج افتراضي ثابت prezenta starea meteo ، poate ține minte notițe ، poate pune alarme ، dar din păcate (sau fericire؟) ، aceste lucruri depind în totalitate de Amazon ، iar comenzile dispozitivului se dau în limba engleză.

Ca i obiectiv secundar، voi încerca să Integrez limba română astfel ncât asistentul să poatănțelege i comenzi și de la persoane necunosctoare de limba engleză. بديل ثانٍ للأمان في حالة وجود آلية للأتمتة أو العملية أو النموذج الملائم أو الاستمرارية أو lumini أو oprirea unei prize. Desigur ، doar dacă API-ul Amazon و permite aceste lucruri.

سورسا بوز:

الخطوة 2: المكون

Pentru realizarea proiectului am avut nevoie de următoarele componente:

  1. Raspberry PI 3 B +

    Acest mini computer este creierul proiectului، قواعد تعديل حقيقي من Linux Debian pe un procesor ARM. De Asemenea ، نموذج acest detune și de wi-fi، conexiunea la internet fiind absolut necesară pentru motoarele de text-în-vorbire și vorbire-în-text

  2. كاميرا عين PS

    pe post microfon ("urechea proiectului") am ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale، fiind mai ieftină decât o cameră web obișnuită

  3. بوكسو بورتبابيلي

    Pentru a transmite informația către used a fost nevoie de un difuzor، am folosit o boxă cu fir primită de la un prieten

  4. 2 حريق + ليد
  5. كاسيرولو

    Carcasa proiectului، o caserolă de sarmale: د

الخطوة 3: الأجهزة

المعدات
المعدات

După ce am adunat componentele، am trecut la application، schema este una foarte simple. Boxa portabilă se conectează la portul USB pentru alimentare și la portul jack pentru playback، camera / microfonul se conectează doar la portul USB prin care comunică cu computer-ul. Am mai adăugat on schemi led-ul conectat la pin-ul 17 cu rezistorul، pentru comanda de lumină. مضاعفات نيميك.

الخطوة 4: البرمجيات

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce)، să transforme datele într-un format accesibil lui (text) și să le redea răspunsul sau Confirmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii منفصل:

  1. Un motor Speech-to-Text (STT) ، pentru a prelua datele de intrare (informațiile transmise de utilizator prin vorbire)
  2. Un sistem de inteligență Artificială، pentru a lua decizii și a rezolva probleme
  3. Un motor text-to-Speech (TTS) ، بينتو أداة إرسال

Pentru STT am folosit API-ul de la Google، denumit Google Speech API، care este gratuit، oferă o calitate mare a convertiei și o rată mică de erori، dar oferă și un număr limitat de apeluri. Am Ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perterurbații. Datorită Limitrilor Hardware impuse de computer (putere de procesare، spațiu de stocare، Memorie)، folosirea unui serviciu offline este extra، așa că am optat pentru un serviciu Cloud، oferind și o precizie mai mare، dar și un timpai de răspuns Google تقدم لك كل ما هو جديد في عالم السيارات STT.

ردود الفعل Pentru-ul oferit utilizatorului (TTS-ul) am ales un motor غير متصل بالإنترنت ، deoarece acesta nu este foarte mare الاستهلاكية de resurse și nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System ، رعاية مجانية دون قمل من معهد ماساتشوستس للتكنولوجيا. Vocea este una ușor robotică، dar mult mai inteligibilă față de eSpeak، alt motor TTS Offline. يمكنك الاستفادة من الخدمات عبر الإنترنت التي تعتبر من الأشياء التي يجب مراعاتها.

Liantul dintre STT și TTS، precum și partea "iteligentă" este platforma denumită Jasper. O platform ă Open Source، disponibilă pe GitHub la link-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus i ia decizii on funcție de input-ul utilizatorului. Este Compatible cu Raspberry PI، fiind scrisă on Python. Am Ales această soluție în detrimentul celor Cloud datorită modularității، platforma permite folosirea oricărui serviciu STT și TTS، dar i i irei acțiuni folosind limbajul de programare Python.

Sistemul de inteligență الاصطناعيă este unul الإجرائي ، am optat pentru această variant ، n detrimentul sistemelor de tip التعلم الآلي (chatbot) din cauză că cele din urmă au un caracter nedeterminist. Natura Platformei Jasper، fiind bazată pe comenzi și acțiuni preefinite، limitează capacitatea de convorbire، dar oferă un cadru potrivit pentru un asistent digital، acesta fiind și scopul proiectului.

الخطوة 5: تنفيذ

  1. تثبيت نظام تشغيل Raspbian pe cardul microSD
  2. أنا conectat camera i difuzorul la Raspberry
  3. am configurat sistemul de operare، după care am instalat toate bibliotecile și serviciile necesare، urmând toți pașii din acest ghid: https://jasperproject.github.io/documentation/insta …
  4. Am Creat și instalat module adiționale pentru a extinde funcționalitatea sistemului

الخطوة 6: استخدام

Image
Image
استخدام
استخدام
Utilizare
Utilizare

Din lipsa unui monitor am configurat dispozitivul să se conecteze la rețea wireless preefinită ، controlul dispozitivului realizându-se prin SSH. جاسبر برمايت două tipuri de interacțiune:

  1. محطة Prin (نص) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

الدين يبسط voi începe مظاهرة وظيفية prin intermediul terminalului. La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare، iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • تعريف + كوفات
  • منظمة الصحة العالمية ، ما ، كم ، كم ، كم قديم + cuvânt - folosește API-ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API-ul de la Wikipedia pentru a oferi informații despre diferite noțiuni
  • نكتة - سبون يا كئيب
  • لوموس / أكاسيد النيتروجين - الصمام اللامع / اللاذع
  • أمور تافهة
  • أفلام - Informații Despre Filme (IMDB)
  • الأخبار - citește știri

În modul voce، deschis la introducere comenzii "jasper" on linia de comandă، dispozitivul se pune on modul de așteptare، acesta fiind trezit la auzirea unui cuvânt-cheie. În cazul de față cuvâtul cheie este "Jasper". ضع نسخة طبق الأصل من الكبريت ، وأدخل نمط التعليم ، ضع أولًا نصًا معياريًا دقيقًا. După التنفيذي comenzii، dispozitivul intră din nou n așteptare până la o nouă trezire a sa.

موصى به: