Isi kandungan:

Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Langkah
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Langkah

Video: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Langkah

Video: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Langkah
Video: Peste 39 de cele mai bune instrumente AI care îți vor face viața mai ușoară și mai bună! 2024, November
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

Autor: Stanut Nicolae-Radu

Grupa: 333AB

Nota: 8

Langkah 1: Descriere Funcțională

Deskripsi Funcțională
Deskripsi Funcțională

Principn Principiu sistemul va fi asemănător

asistenților inteligenți pentru casă de tipul Pembantu Google Amazon Amazon Amazona, utilizatorii pot da comenzi vocale aparatului, iar acesta va răspunde sau va face o anumită acțiune, funn funcție de cerințele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că dispune de Wi-Fi, acest lucru permițând conectarea la serviciul cloud Amazon, care va da „inteligență” sistemului.

Folosind serviciul de cloud inteli inteligență artificială de la Amazon, acest dispozitiv va avea o funcționalitate praktik identikă Amazon Alexa. De exemplu acest asistent virtual poate prezenta starea meteo, poate ține minte notițe, poate pune alarme, dar din păcate (sau fericire?), Aceste lucruri bergantung kepada jumlah Amazon, iza comenzile dispozitivului se dau în limba engleză.

Ca și obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată înțelege și comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor procese, de exemplu aprinderea și stingerea unor lumini, hadiah oprirea unei. Huraikan, doar dacă API-ul Amazon va permite aceste lucruri.

Sursa poză:

Langkah 2: Componente

Pentru realizarea proiectului am avut nevoie de următoarele komponene:

  1. Raspberry PI 3 B +

    Acest mini computer este creierul proiectului, Rulesează o verisune modificată de Linux Debian pe un procesor ARM. De asemenea, acest model dispune și de wi-fi, conexiunea la internet fiind absolut necesară pentru motoarele de text-în-vorbire și vorbire-în-text

  2. Kamera Mata PS

    Pe post microfon ("urechea proiectului") am ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită

  3. Boxă portabilă

    Pentru a transmite informația către use a fost nevoie de un difuzor, am folosit o boxă cu fir primită de la un prieten

  4. 2 api + LED
  5. Caserolă

    Carcasa proiectului, o caserolă de sarmale: D

Langkah 3: Perkakasan

Perkakasan
Perkakasan

După ce am adunat komponenele, am trecut la implementare, schema este una foarte simplă. Boxa portabilă se conectează la portul USB pentru alimentare și la portul jack pentru main balik, kamera / microfonul se conectează doar la portul USB prin care comunică cu computer-ul. Am mai adăugat schn schemă și led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Komplikasi Nimic.

Langkah 4: Perisian

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce), să transforme datele într-un format accesibil lui (text) și să le redea răspunsul sau confirmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii terpisah:

  1. Un motor Speech-to-Text (STT), pentru a prelua datele de intrare (maklumat transmisi de utilizator prin vorbire)
  2. Un sistem de inteligență tiruan, pentru a lua decizii ai a rezolva probleme
  3. Un motor Text-to-Speech (TTS), pentru a transmite utilizatorului răspunsurile sau confirmările acțiunilor

Pentru STT am folosit API-ul de la Google, denumit Google Speech API, care este gratuit, oferă o calitate mare a chatiei rati o rată mică de erori, dar oferă și un număr limitat de apeluri. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de procesare, spațiu de stocare, memorie), folosirea unui serviciu offline este exclusiveă, aaa că am optat pentru un serviciu Cloud, oferind și o precizie mai mare, dar și un timp de răspuns mai bun, Google având unul dintre cele mai bune motoare STT.

Pentru feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare konsumen de resurse n nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Sistem Sintesis Pidato, penjagaan estet oferit gratuit sub o liceță de tipul MIT. Vocea este una ușor robotică, dar mult mai inteligibilă față de eSpeak, alt motor TTS di luar talian. Avantajul său față de serviciile online este că nu are niciun fel de limitare la numărul de coversiiii.

Liantul dintre STT Ti TTS, precum și partea "iteligentă" este platforma denumită Jasper. O platformă Open Source, hantar GitHub la link-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii în funcție de input-ul utilizatorului. Esteompatibilă cu Raspberry PI, fiind scrisă în Python. Am ales această soluție detn detrimentul celor Cloud datorită modularității, platforma permite folosirea oricărui serviciu STT și TTS, dar și definirea oricărei acțiuni folosind limbajul de programare Python.

Sistemul de inteligență tiruan dan prosedural, am optat pentru această variantă dan merugikan sistemelor de tip Pembelajaran Mesin (chatbot) din cauză că cele din urmă au un caracter nedeterminist. Natura platformei Jasper, fiind bazată pe comenzi ți acțiuni predefinite, limitează capacitatea de convorbire, dar oferă un cadru potrivit pentru un asentent digital, acesta fiind și scopul proiectului.

Langkah 5: Implementare

  1. Saya instalat sistemul de operare microSD Raspbian pe cardul
  2. Saya kamera conectat dii difuzorul la Raspberry
  3. Am configurat sistemul de operare, după care am instalat toate bibliotecile servi serviciile necesare, urmând toți pașii din acest ghid:
  4. Saya buat modul instalat adiționale pentru a extinde funcționalitatea sistemului

Langkah 6: Utilizare

Image
Image
Utilizare
Utilizare
Utilizare
Utilizare

Din lipsa unui monitor am configurat dispozitivul să se conecteze la o rețea Wireless predefinită, controlul dispozitivului realizându-se prin SSH. Permit Jasper două tipuri de interacțiune:

  1. Terminal Prin (teks) - la peraturanarea comenzii jasper_cli
  2. Prin voce - la peraturanarea comenzii jasper

Din simplify voi începe demonstrarea funcționalității prin intermediul terminalului. La peraturanarea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • DEFINE + cuvânt - întoarce definiția din dicționar a cuvântului respiv
  • SIAPA, APA, BAGAIMANA BANYAK, BAGAIMANA BANYAK, BAGAIMANA LAMA + cuvânt - folosește API-ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API-ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • JOKE - spune o glumă
  • LUMOS / NOX - aprinde / sengatan LED-ul atașat
  • TRIVIA
  • MOVIES - informații despre filme (imdb)
  • BERITA - citește știri

Moduln modul voce, deschis la introducere comenzii "jasper" în linia de comandă, dispozitivul se pune dan modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. Cn cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul a auzit cuvântul cheie, acesta intrăîn modul de ascultare, putând să primească comenzi tepat mengenai teks modul. După executarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.

Disyorkan: