Isi kandungan:

Tambahkan Trigger Start Sound ke Google AIY Voice Kit: 6 Langkah (dengan Gambar)
Tambahkan Trigger Start Sound ke Google AIY Voice Kit: 6 Langkah (dengan Gambar)

Video: Tambahkan Trigger Start Sound ke Google AIY Voice Kit: 6 Langkah (dengan Gambar)

Video: Tambahkan Trigger Start Sound ke Google AIY Voice Kit: 6 Langkah (dengan Gambar)
Video: Katanya gaboleh 2 wkwk #virus #virtex #viruswa #fyp 2024, Julai
Anonim
Image
Image
Langkah 2: Lihat Fail Voicehat.py untuk Maklumat Lanjut
Langkah 2: Lihat Fail Voicehat.py untuk Maklumat Lanjut

Tutorial ini cukup mudah. Saya benar-benar menikmati Kit Suara AIY Google, tetapi saya sangat menyukai suara Google Home biasa yang mereka buat untuk mengesahkan bahawa mereka sedang mendengar secara aktif. Ini tidak disiapkan secara lalai dalam salah satu contoh yang telah dimuatkan pada gambar AIY Voice Kit.

Saya juga menyertakan pautan ke stok Mula dan Sahkan suara yang saya rakam dari rumah Google sebenar saya dengan perakam Zoom saya.

Ini dia - arahan pertama saya!

Langkah 1: Bahan & Fail yang diperlukan

  1. Kit Suara AIY Google yang berfungsi sepenuhnya - untuk menyediakan kit anda, lawati halaman Kit Suara AIY rasmi.
  2. Keupayaan untuk mengakses terminal Pi anda melalui SSH, VNC, atau dengan monitor dan papan kekunci
  3. Fail. Wav yang ingin anda mainkan ketika Pi mendengarkan input suara-Jika tidak menggunakan fail tersuai, muat turun fail "St art Talking" standard di sini atau muat turun dari pautan yang dilampirkan.
  4. (Pilihan) Editor audio yang boleh menukar fail dan mengubah bit dan kadar sampelnya

Langkah 2: Langkah 2: Lihat Fail Voicehat.py untuk Maklumat Lanjut

PENTING

Saya tidak menggunakan gambar terbaru pada kit suara saya yang merangkumi kod untuk kedua-dua kit Suara dan Penglihatan (iaitu aiyprojects-2018-01-03.img). Saya menggunakan kod dari cawangan Kit Suara yang boleh didapati di Google AIY Raspbian GitHub. Pendapat peribadi saya adalah hanya menggunakan cawangan Kit Suara untuk menjadikannya mudah dan tidak perlu berurusan dengan kod Penglihatan semasa anda bekerja dengan alat suara anda

Bergerak…

Langkah ini tidak sepenuhnya wajib, tetapi ia akan menunjukkan kepada anda di mana Google telah menguburkan arahan untuk membuatnya berfungsi jika anda ingin mengambil langkah ini lebih jauh atau memahami mengapa kod yang saya tambah berfungsi.

pi @ raspberry: cd AIY-voice-kit-python / src / aiy /

Kemudian kita akan memeriksa fail voicehat.py dalam folder itu:

pi @ raspberry: ~ / AIY-voice-kit-python / src / aiy / sudo nano voicehat.py

Gambar yang dilampirkan menunjukkan di mana anda dapat mempelajari UI Status dan cara menggunakan suara semasa pencetus.

Baiklah, sekarang mari kita tambahkan beberapa kod ke salah satu fail contoh agar perkara ini berfungsi.

Langkah 3: Langkah 3: Tambahkan Trigger Sound Code ke Demo Code

Langkah 3: Tambahkan Trigger Sound Code ke Demo Code
Langkah 3: Tambahkan Trigger Sound Code ke Demo Code

Pertama, arahkan ke folder AIY-voice-kit-python dan jalankan kod sumber

cd AIY-suara-kit-python

sumber env / bin / aktifkan

cd src

Kemudian gunakan 'sudo nano' ke dalam 'Assistant_grpc_demo.py' atau 'Assistant_library_demo.py'

Perbezaan antara kedua-dua fail tersebut ialah pembantu_grpc_demo.py menggunakan butang untuk mencetuskan Pembantu Google dan pembantu_library_demo.py menggunakan kata pengaktifan "Ok, Google" untuk mencetuskan Pembantu Google.

Untuk kedua-dua fail ini, anda hanya perlu menambahkan SATU baris kod:

status_ui.set_trigger_sound_wave ('/ rumah / pi / googlestart.wav')

Ini mengandaikan bahawa anda telah meletakkan bunyi permulaan anda di / home / pi / folder dan menamakannya googlestart.wav. Tukar ini berdasarkan apa sahaja yang anda namakan fail anda dan di mana sahaja anda berada.

Garis kod yang kami cari ada di bawah:

status_ui.status ('mendengar')

Kami ingin menambahkan barisan kod baru kami SEBELUM baris kod itu…

Untuk contoh 'assistant_library_demo.py' boleh didapati di sini:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# Dan sekarang tambahkan status kod kami_ui.set_trigger_sound_wave ('home / pi / googlestart.wav') status_ui.status ('mendengar')

Untuk contoh 'assistant_grpc_demo.py' boleh didapati di sini:

butang.wait_for_press ()

# Dan sekarang tambahkan kod status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav') status_ui.status ('mendengar')

Ini menganggap anda telah meletakkan suara permulaan anda di folder / home / pi / folder dan menamakannya googlestart.wav. Tukar ini berdasarkan apa sahaja yang anda namakan fail anda dan di mana sahaja anda berada.

Tekan CTRL-X & Y untuk menyimpan semuanya.

*** CATATAN: Saya telah menjumpai sesuatu yang sedikit bodoh. Untuk 'assistant_library_demo.py' menambahkan bunyi pencetus nampaknya tidak membuat perbezaan dalam fungsi pengecaman pertuturan. Walau bagaimanapun, bagi 'Assistant_grpc_demo.py', sepertinya apabila bunyi pencetus dilaksanakan, ia memotong perkataan atau dua perkataan pertama yang anda katakan. Tidak pasti mengapa. Masih berusaha mengetahuinya.

Langkah 4: Langkah 4: Jalankan Kod dan Pastikan Semua Perkara Baik untuk Dilakukan

pi @ raspberry: cd AIY-voice-kit-python

dan memuatkan virtualenv

pi @ raspberry: ~ / AIY-voice-kit-python $ sumber env / bin / aktifkan

dan jalankan!

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / Assistant_library_demo.py

atau

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / Assistant_grpc_demo.py

Sekarang katakan "Baiklah, Google" atau Tekan Butang itu dan lihat apakah ia berfungsi!

Halaman seterusnya akan membantu anda sekiranya anda mempunyai fail tersuai anda sendiri dan kadar bit dan sampel yang sesuai untuk fail.wav anda

Langkah 5: Langkah 5: Buat Fail.wav Anda Sendiri

Langkah 5: Buat Fail.wav Anda Sendiri
Langkah 5: Buat Fail.wav Anda Sendiri

Sekiranya anda tidak berminat untuk menggunakan fail.wav dari bunyi permulaan Google Home standard, anda perlu membuat fail.wav anda sendiri. Saya memerlukan sedikit percubaan dan ralat untuk mendapatkan kadar bit dan sampel yang betul untuk saya.

Saya menggunakan Logic Pro X untuk melakukan semua penyuntingan saya (gambar), yang merupakan DAW sepenuhnya untuk membuat dan menghasilkan muzik. Dua pilihan yang saya dapati adalah yang sesuai ialah Switch atau MediaHuman Audio Converter. Saya menganggap anda boleh melakukan ini dengan Garageband jika anda mempunyai Mac, tetapi saya belum mencubanya.

Terdapat tiga bahagian utama fail anda yang diperlukan untuk berfungsi dengan kod demo.

  1. Mesti fail audio MONO
  2. Kadar sampel mestilah 32000
  3. Mesti fail.wav
  4. (Pilihan) Resolusi 16 bit paling sesuai untuk saya

Langkah 6: Langkah 6: Menambah Bunyi Pengesahan?

Di sinilah saya tersekat jika ada yang mempunyai fikiran. Saya ingin menambahkan bunyi pengesahan jika sistem mengenali input suara seperti di Google Home biasa.

Saya telah melampirkan bunyi Pengesahan stok di bawah untuk kemudahan anda.

Selamat mencuba!

Disyorkan: