ID.nl logo
Zo krijg je stembesturing op de Raspberry Pi
© PXimport
Huis

Zo krijg je stembesturing op de Raspberry Pi

Met slimme assistenten zoals Google Assistant, Amazon Echo en Apple geef je opdrachten met je stem. Leuk, maar je stemopnames worden wel naar de cloud gestuurd voor verwerking. Met een Raspberry Pi en de opensource-software Rhasspy kun je stembesturing volledig lokaal realiseren, zelfs zonder internet. Je stemopdrachten koppel je dan aan Node-RED of een domoticasysteem zoals Home Assistant, en dat zonder dat Google, Amazon of Apple de hele tijd meeluistert. Zelfs in het Nederlands.

1 Raspberry Pi

Rhasspy heeft minstens een Raspberry Pi 2 nodig, maar we raden toch minstens model 3 aan. Als je complexe zaken wilt gaan doen, is een Raspberry Pi 4 zelfs aan te raden. Daarnaast heb je ook een microfoon en luidspreker nodig. Deze workshop hebben we met de ReSpeaker 2 Mics pHAT van Seeed uitgeprobeerd. Deze prik je op de gpio-header van de Raspberry Pi. De HAT heeft twee microfoons ingebouwd en een luidspreker sluit je aan via de 3,5mm-audiojack of de JST2.0-stekker. Wij gebruiken die laatste, waarop we een 3inch-luidspreker van 8 ohm en 1 watt aansluiten.

2 Audiodrivers

We gaan ervan uit dat je op je Raspberry Pi al de nieuwste Raspbian hebt geïnstalleerd, en via ssh (of een toetsenbord en scherm) opdrachten kunt intypen. Als je de ReSpeaker 2 Mics pHAT of andere audiohardware van Seeed gebruikt, dien je eerst een driver te installeren. Dat doe je met deze drie opdrachten:

git clone https://github.com/respeaker/seeed-voicecard
cd seeed-voicecard
sudo ./install.sh

Herstart daarna je Raspberry Pi met sudo reboot. Als je daarna weer inlogt, zou je in de uitvoer van de commando’s arecord -l (de lijst van microfoons) en aplay -l (de lijst van luidsprekers) de ReSpeaker-hardware moeten zien.

©PXimport

3 Installeer Rhasspy

Rhasspy kun je installeren in een Docker-container, in een virtuele Python-omgeving of als een Hass.io-add-on voor Home Assistant. In deze workshop voeren we de installatie uit met Docker Compose. Volg onze basiscursus Docker op Raspberry Pi elders in dit nummer om Docker en Docker Compose te installeren, en maak het volgende bestand docker-compose.yml aan:

version: '3.7'
services:
rhasspy:
image: rhasspy/rhasspy:2.5.0-pre
container_name: rhasspy
restart: always
volumes:
- /home/pi/containers/rhasspy/profiles:/profiles
ports:
- 12101:12101
devices:
- /dev/snd:/dev/snd
command: --user-profiles /profiles --profile nl

Bekijk op het forum van Rhasspy wat de nieuwste versie is en pas het image indien nodig aan. Op het moment van schrijven was dat rhasspy/rhasspy:2.5.0-pre.

©PXimport

4 Webinterface

Maak de Docker-container van Rhasspy met het commando docker-compose up -d. Nadat Rhasspy is opgestart, kun je de webinterface bereiken via http://IPADRES:12101 met in plaats van IPADRES het werkelijke ip-adres van je Raspberry Pi. Dat laatste kom je te weten met de opdracht ip a op je Pi. Kijk naar het ip-adres bij eth0 als je ethernet gebruikt of wlan0 als je wifi gebruikt. In de webinterface zie je rechts bovenaan in het blauw nl staan: dat is het teken dat Rhasspy het Nederlandse profiel gebruikt. Je ziet bovenaan ook een link naar de Getting Started Guide: de documentatie wordt gewoon door dezelfde webserver getoond.

©PXimport

5 Audio-instellingen

Klik links op het icoontje van de gereedschapskist. Je krijgt nu alle services van Rhasspy te zien en die zijn standaard allemaal uitgeschakeld. Rhasspy is eigenlijk een toolkit om een stemassistent mee te maken en voor elk van deze services heb je meerdere keuzes. Selecteer PyAudio bij Audio Recording, en aplay bij Audio Playing. Klik onderaan op Save Settings, waarna Rhasspy herstart. Klik op Audio Recording / Test en kies de microfoon, bijvoorbeeld seeed-2mic-voicecard. Klik op Audio Playing en Refresh en kies je luidspreker, bijvoorbeeld Direct hardware device without any conversions. Sla je wijzigingen nog eens op.

©PXimport

6 Kies een activatiewoord

In de volgende stap kies je een ‘wake word’: het woord dat je tegen Rhasspy dient te zeggen om je stemassistent te activeren. Selecteer Porcupine bij Wake Word en sla je wijzigingen op. Klik dan op Wake Word en Refresh. In de lijst voor de knop Refresh kun je nu uit een tiental activatiewoorden kiezen, zoals porcupine (de standaard) en hey pico. Als je je eigen activatiewoord wilt aanmaken, dan kan dat met de Picovoice Console. Maak een directory genaamd porcupine in je profielmap van Rhasspy en plaats het bestand daar. Daarna kun je het in de instellingen selecteren. Vergeet niet op Save Settings te klikken.

©PXimport

7 Spraak naar tekst en andersom

Stel Speech to Text in op Kaldi (als je een Raspberry Pi 4 hebt, want dit vraagt meer rekenkracht) of Pocketsphinx (voor eerdere modellen). Zet Text to Speech op Espeak en sla je wijzigingen op. Als je de pagina daarna ververst, krijg je de melding dat Rhasspy bestanden moet downloaden. De speech-to-text-engine heeft immers een akoestisch model en basiswoordenboek nodig. Klik bovenaan op Download. Als alles gedownload is, krijg je de melding Training Profile. Je krijgt ook de melding dat Rhasspy niet zeker is van enkele woorden hoe het die moet uitspreken.

©PXimport

8 Woordenboek

Klik op View bij de melding over onbekende woorden of klik in de zijbalk links op het icoontje met de twee aanhalingstekens. Rhasspy heeft al een gok gedaan over de uitspraak van de onbekende woorden, door er hun fonetische transcriptie bij te zetten. Klik op check to be sure om de beschikbare fonemen te bekijken. Klopt er iets niet, pas dit dan aan. Klik tot slot op Confirm Guesses. De woorden worden dan samen met hun uitspraak toegevoegd aan je lijst met Custom Words. Merk je later dat je een verkeerde uitspraak hebt toegevoegd, dan kun je deze altijd op deze pagina nog aanpassen.

©PXimport

9 Je bedoeling herkennen

Dan rest er nog één component die we moeten instellen: Intent Recognition. Stel die in op Fsticuffs en sla je wijzigingen op. Na de herstart zou Rhasspy je opdrachten moeten herkennen. Welke zinnen Rhasspy exact herkent, vind je op de pagina Sentences. De inhoud daarvan heeft de syntaxis van een ini-bestand, en elke sectie is een ‘intent’ of bedoeling. Bekijk bijvoorbeeld de regel [GetTime] met daarna de regel hoe laat is het. Dat betekent: als je de zin “hoe laat is het” uitspreekt, verstaat Rhasspy dit als de bedoeling GetTime. Je kunt hier ook complexere regels invullen, op de pagina staat een link naar de volledige syntaxis.

©PXimport

10 Test!

Ga nu naar de pagina Test en typ een van de zinnen uit de pagina Sentences in het tekstveld naast Recognize. Klik op de knop ernaast. Als je bijvoorbeeld “zet de woonkamerlamp aan” invoert, verschijnt er na een druk op de knop ChangeLightState onder, de waarde woonkamerlamp bij het slot name en de waarde aan bij het slot state. Als je op Show JSON klikt, krijg je gedetailleerdere informatie over wat Rhasspy herkent. Als dit werkt, is de ultieme test het daadwerkelijk uitspreken: spreek het activatiewoord uit (bijvoorbeeld “hey pico”) en daarna je zin. Als alles goed gaat, toont de testpagina nu je woorden in tekst, inclusief de herkende intent en slots.

©PXimport

Rhasspy verstaat me niet!

Het succes van Rhasspy hangt van allerlei factoren af. Allereerst van de kwaliteit van je microfoon. De hier voorgestelde ReSpeaker 2 Mics pHAT is oké, maar geen hoogvlieger en hij heeft een beperkt bereik. Vermijd ook stoorzenders zoals achtergrondgeluid. Als Rhasspy moeilijk je activatiewoord (wake word) verstaat, probeer dan een ander uit (een zelfgetraind activatiewoord werkt het best). Als Rhasspy je opdrachten na het activatiewoord moeilijk verstaat, probeer dan eens een andere speech-to-text engine. Als het daarna echt nog niet goed werkt, overweeg dan om naar het Engels over te schakelen: de spraaktechnologie voor het Engels werkt doorgaans beter dan die voor het Nederlands.

©PXimport

11 Actie!

Rhasspy herkent nu wat je zegt en achterhaalt de bedoeling daarachter, maar doet er nog niets mee. Gelukkig ondersteunt Rhasspy diverse manieren om op je ‘intents’ te reageren. Standaard stuurt Rhasspy bij het herkennen van een intent een event met JSON-code uit via een WebSocket. Je kunt dan in een ander programma naar deze WebSocket-events luisteren en daarop reageren. Een handig programma daarvoor is Node-RED, dat je ook eenvoudig op je Raspberry Pi met Docker installeert.

©PXimport

12 WebSockets

Kies in Node-RED uit het palet links onder het kopje network een node websocket in en versleep die naar de werkruimte in het midden. Dubbelklik erop, laat het type op Listen on staan en klik bij Path op het icoontje van het potlood naast Add new websocket-listener. Vul bij Path de url ws://rhasspy:12101/api/events/intent in, of vervang rhasspy in de url door de hostname of het ip-adres van je Raspberry Pi als je Node-RED op een andere computer hebt draaien. Laat Send/Receive op payload staan en klik op Add. Geef dan je node websocket in een naam en klik op Done.

13 Debug

Sleep nu een node debug (in het onderdeel common helemaal bovenaan) naar de werkruimte. Verbind het rechtse grijze vakje van je websocket-node met het linkse grijze vakje van de debug-node. Klik dan op Deploy om je flow in Node-RED uit te rollen. Klik nu op het menu helemaal rechts bovenaan en dan op View / Debug messages. Rechts krijg je nu alle boodschappen van de debug-node te zien. Als je nu tegen Rhasspy praat en die de intent herkent, krijg je in het debug-venster de JSON-code van de intent te zien.

©PXimport

14 Van string naar object

Maar eerst dienen we de JSON-string (een reeks tekens) naar een JSON-object om te zetten. Sleep een node json uit het onderdeel parser en plaats die tussen de websocket- en debug-nodes. Daarvoor dien je de bestaande verbindingen te verwijderen (selecteer en druk op Delete) en nieuwe verbindingen te maken. Als je nu weer op Deploy klikt en tegen Rhasspy praat, zie je in het debug-venster de intent in de vorm van een object in plaats van een string. Onderdelen kun je nu uitklappen, bijvoorbeeld het deelobject intent met daaronder name die de naam van de herkende intent bevat, zoals “GetTime”.

©PXimport

15 Wat zei je?

Hang nu een node switch (uit function) achter de json-node en dubbelklik erop. Vul bij Property de eigenschap msg.payload.intent.name in en vul bij de regel onderaan achter == niets in, omdat een niet herkende zin een intent zonder naam krijgt. Klik op Done. Voeg achter de switch-node een node change (uit function) toe, dubbelklik erop en zet de payload op Wat zei je?. Geef de node eventueel een naam en klik op Done. Hang achter deze node een node http request (uit network), verander de methode naar POST en vul bij de url http://rhasspy:12101/api/text-to-speech in. Klik op Done en dan Deploy.

©PXimport

16 Intents herkennen

Als je nu iets zegt dat Rhasspy niet verstaat, antwoordt hij “Wat zei je?”. Door nu aan de switch andere regels toe te voegen, kun je voor elke herkende intent een andere actie laten uitvoeren. Klik in de eigenschappen van de switch-node op het knopje +add onderaan om een regel toe te voegen en vul in het veld na het isgelijkteken GetTime in. Er verschijnt nu een extra uitgang aan de switch-node. Hang daar een node function (in het onderdeel function) achter en verbind die ook met je http request. Dubbelklik op de intent en geef die de naam GetTime.

©PXimport

17 Hoe laat is het?

In de function-node schrijf je een javascript-functie, die de tijd uitvoer als een tekst, die door de http request aan Rhasspy wordt doorgegeven om uit te spreken. In die functie maak je eerst een variabele timeString, waaraan je de uitvoer van de methode toLocaleTimeString op een nieuw Date-object toekent. Op het einde van de functie geef je de payload terug, waaraan je de string “Het is” en de tijd toekent. In die tijd vervang je de dubbele punt (:) door de string “ uur “. Als je deze node nu opslaat en de flow uitvoert via Deploy, antwoordt Rhasspy je op je vraag hoe laat het is.

©PXimport

18 Slots

GetTime is een eenvoudige intent, maar complexere intents zoals ChangeLightState bevatten ook slots. Die kun je eenvoudig uit de JSON-code halen in Node-RED. Voeg een nieuwe regel in de switch-node toe en test op ChangeLightState. Hang hieraan een node template (in het onderdeel function) en verbind die ook weer met de http request. Vul in het tekstveld template de code Ik zet de {{ payload.slots.name }} {{ payload.slots.state }} in. Hiermee antwoordt Rhasspy je “Ik zet de woonkamerlamp aan”, als je “Zet de woonkamerlamp aan” vraagt, en hetzelfde voor andere apparaten en toestanden die voor de intent zijn gedefinieerd.

©PXimport

19 Apparaten aansturen

Uiteraard kun je Rhasspy op deze manier ook acties laten uitvoeren, zoals je lampen daadwerkelijk in- en uitschakelen. Hoe dat precies gebeurt, hangt af van wat voor lampen je hebt en welke API deze aanbieden. Voor een REST API gebruik je een http request, voor apparaten die MQTT spreken gebruik je mqtt out en definieer je een mqtt-broker. Uiteraard kun je ook allerlei nodes toevoegen voor extra functionaliteit en dan kun je zo bijvoorbeeld je Philips Hue-lampen via spraak aansturen.

©PXimport

20 En verder

Rhasspy is een heel flexibel systeem voor spraakbesturing. Bijna elk onderdeel kun je wel vervangen of aanpassen. Bekijk zeker de interne documentatie van je installatie. We hebben ons in deze workshop gefocust op de integratie met Node-RED, maar ook met het domoticasysteem Home Assistant is er een uitstekende integratie. Via de http en de WebSocket API en MQTT-boodschappen die het Hermes-protocol volgen, kun je bovendien in principe elk systeem met Rhasspy koppelen. Bezoek zeker ook het Rhasspy-forum waar een behulpzame community actief is.

©PXimport

Meerdere apparaten met Rhasspy

Je kunt Rhasspy ook op meerdere Raspberry Pi’s verspreid in je huis installeren. Eén Raspberry Pi is dan de base of master, en die neemt de spraakherkenning, spraaksynthese en herkenning van de intents op zich. Op de andere Raspberry Pi’s (dat kunnen zelfs Raspberry Pi Zero’s zijn) activeer je alleen de audioverwerking van de microfoon en luidspreker en de herkenning van het wake word. Je spreekt dan tegen een van de satellieten, die herkent het activatiewoord en stuurt je audioboodschap naar de base, die er een intent in herkent. Als je Node-RED-flow dan een antwoord naar de spraaksynthese stuurt, wordt die audio op zijn beurt naar de luidspreker van de juiste satelliet gestuurd.

©PXimport

▼ Volgende artikel
Review Motorola Edge 60 Fusion – Betaalbaar en compleet
© Rens Blom
Huis

Review Motorola Edge 60 Fusion – Betaalbaar en compleet

Een 'gewoon prima' smartphone hoeft echt geen vele honderden euro's te kosten, weten we inmiddels. De nieuwe Motorola Edge 60 Fusion is daar een mooi voorbeeld van, lees je in deze review. Voor een adviesprijs van 329 euro krijg je een telefoon die luxe oogt, fijne specificaties heeft en zes jaar updates ontvangt.

Uitstekend
Conclusie

De Motorola Edge 60 Fusion is niet de snelste smartphone in zijn prijsklasse, maar scoort op alle andere belangrijke punten wel (erg) goed. We zijn ook blij met het updatebeleid van zes jaar. Voor iets meer dan 300 euro koop je zo een telefoon waar je veel plezier aan kunt beleven.

Plus- en minpunten
  • Eigen, luxe ontwerp
  • Goed scherm
  • Zes jaar beveiligingsupdates
  • Prijs-kwaliteitverhouding
  • Niet de snelste in zijn klasse
  • Moto AI niet altijd nuttig

De Edge 60 Fusion is het goedkoopste model in Motorola's Edge 60-serie en verkrijgbaar in drie kleuren: blauw, roze en het geteste turquoise. Niet de meeste alledaagse kleuren voor een smartphone, en het veilige grijs, zwart en wit ontbreken. Wij kunnen dat wel waarderen.

Opvallend ontwerp

De Edge 60 Fusion valt lekker op in de saaie massa. Een hoesje kan handig zijn om de telefoon beter te beschermen, maar is niet nodig voor grip. De nepleren achterkant biedt namelijk veel grip. Motorola schermt bovendien met een MIL-STD-810H-certificering, die aangeeft dat de Edge 60 Fusion niet stuk zou moeten gaan door een val van maximaal 1,2 meter hoogte.

©Rens Blom

De Edge 60 Fusion valt lekker op.

De gebruikservaring van de Motorola-smartphone is uitstekend. Met 178 gram is het toestel relatief licht, door de gekromde randen aan de zijkanten heb je het idee dat je een hele dure telefoon in handen hebt en het 6,67 inch-oledscherm ziet ook heel goed uit. De verversingssnelheid is 120 Hz en de resolutie wat hoger dan Full-HD, waardoor het scherm scherp oogt.

Complete smartphone

We zijn ook blij dat Motorola de scherp geprijsde smartphone zo compleet heeft gemaakt. De Edge 60 Fusion is bijvoorbeeld waterbestendig, ondersteunt een e-sim en heeft lekker veel (256 GB) opslagcapaciteit. Ook het werkgeheugen is van gebruikelijke grootte (8 GB) en de gangbare accucapaciteit van 5200 mAh levert een meer dan prima accuduur op. Wij kunnen de smartphone bij redelijk intensief gebruik, ook buiten de deur, zeker een lange dag gebruiken. 's Avonds opladen kan, maar de volgende ochtend redt het toestel ook.

©Rens Blom

Het grote scherm ziet er goed uit

Je dient wel zelf een oplaadadapter te regelen, en het liefst een krachtige. Motorola levert – vanwege nieuwe EU-wetgeving – namelijk alleen een usb-c-kabel in de doos van de Edge 60 Fusion mee. Met de juiste adapter kan de smartphone overigens lekker rap opladen, namelijk met 68 watt. Wat dat zegt? Dat het drie kwartier duurt om de telefoon van 0 naar 100 procent te brengen.

Is de Edge 60 Fusion zonder compromissen? Nee. De gebruikte MediaTek-processor is niet zo snel, waardoor de telefoon ons af en toe niet kan bijhouden. Geen ramp, maar wel een aandachtspunt. Toestellen worden door de jaren heen namelijk wat trager door alle apps en bestanden die je erop hebt gezet, en de Edge 60 Fusion is dus vanaf dag één al niet de snelste in zijn segment.

©Rens Blom

Camera's

De camera's van de smartphone zijn wat verwarrend. Achterop lijken drie cameralenzen te zitten, aangevuld met een flitser. Er zijn echter maar twee camera's: een hoofdcamera en een groothoekcamera. De Edge 60 Fusion kan ook inzoomen, maar gebruikt daar zijn hoofdcamera voor. Hoewel de camera's prima zijn gelet op de prijs, merken we duidelijk dat duurdere smartphones betere kiekjes schieten. Een begrijpelijk compromis, en we zijn blij dat Motorola de groothoeklens voorzien heeft van een macrofunctie, om van heel dichtbij te fotograferen. Dat kunnen lang niet alle telefoons in dit prijssegment.

Hieronder zie je twee fotoseries met van links naar rechts de hoofdcamera, groothoekcamera en zoomfunctie (2x) aan het werk.

©Rens Blom

©Rens Blom

Zes jaar updates

Prettig aan de Motorola Edge 60 Fusion is dat de telefoon drie Android-upgrades en zes jaar beveiligingsupdates krijgt. Je kunt het toestel dus heel lang veilig gebruiken. Motorola installeert ook heel wat AI-functies op het toestel. Sommige functies zijn nuttig, andere niet. Vertrouwd prettig blijven de gebaren om de smartphone efficiënt te bedienen. Motorola's tijdlijn met artikelen in allerlei categorieën toont ons om onduidelijke redenen alleen Engelstalige content, aangevuld met advertenties. Google's nieuwsfeed blijft dus relevanter.

©Rens Blom

Sommige onderdelen van Motorola's software bevallen goed, andere delen minder.

Conclusie: Motorola Edge 60 Fusion kopen?

De Motorola Edge 60 Fusion is niet de snelste smartphone in zijn prijsklasse, maar scoort op alle andere belangrijke punten wel (erg) goed. We zijn ook blij met het updatebeleid van zes jaar. Voor iets meer dan 300 euro koop je zo een telefoon waar je veel plezier aan kunt beleven.

▼ Volgende artikel
WhatsApp, Google Maps en DigiD populairste apps in Nederland
© ID.nl
Huis

WhatsApp, Google Maps en DigiD populairste apps in Nederland

WhatsApp is de meest geïnstalleerde app op Nederlandse smartphones, gevolgd door Google Maps, DigiD en YouTube. Dat blijkt uit het Mobile App Trends Report 2025 van Framna. Voor dit rapport zijn 600 apps geanalyseerd en 9.000 gebruikers ondervraagd.

Praktisch wint het van nieuws

De Top 20 laat een duidelijke voorkeur zien voor praktische apps, zoals 9292, NS, PostNL en Buienradar. Ook supermarktapps als die van Albert Heijn en Lidl Plus zijn vertegenwoordigd; terwijl ook Marktplaats, Bol en Spotify populair zijn.Nieuwsapps van onder andere NU.nl, NOS en De Telegraaf ontbreken. Daarin verschilt Nederland bijvoorbeeld van Scandinavische landen als Zweden en Denemarken, waarin de categorie nieuwsapps sterker scoort.

Kijken we naar sociale media, dan staan Facebook, Instagram en LinkedIn wel in de Top 20, maar TikTok ontbreekt.

Hoge waardering ≠ (automatisch) vaak geïnstalleerd

Framna keek niet alleen naar hoeveel een app wordt geïnstalleerd, maar ook naar de mate van waardering. De zogeheten "App Pulse-score" is gebaseerd op tevredenheid, gebruikswaarde, relevantie en het imago van de aanbieder. Op basis van die score staan WhatsApp, Spotify en ChatGPT bovenaan. Opvallend: sommige apps met een hoge App Pulse-score – zoals ChatGPT en Teletekst – komen niet voor in de lijst van meest geïnstalleerde apps.

WhatsApp niet weg te denken

WhatsApp is met een gebruikspercentage van 97 procent met afstand de populairste app in Nederland. De app wordt zowel privé als zakelijk gebruikt, onder meer voor klantenservice, groepsgesprekken en afspraakherinneringen. Daarmee speelt WhatsApp een centrale rol in de digitale communicatie van veel Nederlanders.

DigiD en Tikkie onmisbaar geworden

Ook DigiD en Tikkie zijn breed ingeburgerd. DigiD is de standaard geworden voor online toegang tot overheidsdiensten en zorginstanties. Tikkie wordt veel gebruikt voor het eenvoudig terugbetalen van bedragen onderling. Beide apps combineren gebruiksgemak met een duidelijke functie, waardoor ze inmiddels voor veel gebruikers tot de vaste uitrusting van hun telefoon behoren.

Social media dagelijks het meest geopend

In het onderzoek is ook gekeken naar het daadwerkelijke gebruik van apps. Social media worden het vaakst dagelijks geopend (door 62 procent van de ondervraagden), gevolgd door nieuwsapps (61 procent), financiële apps (31 procent) en entertainmentapps (28 procent). Toch halen nieuwsapps de top 20 van meest gebruikte apps niet.

De 20 meest gedownloade apps in Nederland

1: WhatsApp

2: Google Maps

3: DigiD

4: YouTube

5: Facebook

6: Marktplaats

7: Instagram

8: Albert Heijn

9: Spotify

10: Bol

11: PostNL

12: Messenger

13: NS

14: Netflix

15: Buienradar

16: Tikkie

17: Lidl Plus

18: LinkedIn

19: 9292

20: ING