Är röstsökning nästa stora grej?

Blogginlägg av Linn Nilsson

En nytt gränssnitt har anlänt

När iPhone lanserades 2007 var det få som kunde ana hur stor inverkan denna pryl skulle ha på våra liv. Idag är det självklart för oss att i den kunna hitta allt vi behöver. Smartphonen utgör ett av de stora tekniska framstegen när det kommer till användargränssnitt, det vill säga sättet på vilket vi interagerar med objekt runt omkring oss. Till och med små barn kan idag lätt förstora bilder på iPads och intuitivt dra objekt fram och tillbaka i sina mobilspel.

De senaste åren har en annan typ av gränssnitt blivit alltmer vanligt, konversationsbaserade gränssnitt eller röstigenkänning. När man tänker efter är ju rösten, tillsammans med gester och kroppsspråk, det äldsta och vanligaste sättet för oss människor att kommunicera med varandra långt innan det blev ersatt med ord, text, tangentbord och skärmklick.

Framsteg inom röstigenkänningstekniker, i synnerhet under de senaste tio åren, har lett till att det blir allt vanligare att använda konversationsbaserade gränssnitt för att göra noteringar, sökningar, skicka sms m.m.

Det finns många anledningar till att röstigenkänning är en effektiv metod:

  1. Det är snabbare. Vi kan prata i 150 ord per minut, men bara skriva i genomsnitt 40 ord per minut.
  2. Det är enklare. Det kräver inte att man använder sina händer, tangentbord eller att man tittar på skärmen. Detta är speciellt viktigt ur ett tillgänglighetsperspektiv och fungerar bra i situationer som bilkörning eller vid nedsatt syn.
  3. Det är mer naturligt. Många gånger är det lättare att formulera sig med röst än med text.

Trots utvecklingen av den teknik som gör röstigenkänning möjlig menar många att vi bara sett början av vad konversationsbaserade gränssnitt kan användas till (och det har inte varit en spikrak väg). Det är lätt att även här dra paralleller till iPhonen. Året efter den kom lanserades App Store med 500 applikationer och tanken var att Apple själva skulle stå för utvecklingen av applikationerna. 10 år senare fanns det fler än 2.2 miljoner appar och 10-tals miljoner tredjepartsutvecklare världen över. Vem vet vilka applikationer och innovationer som kommer att utvecklas från ett helt nytt användargränssnitt?

Är vi där ännu?

Nästan! Tekniken har kommit lång och har börjat märkas i hemmen, men det är antagligen minst ett par år kvar tills konversationsbaserade gränssnitt används i praktiken i större utsträckning. Google eller andra aktörer har inte publicerat statistik på hur många som använder röstigenkänning idag, men Statista uppskattar att ungefär 20 procent gjorde minst en röststyrd sökning i månaden 2019. En siffra man uppskattar kommer öka till 50 procent inom de närmsta två åren.

För oss som jobbar med UX och webbutveckling är det därför viktigt att ha röstigenkänning i åtanke när vi skapar framtidens webbplatser. Vi ska se till att informationen finns tillgänglig för sökmotorerna samtidigt som vi ska behålla flexibiliteten och komplexiteten som krävs för en kvalitativ webbplats.

Jag som specifikt arbetar med UX måste exempelvis fundera över vad det betyder för användarupplevelsen att användarna inte alltid har mobil- eller datorskärm framför sig när de interagerar med webbplatsen. Hur skapar man en användarvänlig webbplats som inte bara bygger på visuella kvaliteter, utan även audionomella? 

Vad betyder det här för dig?

  1. Det är mycket som fortfarande är business as usual. Det kan dock vara än viktigare att ha en ordentligt SEO-anpassad webbplats när sökningarna med tiden blir mer precisa vilket de tenderar till med röstsökning. Många av dessa sökningar görs i talspråk där man t.ex. ställer frågor i hela meningar, snarare än att söka efter enstaka ord. Med mobilen kanske man hade sökt på Företag X och sen letat efter dess öppettider. Genom konversationbaserade gränssnitt använder man sig kanske snarare av sökningen ”Vilka öppettider har företag X” och då är det viktigt dessa sökningar träffar rätt.
  2. Mer precis information. Eftersom röstsökningar ofta görs genom vanliga samtalsfrågor är det lättare att få data på vad det är användare är ute efter. Denna data kan senare användas till att förbättra och spetsa målgruppsanalysen.
  3. Tillfälle till att vara kreativ! Små enkla funktioner kan skapa en wow-faktor för användarna. Allteftersom det blir vanligare med konversationsbaserade gränssnitt vänjer sig användarna vid att prata in frågor, be om hjälp, eller lägga beställningar utan att behöva titta på mobilen. Använd detta till er fördel.

”Devices will fade away”

Det är svårt att säga redan nu exakt på vilka sätt röstigenkänning kommer att förändra vårt sätt att interagera med tekniska prylar runt omkring oss, men det är tydligt att det har potentialen att förändra vår vardag och arbetsliv på samma sätt som smartphonen. Idag använder kanske redan de flesta av oss iPhone, Google Home, Alexa och Siri för att byta låt på Spotify, lägga in påminnelser och alarm, men vem vet vilken påverkan tekniken kan komma att ha på e-commerce, betalningar, webbnavigation och informationsinhämtning?

Googles vd Sundar Pichai menar på att vi, i samband med att röstigenkänning får en mer central roll, kommer att se våra prylar runt omkring oss blekna bort till förmån för en mer osynlig och skärmlös framtid. Varför själv ringa och beställa klipptid när vi kan låta Google göra det åt oss?