Programmering

Et tastatur? Hvor malerisk

Tiden med stemmesøgning og stemmestyret software er over os. Som udvikler lever jeg og dør ved tastaturet, men jeg kan allerede se tegnene: Som f.eks. Mange mennesker taler jeg til min Android-telefon (for eksempel "Naviger til Lowes [eller Starbucks eller Harris Teeter]") til få vejledninger.

I Mary Meekers rapport om internettrends fra 2016 rapporterer hun, at Google Voice-søgeforespørgsler er steget med en faktor på syv siden 2010. Jeg har også bemærket, at min 12-årige søn gør næsten alle sine søgninger via stemme - og min kæreste tekster mig på denne måde med jævne mellemrum. Også det firma, jeg arbejder for, Lucidworks, annoncerede for nylig et nyt partnerskab med IBM for at integrere Watson og tekst-til-tale-muligheder i vores virksomhedssøgningsprodukt.

Teknologien fungerer meget bedre end tidligere, og det er lettere at integrere i applikationer. Hvis du udvikler til Android eller iOS, kan du nemt tilslutte API'erne til talegenkendelse. Men talegenkendelse begynder og slutter ikke med enkle tale-til-tekst og stemmekommandoer.

At forstå hensigten med søgningen er en meget kontekstuel opgave, især med talesprog. Desuden har folk en tendens til at bruge flere ord i det naturlige talesprog, end når de konfronteres med en søgefelt. Der er flere "støjord" på det talte sprog end i en normal tekstsøgning.

Dette er betydelige AI-udfordringer. Men når vi overvinder kontekstproblemet, vil udviklere lære, at mere kan gøres med stemme end med tekst. Følelsesmæssig kontekst spiller en rolle. Hvis du leder efter en tankstation, vil du have den billigste eller den nærmeste? Det følelsesmæssige indhold af din stemme kan antyde det. Sikker på, du kan afklare, men det behøver du muligvis ikke.

Din snakkesalige fremtid

Den stemmestyrede epoke handler ikke om søgning alene. Det vil påvirke hele vores måde at interagere med computere på. I en ikke alt for fjern fremtid vil tastaturer blive betragtet som "maleriske", som Scotty berømt beskrev dem i "Star Trek IV."

Men dette skift kræver også et helt nyt brugergrænseflade. Her er en gammel illustration af, hvad jeg mener: Da Windows 95 kom ud, havde IBM integrerede stemmekommandoer i sine pc'er. På det tidspunkt arbejdede jeg som sælger hos Office Depot, og det blev hurtigt tydeligt, hvor upraktiske stemmekommandoer var. Den vinduesgrænseflade egnede sig slet ikke til denne form for interaktion.

Jeg mener, hvordan i helvede flytter du et vindue ud af vejen for et andet vindue og ændrer størrelsen på dem begge for at passe på skærmen på en effektiv måde med stemmekommandoer? Det gør du ikke. Du grøfter disse vinduer (og sandsynligvis Windows) helt. En stemmestyret brugergrænseflade bruger ikke de samme motiver. Du ser aldrig en vinduesgrænseflade på "Star Trek."

Når vi taler om "Star Trek", når folk begynder at kode eller gøre noget teknisk, skifter de altid til en taktil grænseflade (OK, ikke ligefrem taktil - det ligner mere et mikrobølgetastatur overlejret med art nouveau-gengivelser af et printkort). Men er regression til "typing" nødvendig? Sandt nok kan jeg ikke forestille mig at bruge en stemmegrænseflade til at kode i Scala. Måske udvikles der nye sprog (blottet for parentes, i modsætning til Scala - og mine artikler), der er specielt velegnet til at tale.

Hjemmesider vil helt sikkert ikke se ens ud og vil tilbyde nye navigationsparadigmer. Du vil sige "vis mig tilbud på sko", og hvad du får tilbage, vil sandsynligvis være bedre organiseret og mere kontekstfølsomt end dit gennemsnitlige websted ("tilbud" && "sko"). Desuden vil jeg ikke rulle eller sige "næste side" meget, så interaktionerne bliver brugertilpassede. Systemet skulle allerede vide, at jeg vil have mænds sko, og jeg vil ikke have hårdhælede sko på grund af min akillessene. Måske ved det, at jeg foretrækker mørke farver. Måske fortalte jeg det, eller måske analyserede det min opførsel.

Er dette overhovedet et websted? Sikker på, at hvis jeg handler med sko, vil jeg have en visuel repræsentation, men hvis jeg taler, taler maskinen måske tilbage. Måske viser det mig sko og spørger derefter: "Leder du efter en bestemt type sko? Hvilket formål er disse sko til? Har du dem på vandreture eller til fest?"

Tiden til stemmesøgning vil ændre alt fra, hvordan vi interagerer med maskiner, til hvordan vi koder. Mange af de teknologier, vi har brug for, er allerede tilgængelige for os i dag, mens andre endnu ikke er opfundet. Effekten på brugergrænseflader kan være mere dybtgående end skiftet fra hulkort til tastaturer.

Denne fejende ændring kommer ikke på én gang. I dag er ikke dagen for at smide dit tastatur ud. Men det kan være dagen, hvor du begynder at tænke på at redesigne dit websted, så det er virkelig stemmetilgængeligt.

$config[zx-auto] not found$config[zx-overlay] not found