Programmering

Kunstig intelligens i dag: Hvad er hype, og hvad er rigtigt?

Find et magasin, rul gennem de tekniske blogs, eller snak bare med dine jævnaldrende på en branchekonference. Du vil hurtigt bemærke, at næsten alt, der kommer ud af teknologiverden, synes at have noget element af kunstig intelligens eller maskinlæring til det. Den måde, kunstig intelligens diskuteres på, begynder den at lyde næsten som propaganda. Her er den ægte teknologi, der kan løse alle dine behov! AI er her for at redde os alle!

Selvom det er sandt, at vi kan gøre fantastiske ting med AI-baserede teknikker, er vi generelt ikke i stand til at udtrykke den fulde betydning af udtrykket "intelligens". Intelligens indebærer et system, som mennesker kan have en kreativ samtale med - et system, der har ideer, og som kan udvikle nye. Det drejer sig om terminologien. ”Kunstig intelligens” beskriver i dag ofte implementeringen af ​​nogle aspekter af menneskelige evner, såsom genstand for genstand eller tale, men bestemt ikke hele potentialet for menneskelig intelligens.

Således er "kunstig intelligens" sandsynligvis ikke den bedste måde at beskrive den "nye" machine learning-teknologi, vi bruger i dag, men det tog har forladt stationen. Under alle omstændigheder er maskinlæring endnu ikke synonymt med maskinens intelligens, men den er bestemt blevet mere kraftfuld, mere kapabel og lettere at bruge. AI - hvilket betyder neurale netværk eller dyb læring samt "klassisk" maskinindlæring - er endelig på vej til at blive en standard del af analyseværktøjssættet.

Nu hvor vi er godt inde i AI-revolutionen (eller rettere evolutionen), er det vigtigt at se på, hvordan begrebet kunstig intelligens er blevet valgt, hvorfor og hvad det vil betyde i fremtiden. Lad os dykke dybere for at undersøge, hvorfor kunstig intelligens, selv en let misforstået version af den, har tiltrukket det nuværende niveau af opmærksomhed.

AI-løftet: Hvorfor nu?

I den nuværende hype-cyklus er kunstig intelligens eller maskinindlæring ofte afbildet som relativt nye teknologier, der pludselig er modnet og kun for nylig flyttet fra konceptstadiet til integration i applikationer. Der er en generel overbevisning om, at oprettelsen af ​​enkeltstående produkter til maskinlæring kun skete i løbet af de sidste par år. I virkeligheden er den vigtige udvikling inden for kunstig intelligens ikke ny. AI i dag er en fortsættelse af fremskridt, der er opnået i løbet af de sidste par årtier. Ændringen, grundene til, at vi ser kunstig intelligens optræde så mange flere steder, handler ikke så meget om AI-teknologierne i sig selv, men om de teknologier, der omgiver dem - nemlig datagenerering og processorkraft.

Jeg keder dig ikke med at citere, hvor mange zettabyte data vi snart vil gemme (hvor mange nuller har en zettabyte alligevel?). Vi ved alle, at vores evne til at generere og indsamle data vokser fænomenalt. På samme tid har vi set en forbløffende stigning i tilgængelig computerkraft. Skiftet fra single-core processorer til multi-core samt udvikling og vedtagelse af generelle grafiske processorenheder (GPGPU'er) giver strøm nok til dyb læring. Vi behøver ikke engang at håndtere beregning internt længere. Vi kan simpelthen leje processorkraft et eller andet sted i skyen.

Med så mange data og masser af beregningsressourcer er dataforskere endelig i stand til at bruge de metoder, der er udviklet i de sidste årtier i en helt anden skala. I 1990'erne tog det dage at træne et neuralt netværk for at genkende numre på titusinder af eksempler med håndskrevne cifre. I dag kan vi træne et meget mere komplekst (dvs. "dybt") neuralt netværk på titusinder af billeder for at genkende dyr, ansigter og andre komplekse genstande. Og vi kan implementere modeller for dyb læring til at automatisere opgaver og beslutninger i almindelige forretningsapplikationer, såsom detektering og forudsigelse af modenhed ved produktion eller dirigering af indgående opkald.

Dette kan lyde mistænkeligt som at opbygge ægte intelligens, men det er vigtigt at bemærke, at under disse systemer justerer vi simpelthen parametre for en matematisk afhængighed, omend en ret kompleks. Metoder til kunstig intelligens er ikke gode til at tilegne sig ”ny” viden; de lærer kun af det, der præsenteres for dem. Med andre ord, spørger kunstig intelligens ikke ”hvorfor” -spørgsmål. Systemer fungerer ikke som de børn, der vedholdende spørger deres forældre, når de prøver at forstå verden omkring dem. Systemet ved kun, hvad det blev fodret med. Det genkender ikke noget, det ikke tidligere blev gjort opmærksom på.

I andre "klassiske" maskinindlæringsscenarier er det vigtigt at kende vores data og have en idé om, hvordan vi ønsker, at systemet skal finde mønstre. For eksempel ved vi, at fødselsår ikke er en nyttig kendsgerning om vores kunder, medmindre vi konverterer dette nummer til kundens alder. Vi ved også om effekten af ​​sæsonbestemthed. Vi bør ikke forvente, at et system lærer mønsterkøbsmønstre uafhængigt af sæsonen. Desuden vil vi måske indsprøjte et par andre ting i systemet for at lære oven på, hvad det allerede ved. I modsætning til dyb læring er denne type maskinindlæring, som virksomheder har brugt i årtier, udviklet sig mere i et jævnt tempo.

Nylige fremskridt inden for kunstig intelligens er primært kommet i områder, hvor dataforskere er i stand til at efterligne menneskelige genkendelsesevner, såsom at genkende objekter i billeder eller ord i akustiske signaler. At lære at genkende mønstre i komplekse signaler, såsom lydstrømme eller billeder, er ekstremt kraftfuldt - kraftigt nok til, at mange mennesker spekulerer på, hvorfor vi ikke bruger dyb læringsteknikker overalt.

AI-løftet: Hvad nu?

Organisatorisk ledelse spørger måske, hvornår de skal bruge kunstig intelligens. Nå, AI-baseret forskning har gjort store fremskridt, når det kommer til neurale netværk, der løser problemer, der er relateret til at efterligne, hvad mennesker gør godt (objektgenkendelse og talegenkendelse er de to mest fremtrædende eksempler). Når man spørger: "Hvad er en god objektrepræsentation?" og ikke kan komme med et svar, så en dyb læringsmodel kan være værd at prøve. Men når dataforskere er i stand til at konstruere en semantisk rig objektrepræsentation, er klassiske maskinindlæringsmetoder sandsynligvis et bedre valg (og ja, det er værd at investere lidt seriøst i at forsøge at finde en god objektrepræsentation).

I sidste ende ønsker man simpelthen at afprøve forskellige teknikker inden for den samme platform og ikke være begrænset af en softwareleverandørs valg af metoder eller manglende evne til at indhente de nuværende fremskridt på området. Derfor er open source-platforme førende på dette marked; de giver praktikere mulighed for at kombinere de nyeste teknologier med de nyeste banebrydende udviklinger.

Når vi bevæger os fremad, når hold bliver tilpasset deres mål og metoder til at bruge maskinindlæring til at nå dem, bliver dyb læring en del af enhver dataforskers værktøjskasse. For mange opgaver vil tilføje dyb læringsmetoder til blandingen stor værdi. Tænk over det. Vi vil være i stand til at inkludere objektgenkendelse i et system ved hjælp af et foruddannet kunstigt intelligenssystem. Vi vil være i stand til at inkorporere eksisterende tale- eller talegenkendelseskomponenter, fordi en anden har været igennem besværet med at indsamle og kommentere nok data. Men i sidste ende vil vi indse, at dyb læring, ligesom klassisk maskinlæring før det, virkelig bare er endnu et værktøj, der skal bruges, når det giver mening.

AI-løftet: Hvad næste?

En af de vejspærringer, der vil overflade, ligesom det gjorde for to årtier siden, er den ekstreme vanskelighed, man møder, når man prøver at forstå, hvad kunstige intelligenssystemer har lært, og hvordan de kommer med deres forudsigelser. Dette er muligvis ikke kritisk, når det kommer til at forudsige, om en kunde måske eller måske ikke kan lide et bestemt produkt. Men der vil opstå problemer, når det kommer til at forklare, hvorfor et system, der interagerer med mennesker, opførte sig på en uventet måde. Mennesker er villige til at acceptere "menneskelig fiasko" - vi forventer ikke, at mennesker er perfekte. Men vi accepterer ikke fiasko fra et kunstigt intelligenssystem, især hvis vi ikke kan forklare, hvorfor det mislykkedes (og rette det).

Efterhånden som vi bliver mere fortrolige med dyb læring, vil vi indse - ligesom vi gjorde for maskinlæring for to årtier siden - at på trods af systemets kompleksitet og datamængden, som det blev trænet på, er forståelse af mønstre umulig uden domæneviden. Menneskelig talegenkendelse fungerer lige så godt som det gør, fordi vi ofte kan udfylde et hul ved at kende konteksten for den aktuelle samtale.

Dagens kunstige intelligenssystemer har ikke den dybe forståelse. Det vi ser nu er lav intelligens, evnen til at efterligne isolerede menneskelige anerkendelsesevner og undertiden overgå mennesker på disse isolerede opgaver. At træne et system på milliarder af eksempler er bare et spørgsmål om at have dataene og få adgang til nok beregningsressourcer - ikke en deal-breaker længere.

Chancerne er, at anvendeligheden af ​​kunstig intelligens i sidste ende vil falde et sted under propagandaen om "redd verden". Måske er alt, hvad vi får, et utroligt værktøj, som praktikere bruger til at udføre deres job hurtigere og bedre.

Michael Berthold er administrerende direktør og medstifter af KNIME, et open source dataanalysefirma. Han har mere end 25 års erfaring inden for datavidenskab, arbejdet i den akademiske verden, senest som fuld professor ved Konstanz University (Tyskland) og tidligere ved University of California (Berkeley) og Carnegie Mellon, og i industrien hos Intels Neural Network Group, Utopy og Tripos. Michael har udgivet meget om dataanalyse, maskinindlæring og kunstig intelligens. Følg Michael videreTwitter, LinkedIn og KNIME blog.

New Tech Forum giver et sted at udforske og diskutere nye virksomhedsteknologier i hidtil uset dybde og bredde. Valget er subjektivt baseret på vores valg af de teknologier, som vi mener er vigtige og af største interesse for læserne. accepterer ikke markedsføringssikkerhed til offentliggørelse og forbeholder sig retten til at redigere alt bidraget indhold. Send alle henvendelser til[email protected].