Programmering

Anmeldelse: Google Cloud AI lyser maskinindlæring

Google har en af ​​de største machine learning-stakke i branchen, der i øjeblikket er centreret om sin Google Cloud AI og Machine Learning Platform. Google spredte TensorFlow ud som open source for mange år siden, men TensorFlow er stadig den mest modne og mest citerede dyb læringsramme. På samme måde spredte Google Kubernetes ud som open source for mange år siden, men det er stadig det dominerende containerhåndteringssystem.

Google er en af ​​de største kilder til værktøjer og infrastruktur for udviklere, dataforskere og maskinindlæringseksperter, men historisk har Google AI ikke været så attraktivt for forretningsanalytikere, der mangler seriøs datavidenskab eller programmeringsbaggrund. Det begynder at ændre sig.

Google Cloud AI og Machine Learning Platform inkluderer AI-byggesten, AI-platformen og acceleratorer og AI-løsninger. AI-løsninger er ret nye og rettet mod forretningsledere snarere end dataforskere. De kan omfatte rådgivning fra Google eller dets partnere.

AI-byggestenene, som er foruddannede men tilpasses, kan bruges uden intim viden om programmering eller datalogi. Ikke desto mindre bruges de ofte af dygtige dataforskere af pragmatiske grunde, hovedsageligt for at få ting gjort uden omfattende modeluddannelse.

AI-platformen og acceleratorerne er generelt til seriøse dataforskere og kræver kodningsfærdigheder, viden om dataforberedelsesteknikker og masser af træningstid. Jeg anbefaler at gå der kun efter at have prøvet de relevante byggesten.

Der er stadig nogle manglende links i Google Clouds AI-tilbud, især i dataforberedelse. Det tætteste, som Google Cloud har til en dataimport- og konditioneringstjeneste, er tredjeparts Cloud Dataprep af Trifacta; Jeg prøvede det for et år siden og var overvældet. Funktionsteknikken indbygget i Cloud AutoML-tabeller er dog lovende, og det ville være nyttigt at have den slags service tilgængelig til andre scenarier.

Den søde underside af AI har at gøre med etik og ansvar (eller manglen på dem) sammen med vedvarende modelforstyrrelser (ofte på grund af partiske data, der bruges til træning). Google offentliggjorde sine AI-principper i 2018. Det er et igangværende arbejde, men det er et grundlag for vejledning som diskuteret i et nyligt blogindlæg om ansvarlig AI.

Der er masser af konkurrence på AI-markedet (over et dusin leverandører), og masser af konkurrence på det offentlige cloudmarked (over et halvt dusin troværdige leverandører). For at gøre sammenligningerne retfærdige, bliver jeg nødt til at skrive en artikel mindst fem gange så længe som denne, så så meget som jeg hader at udelade dem, bliver jeg nødt til at udelade de fleste produktsammenligninger. Til den mest åbenlyse sammenligning kan jeg opsummere: AWS gør det meste af det, som Google gør, og er også meget godt, men opkræver generelt højere priser.

Google Cloud AI-byggesten

Google Cloud AI-byggesten er brugervenlige komponenter, som du kan integrere i dine egne applikationer for at tilføje syn, sprog, samtale og strukturerede data. Mange af AI-byggestenene er foruddannede neurale netværk, men kan tilpasses med transferindlæring og neuralt netværkssøgning, hvis de ikke tjener dine behov med det samme. AutoML-tabeller er lidt anderledes, idet det automatiserer den proces, som en datavidenskabsmand vil bruge til at finde den bedste maskinlæringsmodel til et tabelformat datasæt.

AutoML

Google Cloud AutoML-tjenesterne leverer tilpassede dybe neurale netværk til oversættelse af sprogpar, klassifikation af tekst, objektdetektion, billedklassificering og videoobjektklassificering og -sporing. De kræver taggede data til træning, men kræver ikke betydelig viden om dyb læring, transferlæring eller programmering.

Google Cloud AutoML tilpasser Googles kamptestede dybe neurale netværk med høj nøjagtighed til dine taggede data. I stedet for at starte fra bunden, når du træner modeller fra dine data, implementerer AutoML automatisk dyb overførselsindlæring (hvilket betyder, at den starter fra et eksisterende dybt neuralt netværk, der er trænet i andre data) og neural arkitektur-søgning (hvilket betyder, at den finder den rigtige kombination af ekstra netværkslag ) til oversættelse af sprogpar og de andre tjenester, der er anført ovenfor.

I hvert område har Google allerede en eller flere foruddannede tjenester baseret på dybe neurale netværk og enorme sæt mærkede data. Disse fungerer muligvis for dine data umodificerede, og du bør teste det for at spare dig tid og penge. Hvis de ikke gør det, du har brug for, hjælper Google Cloud AutoML dig med at oprette en model, der gør det, uden at du behøver at vide, hvordan du udfører transferindlæring eller hvordan man designer neurale netværk.

Transferlæring tilbyder to store fordele i forhold til at træne et neuralt netværk fra bunden. For det første kræver det meget mindre data til træning, da de fleste af lagene i netværket allerede er veluddannede. For det andet træner det meget hurtigere, da det kun optimerer de endelige lag.

Mens Google Cloud AutoML-tjenesterne tidligere blev præsenteret sammen som en pakke, er de nu opført med deres basale foruddannede tjenester. Hvad de fleste andre virksomheder kalder AutoML, udføres af Google Cloud AutoML-tabeller.

Læs hele anmeldelsen af ​​Google Cloud AutoML

AutoML-tabeller

Den sædvanlige datavidenskabelige proces for mange regressions- og klassifikationsproblemer er at oprette en datatabel til træning, rense og konditionere dataene, udføre funktionsteknik og forsøge at træne alle de relevante modeller på det transformerede bord, inklusive et trin til optimering de bedste modeller 'hyperparametre. Google Cloud AutoML-tabeller kan udføre hele denne proces automatisk, når du manuelt identificerer målfeltet.

AutoML-tabeller søger automatisk gennem Googles modelzoo efter strukturerede data for at finde den bedste model til dine behov, lige fra lineære / logistiske regressionsmodeller for enklere datasæt til avancerede dyb-, ensemble- og arkitektursøgemetoder til større, mere komplekse. Det automatiserer funktionsteknik på en bred vifte af data-primitiver i tabelform - såsom tal, klasser, strenge, tidsstempler og lister - og hjælper dig med at opdage og tage sig af manglende værdier, afvigelser og andre almindelige dataspørgsmål.

Dens kodeløse grænseflade guider dig gennem den fulde ende-til-ende maskinlæringslivscyklus, hvilket gør det nemt for alle på dit team at opbygge modeller og pålideligt integrere dem i bredere applikationer. AutoML-tabeller leverer omfattende inputdata og funktioner til forklaring af adfærdsmodeller sammen med gelænder for at forhindre almindelige fejl. AutoML-tabeller er også tilgængelige i API- og notebook-miljøer.

AutoML-tabeller konkurrerer med Driverless AI og flere andre AutoML-implementeringer og rammer.

Vision API

Google Cloud Vision API er en foruddannet maskinlæringstjeneste til kategorisering af billeder og udpakning af forskellige funktioner. Det kan klassificere billeder i tusindvis af foruddannede kategorier, der spænder fra generiske genstande og dyr, der findes i billedet (såsom en kat), til generelle forhold (for eksempel skumring) til specifikke vartegn (Eiffeltårnet, Grand Canyon), og identificere billedets generelle egenskaber, såsom dets dominerende farver. Det kan isolere områder, der er ansigter, derefter anvende geometriske (ansigtsorientering og vartegn) og følelsesmæssige analyser på ansigterne, selvom det ikke genkender ansigter som tilhører bestemte mennesker, undtagen berømtheder (som kræver en særlig brugslicens). Vision API bruger OCR til at registrere tekst i billeder på mere end 50 sprog og forskellige filtyper. Det kan også identificere produktlogoer og registrere voksent, voldeligt og medicinsk indhold.

Læs hele anmeldelsen af ​​Google Cloud Machine Learning API'er

Video Intelligence API

Google Cloud Video Intelligence API genkender automatisk mere end 20.000 objekter, steder og handlinger i gemt og streaming video. Det skelner også sceneændringer og udtrækker rige metadata på video-, optagelses- eller billedniveau. Derudover udfører det tekstdetektion og -udtrækning ved hjælp af OCR, registrerer eksplicit indhold, automatiserer lukket billedtekst og undertekster, genkender logoer og registrerer ansigter, personer og udgør.

Google anbefaler Video Intelligence API til udpakning af metadata til indeksering, organisering og søgning af dit videoindhold. Det kan transskribe videoer og generere undertekster samt markere og filtrere upassende indhold, alt mere omkostningseffektivt end menneskelige transkriberere. Brugssager inkluderer indholdsmoderering, indholdsanbefalinger, mediearkiver og kontekstuelle reklamer.

Natural Language API

Naturlig sprogbehandling (NLP) er en stor del af den "hemmelige sauce", der får input til Google Søgning og Google Assistent til at fungere godt. Google Cloud Natural Language API udsætter den samme teknologi for dine programmer. Det kan udføre syntaksanalyse (se billedet nedenfor), enhedsekstraktion, sentimentanalyse og indholdsklassificering på 10 sprog. Du kan specificere sproget, hvis du kender det; Ellers forsøger API'et automatisk at opdage sproget. En separat API, der i øjeblikket er tilgængelig til tidlig adgang på anmodning, har specialiseret sig i sundhedsrelateret indhold.

Læs hele anmeldelsen af ​​Google Cloud Machine Learning API'er

Oversættelse

Google Cloud Translation API kan oversætte over hundrede sprogpar, kan automatisk registrere kildesproget, hvis du ikke angiver det, og kommer i tre varianter: Basic, Advanced og Media Translation. Advanced Translation API understøtter en ordliste, batchoversættelse og brugen af ​​brugerdefinerede modeller. Basic Translation API er i det væsentlige det, der bruges af forbrugerens Google Translate-grænseflade. AutoML-oversættelse giver dig mulighed for at træne brugerdefinerede modeller ved hjælp af transfer learning.

Media Translation API oversætter indhold direkte fra lyd (tale), enten lydfiler eller streams, på 12 sprog og genererer automatisk tegnsætning. Der er separate modeller til lyd og videoopkald.

Læs hele anmeldelsen af ​​Google Cloud Machine Learning API'er

$config[zx-auto] not found$config[zx-overlay] not found