Programmering

Hvad er ansigtsgenkendelse? AI for Big Brother

Kan Big Brother identificere dit ansigt fra CCTV-overvågning på gadeniveau og fortælle, om du er glad, trist eller sur? Kan denne identifikation føre til din anholdelse af en udestående kendelse? Hvad er oddsene for, at identifikationen er forkert og virkelig forbinder med en anden? Kan du besejre overvågningen helt ved hjælp af et trick?

På bagsiden kan du komme ind i en hvælving beskyttet af et kamera og ansigtsidentifikationssoftware ved at holde et udskrift af en autoriseret persons ansigt op? Hvad hvis du tager en 3-D maske af en autoriseret persons ansigt?

Velkommen til ansigtsgenkendelse - og spoofing af ansigtsgenkendelse.

Hvad er ansigtsgenkendelse?

Ansigtsgenkendelse er en metode til at identificere en ukendt person eller godkende en bestemt persons identitet fra deres ansigt. Det er en gren af ​​computersyn, men ansigtsgenkendelse er specialiseret og leveres med social bagage til nogle applikationer såvel som nogle sårbarheder over for spoofing.

Hvordan fungerer ansigtsgenkendelse?

De tidlige algoritmer til ansigtsgenkendelse (som stadig bruges i dag i forbedret og mere automatiseret form) er afhængige af biometri (såsom afstanden mellem øjnene) for at gøre de målte ansigtsegenskaber fra et todimensionelt billede til et sæt tal (en funktion vektor eller skabelon), der beskriver ansigtet. Genkendelsesprocessen sammenligner derefter disse vektorer med en database med kendte ansigter, som er blevet kortlagt til funktioner på samme måde. En komplikation i denne proces er at justere ansigterne til en normaliseret visning for at tage højde for hovedrotation og vipning, før metrics ekstraheres. Denne klasse af algoritmer kaldes geometrisk.

En anden tilgang til ansigtsgenkendelse er at normalisere og komprimere 2-D ansigtsbilleder og sammenligne disse med en database med lignende normaliserede og komprimerede billeder. Denne klasse af algoritmer kaldes fotometrisk.

Tredimensionel ansigtsgenkendelse bruger 3-D-sensorer til at fange ansigtsbilledet eller rekonstruerer 3-D-billedet fra tre 2-D-sporingskameraer peget i forskellige vinkler. 3-D ansigtsgenkendelse kan være betydeligt mere nøjagtig end 2-D-genkendelse.

Hudstrukturanalyse kortlægger linjer, mønstre og pletter på en persons ansigt til en anden funktionsvektor. Tilføjelse af hudstrukturanalyse til 2-D eller 3-D ansigtsgenkendelse kan forbedre genkendelsesnøjagtigheden med 20 til 25 procent, især i tilfælde af look-alikes og tvillinger. Du kan også kombinere alle metoderne og tilføje multispektrale billeder (synligt lys og infrarødt) for endnu mere nøjagtighed.

Ansigtsgenkendelse er blevet forbedret år efter år, siden feltet startede i 1964. I gennemsnit er fejlprocenten reduceret med halvdelen hvert andet år.

Relateret video: Sådan fungerer ansigtsgenkendelse

Test af leverandør af ansigtsgenkendelse

NIST, US National Institute of Standards and Technology, har udført tests af ansigtsgenkendelsesalgoritmer, Face Recognition Vendor Test (FRVT), siden 2000. De anvendte billeddatasæt er for det meste retshåndhævende krusskud, men inkluderer også in-the- vilde stillbilleder, som dem, der findes i Wikimedia, og billeder i lav opløsning fra webkameraer.

FRVT-algoritmerne indsendes for det meste af kommercielle leverandører. Sammenligningerne fra år til år viser store gevinster i ydeevne og nøjagtighed; ifølge leverandørerne skyldes dette primært brugen af ​​dybe nedbrydningsneurale netværk.

Relaterede NIST-ansigtsgenkendelsesprøvningsprogrammer har undersøgt demografiske effekter, påvisning af ansigtsformning, identifikation af ansigter, der er lagt ud på sociale medier, og identifikation af ansigter i video. En tidligere serie af tests blev udført i 1990'erne under en anden moniker, Face Recognition Technology (FERET).

NIST

Ansigtsgenkendelsesapplikationer

Ansøgninger om ansigtsgenkendelse falder for det meste i tre hovedkategorier: sikkerhed, sundhed og markedsføring / detailhandel. Sikkerhed inkluderer retshåndhævelse, og denne klasse af ansigtsgenkendelsesanvendelser kan være så godartede som at matche mennesker til deres pasfotos hurtigere og mere præcist end mennesker kan, og så uhyggelige som scenariet "Person of Interest", hvor folk spores via CCTV og sammenlignes til sorterede fotodatabaser. Ikke-retshåndhævende sikkerhed inkluderer almindelige applikationer såsom ansigtslåsning til mobiltelefoner og adgangskontrol til laboratorier og hvælvinger.

Sundhedsanvendelser af ansigtsgenkendelse inkluderer patientkontrol, realtidsregistrering af følelser, patientsporing inden for en facilitet, vurdering af smerteniveauer hos ikke-verbale patienter, påvisning af visse sygdomme og tilstande, identifikation af personale og sikkerhedsfacilitet. Marketing og detailanvendelser af ansigtsgenkendelse inkluderer identifikation af medlemmer af loyalitetsprogrammet, identifikation og sporing af kendte butikstyveri og anerkendelse af mennesker og deres følelser for målrettede produktforslag.

Kontroverser, fordomme og forbud mod ansigtsgenkendelse

At sige, at nogle af disse applikationer er kontroversielle, ville være en underdrivelse. Som en artikel fra New York Times fra 2019 diskuterer, har ansigtsgenkendelse svirret i kontroverser, fra dets anvendelse til stadionovervågning til racistisk software.

Stadionovervågning? Ansigtsgenkendelse blev brugt i Super Bowl i 2001: softwaren identificerede 19 personer, der blev anset for at være emner for udestående warrants, selvom ingen blev arresteret (ikke på grund af manglende forsøg).

Racistisk software? Der har været flere problemer, startende med 2009-ansigtssporingssoftwaren, der kunne spore hvide, men ikke sorte, og fortsatte med MIT-undersøgelsen fra 2015, der viste, at datidens ansigtsgenkendelsessoftware fungerede meget bedre på hvide mandlige ansigter end kvindelige og / eller Sorte ansigter.

Denne slags problemer har ført til direkte forbud mod ansigtsgenkendelsessoftware på bestemte steder eller til specifikke anvendelser. I 2019 blev San Francisco den første store amerikanske by, der forhindrede politi og andre retshåndhævende organer i at bruge ansigtsgenkendelsessoftware; Microsoft opfordrede til føderale regler om ansigtsgenkendelse; og MIT viste, at Amazon Rekognition havde flere problemer med at bestemme kvindeligt køn end mandligt køn ud fra ansigtsbilleder, samt flere problemer med sort kvindeligt køn end hvidt kvindeligt køn.

I juni 2020 meddelte Microsoft, at de ikke vil sælge og ikke har solgt sin ansigtsgenkendelsessoftware til politiet. Amazon forbød politiet at bruge Rekognition i et år; og IBM opgav sin ansigtsgenkendelsesteknologi. Det er dog ikke let at forbyde ansigtsgenkendelse, da det er bredt anvendt i iPhones (Face ID) og andre enheder, software og teknologier.

Ikke alle ansigtsgenkendelsessoftware lider under de samme fordomme. NIST-demografiske effekter i 2019 fulgte op på MIT-arbejdet og viste, at algoritmisk demografisk bias varierer meget blandt udviklere af ansigtsgenkendelsessoftware. Ja, der er demografiske effekter på den falske matchningshastighed og falske ikke-matchningshastighed for ansigtsidentifikationsalgoritmer, men de kan variere med flere størrelsesordener fra leverandør til sælger, og de er faldende over tid.

Hacking ansigtsgenkendelse og anti-spoofing teknikker

I betragtning af den potentielle privatlivstrussel fra ansigtsgenkendelse og tiltrækningen ved at få adgang til værdifulde ressourcer beskyttet af ansigtsgodkendelse har der været mange bestræbelser på at hacke eller spoofte teknologien. Du kan præsentere et udskrevet billede af et ansigt i stedet for et levende ansigt eller et billede på en skærm eller en 3D-udskrevet maske for at bestå godkendelse. Til CCTV-overvågning kan du afspille en video. For at undgå overvågning kan du prøve “CV Dazzle” -stoffer og make-up og / eller IR-lysemittere for at narre softwaren til ikke at registrere dit ansigt.

Selvfølgelig er der bestræbelser på at udvikle anti-spoofing-teknikker til alle disse angreb. For at detektere trykte billeder bruger leverandører en levetidstest, som f.eks. At vente på, at motivet blinker, eller udføre bevægelsesanalyse eller bruge infrarød til at skelne et levende ansigt fra et udskrevet billede. En anden tilgang er at udføre mikro-teksturanalyse, da menneskelig hud adskiller sig optisk fra udskrifter og maskeringsmaterialer. De nyeste anti-spoofing teknikker er for det meste baseret på dybe nedbrydning neurale netværk.

Dette er et felt under udvikling. Der foregår en våbenkrig mellem angribere og anti-spoofing-software såvel som akademisk forskning om effektiviteten af ​​forskellige angrebs- og forsvarsteknikker.

Leverandører af ansigtsgenkendelse

Ifølge Electronic Frontier Foundation er MorphoTrust, et datterselskab af Idemia (tidligere kendt som OT-Morpho eller Safran), en af ​​de største leverandører af ansigtsgenkendelse og anden biometrisk identifikationsteknologi i USA. Det har designet systemer til statslige DMV'er, føderale og statslige retshåndhævende myndigheder, grænsekontrol og lufthavne (inklusive TSA PreCheck) og statsafdelingen. Andre almindelige leverandører inkluderer 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst og NEC Global.

NIST Face Recognition Vendor Test viser algoritmer fra mange flere leverandører fra hele verden. Der er også flere open source-ansigtsgenkendelsesalgoritmer af forskellig kvalitet og et par store skytjenester, der tilbyder ansigtsgenkendelse.

Amazon Rekognition er en billed- og videoanalysetjeneste, der kan identificere objekter, mennesker, tekst, scener og aktiviteter, herunder ansigtsanalyse og brugerdefinerede etiketter. Google Cloud Vision API er en præ-trænet billedanalysetjeneste, der kan registrere objekter og ansigter, læse udskrevet og håndskrevet tekst og opbygge metadata i dit billedkatalog. Google AutoML Vision giver dig mulighed for at træne brugerdefinerede billedmodeller.

Azure Face API udfører ansigtsgenkendelse, der opfatter ansigter og attributter i et billede, udfører personidentifikation, der matcher en person i dit private lager på op til 1 million mennesker, og udfører opfattet følelsesgenkendelse. Face API kan køre i skyen eller på kanten i containere.

Ansigtsdatasæt til genkendelsestræning

Der er snesevis af ansigtsdatasæt tilgængelige til download, der kan bruges til genkendelsestræning. Ikke alle ansigtsdatasæt er ens: De har en tendens til at variere i billedstørrelse, antal repræsenterede personer, antal billeder pr. Person, billedforhold og belysning. Retshåndhævelse har også adgang til ikke-offentlige ansigtsdatasæt, såsom aktuelle mugshots og kørekortbilleder.

Nogle af de større ansigtsdatabaser er mærket ansigter i naturen med ~ 13.000 unikke mennesker; FERET, brugt til de tidlige NIST-tests; Mugshot-databasen, der bruges i den igangværende NIST FRVT; SCFace-overvågningskameradatabasen, også tilgængelig med ansigtsmærker og mærkede Wikipedia-ansigter med ~ 1,5K unikke identiteter. Flere af disse databaser indeholder flere billeder pr. Identitet. Denne liste fra forsker Ethan Meyers tilbyder nogle gode råd om at vælge et ansigtsdatasæt til et bestemt formål.

Sammenfattende forbedres ansigtsgenkendelse, og leverandører lærer at registrere mest spoofing, men nogle applikationer af teknologien er kontroversielle. Fejlfrekvensen for ansigtsgenkendelse halveres hvert andet år ifølge NIST. Sælgere har forbedret deres anti-spoofing-teknikker ved at inkorporere nedbrydningsneurale netværk.

I mellemtiden er der initiativer til at forbyde brugen af ​​ansigtsgenkendelse under overvågning, især af politiet. At forbyde ansigtsgenkendelse helt ville være vanskeligt, dog i betragtning af hvor udbredt det er blevet.

Læs mere om maskinlæring og dyb læring:

  • Deep learning versus machine learning: Forstå forskellene
  • Hvad er maskinindlæring? Intelligens afledt af data
  • Hvad er dyb læring? Algoritmer, der efterligner den menneskelige hjerne
  • Machine learning algoritmer forklaret
  • Automatiseret maskinindlæring eller AutoML forklaret
  • Overvåget læring forklaret
  • Semi-overvåget læring forklaret
  • Uovervåget læring forklaret
  • Forstærket læring forklaret
  • Hvad er computersyn? AI til billeder og video
  • Hvad er ansigtsgenkendelse? AI for Big Brother
  • Hvad er naturlig sprogbehandling? AI til tale og tekst
  • Kaggle: Hvor dataforskere lærer og konkurrerer
  • Hvad er CUDA? Parallel behandling til GPU'er