University of Valencia logo Logo Master's Degree in Data Science Logo del portal

Apple fa públic el seu primer informe sobre Intel•ligència Artificial

Apple fa públic el seu primer informe sobre Intel•ligència Artificial

El passat 22 de desembre de 2016, una de les majors empreses tecnològiques del món, Apple, va publicar una investigació sobretot el que ha aprés en el terreny de la Intel·ligència Artificial (AI), que es basa fonamentalment en el camp del reconeixement avançat d’imatges.

10 january 2017

L’informe fa referència a un sistema de reconeixement d’imatges molt familiar al qual s’empra en les fotografies per a iOS, però amb major nivell de sofisticació. Segons publica la web applesfera.com, a diferència d’altres sistemes d’aprenentatge, el sistema proposat per Apple empra una tècnica que millore la capacitat de l’algoritme a l’hora de reconéixer imatges utilitzant aquelles generades per ordinador (com les d’un videojoc). Açò és a causa que per entrenar les xarxes neuronals del software en AI, són més efectives les imatges sintètiques que les del món real, perquè les dades de les imatges artificials ja estan etiquetades i anotades, mentre que les d’una imatge real requereixen que algú etiquete exhaustivament tot el que l’ordinador està veient.

El sistema proposat per Apple empra una tècnica que millore la capacitat de l’algoritme a l’hora de reconéixer imatges utilitzant aquelles generades per ordinador

Per tant, la investigació se centra concretament en la realització d’imatges falses realistes –en la seua majoria d’éssers humans- per entrenar el reconeixement facial AI. L’entrenament d’una màquina requereix ja per si d’una gran quantitat de dades, però és que a més a més la seua formació en qüestions com les cares i el llenguatge corporal pot duplicar la quantitat de dades personals necessàries per a fer-ho possible. No obstant això, de ser possible, la capacitat de fabricar aquest tipus de dades d’entrenament i encara millorar alts resultats podria permetre a Apple construir AI que entenga com funcionen els éssers humans sense necessitat d'usar cap dada d’usuari mentre que es construïsca el software.

La capacitat de fabricar aquest tipus de dades d’entrenament i encara millorar alts resultats podria permetre a Apple construir AI que entenga com funcionen els éssers humans

Així mateix, segons el document d’Apple, l’enfocament de la imatge sintètica pot ser problemàtic, ja que el que l’algoritme aprén no sempre es trasllada de forma efectiva en escenes de la realitat. Les dades de la imatge sintètica sovint no són suficientment realistes, per la qual cosa la xarxa aprén solament detalls artificials que no es tradueixen bé en imatges reals. Amb l’objectiu de millorar l’entrenament amb les dades d’imatges sintètiques, en l’informe els investigadors d’Apple criden al procés d’investigació: “Simulació + Aprenentatge sense supervisió”, on el realisme de la imatge ha de ressaltar-se encara més. Els investigadors utilitzen així una versió modificada d’una nova tècnica d’aprenentatge nomenada Generative Adversarial networks diferent de qualsevol altra que haja sigut utilitzada per a generar imatges foto-realistes.

En aquest sentit, l’estudi tracta d’identificar gestos de les mans i detectar on estan mirant les persones, exemples de problemes bàsics de reconeixement d’imatge que podria aplicar-se a qualsevol cosa, des del seguiment del comportament de l’usuari fins a una característica d’onda per a desbloquejar l’iPhone. En ambdós casos, els investigadors tomaren conjunts de dades establerts d’imatges sintètiques, i utilitzaren una xarxa neuronal entrenada en imatges reals per a redefinir-les perquè paregueren encara més realistes. A continuació, el sistema compara la imatge redefinida com una imatge real, intenta decidir que imatge és real i s’actualitza d'acord ambl que el sistema jutja com a fals en comparació amb la imatge real.

Els investigadors tomaren conjunts de dades establerts d’imatges sintètiques, i utilitzaren una xarxa neuronal entrenada en imatges reals per a redefinir-les perquè paregueren encara més realistes

L’autor principal de l’informe és l’investigador d’Apple Ashis Shrivastava, que té un doctorat en visió per ordinador de la Universitat de Meryland. La resta de treballadors d’Apple que també col·laboren en la redacció de l’informe foren: Tomas Pfiser, Oncel Tuzel, Wenda Wang, Russ Webb i Josh Susskind, els quals cofundaren una startup sobre intel·ligència Artificial, que avaluava les emocions d’una persona en mirar les seues expressions facials, coneguda com a Emotient, la qual Apple va adquirir l'any passat.

Cal destacar, per tant, que aquest primer informe d’Apple, pel que fa a Intel·ligència Artificial es refereix, suposa un gran avanç per a la companyia. Durant anys, la comunitat d’investigadors en AI ha sigut molt crítica amb el secretisme d’Apple, el qual ha perjudicat la companyia en més d’una ocasió a l’hora de contractat nous talents en aquest camp. Així, aquesta apertura amb la comunitat és important per a Apple, donat que contribueix a expandir en la indústria tecnològica els avanços del software en Intel·ligència Artificial, el qual s’està convertint en un element essencial per a tot, des de les capacitats de les càmeres en els últims iPhone d’Apple fins als servicis d’Internet que s'executen dintre de les seues dades.