Dezvoltarea de la Facebook va permite AI să navigheze într-un mediu necunoscut fără o hartă

Dezvoltatorii de la Facebook AI sunt gata să introducă în viitor un nou algoritm de învățare prin consolidare numit DD-PPO.

Acest nou produs va permite sistemelor AI să navigheze în medii necunoscute folosind exclusiv coordonatele obținute de la o busolă, o cameră RGB-D și GPS.

Cu alte cuvinte, din momentul introducerii noii tehnologii, toate mașinile inteligente care interacționează îndeaproape cu lumea fizică vor putea naviga eficient într-un mediu complet nefamiliar, fără a utiliza nicio hartă.

Această tehnologie a fost mult timp un obiectiv al comunității AI.

Necesitatea acestei dezvoltări constă în faptul că hărțile moderne ale lumii reale devin rapid depășite.

În unele cazuri, câteva luni sunt suficiente pentru ca obiectul dorit să-și schimbe locația.

Din acest motiv, inginerii intenționează să creeze AI pentru lumea fizică care va putea naviga fără ajutorul unei hărți.

Acum, cercetătorii Facebook AI au dezvoltat un nou algoritm de învățare care rezolvă eficient navigarea prin puncte folosind instrumente precum o busolă, camere RGB-D și GPS.

Sistemele existente bazate pe învățarea automată depășesc experții umani atât în știință, cât și în diverse jocuri complexe.

Dezavantajul lor este că se bazează pe un strat uriaș de instrumente de predare.

DD-PPO funcționează sincron pe mai multe mașini și nu are un server de parametri.

În același timp, DD-PPO demonstrează o scalare aproape liniară și o navigare aproape perfectă în puncte.

Într-un astfel de sistem, un punct de plecare este stabilit într-o poziție aleatorie într-un mediu necunoscut și are sarcina de a se muta la coordonatele țintă fără a utiliza o hartă.

Dispozitivul în sine poate folosi doar o busolă, GPS și o cameră RGB sau RGB-D.

Inginerii au folosit caracteristica de scalare a DD-PPO pentru a instrui agentul în 2,5 miliarde de pași.

Această cifră este egală cu 80 de ani de experiență umană.

Toate fazele de antrenament au fost finalizate în mai puțin de trei zile cu 64 de GPU-uri.

După cum sa dovedit, 90% din performanța maximă a avut loc în primele 100 de milioane de pași cu mai puține resurse de calcul.

Deja în stadiul de miliard de pași, agentul a obținut o experiență și o rată de succes de 99,9%, în timp ce sistemele anterioare au obținut un succes de 92%.

Astfel de sisteme vor putea în viitor să afișeze informații relevante utilizatorilor care poartă ochelari de realitate augmentată.

În plus, modelele dezvoltate pot funcționa chiar și în clădirile de birouri unde hărțile și datele GPS nu sunt disponibile.

Fotografie: Pixabay