Може ли „свръхчовешката“ невронна мрежа на Google наистина да каже на местоположението на всяко изображение?

$config[ads_kvadrat] not found

Время и Стекло Так выпала Карта HD VKlipe Net

Время и Стекло Так выпала Карта HD VKlipe Net
Anonim

Търсенето на изображения е по-лесно от всякога. Но ако се опитвате да намерите картина на нещо на място, което не е съвсем очевидно (така че не египетските пирамиди или гигантската скулптура за палеца в Париж), е по-трудно, отколкото си мислите - дори и с информацията за геолокация, базирана на това в изображението.

Въведете инженера на Google на име Tobias Weyand и двама негови колеги. Според нов документ в списанието arXiv (произнася се „архив“), триото е изградило машина за дълбоко обучение, способна да определи местоположението на почти всяка снимка, основана единствено на анализ на неговите пиксели.

За да накарате една машина успешно да изпълни такава задача, искате да му дадете възможност да интуитирате информацията, базирана на визуални улики. Искаш да мислиш, с други думи, като човешко същество.

Weyand се зае да разработи изкуствена невронна мрежа - машинна система, предназначена да имитира неврологичните пътища на мозъка, които му позволяват да учи, обработва и припомня информация като човешки организъм. Тази нова система, PlaNet, очевидно е способна да превъзхожда хората при определяне на местоположенията на изображенията, независимо от настройката - било то на закрито или на открито, и с всякакви уникални или невидими визуални знаци.

Как се работи с PlaNet? Weyand и неговият екип разделиха картата на света в мрежа, която постави над 26 000 квадратни фигури в различни региони, в зависимост от това колко изображения са били заснети на тези места. Плътните места, където се правят много снимки, се вписват в по-малък квадрат, докато по-големите, по-отдалечени региони могат да се режат на по-големи квадрати.

След това екипът създаде голяма база данни с изображения, които вече са геолозирани - почти 126 милиона различни снимки. Около 91 милиона бяха използвани като набор от данни, за да научат PlaNet как да разберат коя снимка може да бъде поставена в коя мрежа на картата на света.

След това на невронната мрежа беше възложено да геолокира останалите 34 милиона изображения от базата данни. И накрая, PlaNet беше поставен на база данни от 2,3 милиона изображения с географско обозначение от Flickr.

Резултатите? PlaNet може да определи страната на произход за 28.4% от снимките и континента за 48%. Освен това системата може да определи местоположението на ниво улица за 3,6% от изображенията във Flickr и местоположението на ниво град за 10,1%.

И PlaNet е по-добър в това от повечето човешки същества - дори и най-големите глобуси. Weyand привлече 10 добре пътуващи лица, за да се съревновават с PlaNet в игра на етикетиране на местата на снимки, намерени в Google Street View.

„Общо PlaNet спечели 28 от 50 кръга с средна грешка на локализация от 1131.7 км, докато средната грешка при локализирането на човека е 2320.75 км”, пишат изследователите. "Този малък експеримент показва, че PlaNet достига свръхчовешка производителност при задачата за геолокация на Street View сцени."

Това наистина ли е? Инженерът на Google наистина ли е разработил „свръхчовешко“ A.I. система?

Когато става въпрос за геолокация на изображения, може би. И това не е изненадващо - точката на A.I. не е в основата да имитира човешкия мозък по всички начини, а да надмине човешките ограничения в няколко конкретни начина да изпълни много по-трудни задачи. Така че в този смисъл това, което пишат изследователите, е вярно.

И все пак, да се нарече PlaNet „невронна мрежа“. Идеална форма на този вид технологии би била способна да научи много повече от геолокацията на изображението. А.С. Системите могат да пишат сравнения и да играят супер Марио, но това е малък материал в сравнение с идеалната “майсторска” система, която може автоматично да наблюдава и поддържа жизнени функции, да управлява транспортната или енергийната инфраструктура и много други.

$config[ads_kvadrat] not found