Новият алгоритъм на Масачузетския технологичен институт може да предскаже човешките взаимодействия преди те да станат неудобни

$config[ads_kvadrat] not found

Время и Стекло Так выпала Карта HD VKlipe Net

Время и Стекло Так выпала Карта HD VKlipe Net
Anonim

Неспособността ни да четем други хора е довела до някои епични високи пет и пропуснати целувки. Дори след дългогодишен опит, човешките взаимодействия са трудни за предвиждане. Но изследователите от Лабораторията по компютърни науки и изкуствен интелект на MIT смятат, че могат да помогнат: С нов алгоритъм за дълбоко обучение, който може да предскаже кога двама души ще се прегръщат, целуват, ще се ръкуват или ще са пет, те са направили голяма крачка към бъдещето благословено лишен от тези неудобни моменти.

Надяват се, че новият им алгоритъм - обучен за 600 часа видеоклипове и телевизионни предавания в YouTube Офиса, Scrubs, Теория за Големия взрив, и Отчаяни съпруги - може да се използва за програмиране на по-малко социално неудобни роботи и разработване на слушалки в стил Google Glass, за да предложи действия за нас, преди дори да имаме шанс да пропуснем. В бъдеще те си представят, че никога повече няма да объркаш шанс да излъчиш високо 5 с колегата си.

Осъзнаването, че роботите се научават да бъдат социални по същия начин, по който работим, беше ключът към успеха на алгоритъма. „Хората автоматично се научават да предвиждат действия чрез опит, което ни кара да се интересуваме от опитите на компютрите със същия здрав разум“, казва д-р CSAIL. ученикът Карл Вондрик, първият автор, свързан с хартия, представен тази седмица на Международната конференция по компютърна визия и разпознаване на образи. "Искахме да покажем, че само чрез гледане на големи количества видео, компютрите могат да получат достатъчно знания, за да могат да правят прогнози за заобикалящата ги среда."

Вондрик и неговият екип научиха многобройните „невронни мрежи“ на алгоритъма да анализират огромни количества данни в този случай, часовете на високите пет Джим и Пам, и тайните целувки на Майк и Сюзън, сами по себе си. Като се вземат предвид фактори като изпънати ръце, вдигната ръка или продължителен поглед, всяка от невронните мрежи предполага, че ще се случи през следващата секунда, а общият консенсус на мрежите се приема като последно „предсказание“ в проучване.

Алгоритъмът се оправя над 43% от времето. Макар това да не изглежда достатъчно високо, за да гарантираме, че ежедневните ни взаимодействия ще бъдат по-малко странни, това е голямо подобрение на съществуващите алгоритми, които имат точност от само 36%.

Освен това, хората могат да предсказват действия само 71 процента от времето. Нуждаем се от цялата помощ, която можем да получим.

Във втората част на проучването алгоритъмът е бил научен да предсказва какъв обект - домашните примки за сериали като дистанционно управление, чинии и кофи за боклук - ще се появят на сцената пет секунди по-късно. Например, ако вратата на микровълновата врата е отворена, има сравнително голям шанс да се появи чаша.

Алгоритъмът им все още не е достатъчно точен за Google Glass, но с съавтор Антонио Торралба - финансиран от наградата за научни изследвания на факултета на Google и Vondrick, работещ с докторантурата на Google. общение - можем да се обзаложим, че стига там. Бъдещите версии на алгоритъма, предсказва Вондик, могат да се използват за програмиране на роботи за взаимодействие с хора или дори за обучение на камери за сигурност, за да се регистрират, когато човек падне или се нарани.

„Видеоклипът не е като книга„ Избери собствено приключение ”, където можете да видите всички потенциални пътеки“, казва Вондик. "Бъдещето е по своята същност двусмислено, така че е вълнуващо да предизвикаме себе си да разработим система, която използва тези представяния, за да предвиди всички възможности."

$config[ads_kvadrat] not found