Тази AI невронна мрежа от Nvidia създава фотореалистични фалшиви изображения

$config[ads_kvadrat] not found

Анна Седокова Между нами кайф

Анна Седокова Между нами кайф
Anonim

С един поглед снимката отгоре прилича на обикновена снимка на обикновена улица, взета или от тире, или от някой глупав човек, който се скита по пътя, за да снима картина на такава светска сцена.

Но погледнете малко по-близо. Забележете как светофарът е леко изкривен или как някои от автомобилите изглеждат размити? Тук нещо не е наред. Това изобщо не е снимка. Това е изображение, създадено изцяло от A.I.

Компютърни учени от технологичната компания Nvidia и Калифорнийския университет в Бъркли са написали научна статия, достъпна в препринт за arXiv, в която подробно е описано как са успели да получат невронна мрежа, за да генерират реалистични изображения на улицата и човешки портрети. Те дори включиха потребителски интерфейс, който ви позволява да променяте снимките, както бихте искали, като добавите допълнително листа или дори да промените времето.

„Игрите растат бързо, защото хората обичат да общуват помежду си във виртуална среда“, казва Минг-Ю Лиу, старши учен в Nvidia. обратен в имейл. „Въпреки това, изграждането на виртуални светове е скъпо с днешните технологии, тъй като изисква от художниците изрично да моделират и симулират текстура и осветление за света, който строят. С превода на изображение към изображение можем вместо това да направим пример от реалния свят, за да създадем виртуални светове."

Невронните мрежи са компютри, моделирани да работят като човешки мозък, като приемат информация, прилагат я и се учат от резултатите. Това изследване използва специални видове невронни мрежи, въведени от Иън Гудфелоу през 2014 г., наречени генеративни състезателни мрежи - или GANs - които обикновено се състоят от две мрежи - генератора и дискриминатора.

Генераторът получава снимки и започва да създава синтетични образи, подобни на тези, които е дал. След това тя показва смесица от изображения, които е била дадена, и фалшификатите на дискриминатора, чиято работа е да ги раздели. Тъй като този процес продължава, генераторът става по-добър в имитирането на оригиналните изображения и дискриминаторът става по-добър в разказването на фалшификатите. Резултатите са някои доста убедителни - и напълно фалшиви - снимки.

Това изследване се основава на традиционния модел на GAN, като добавя разделяне на генераторните и дискриминационните мрежи в няколко подмрежи, което позволява извеждането на изображения с по-висока резолюция. Невронните мрежи също могат да приемат семантична карта - или план за това как трябва да изглежда снимката - и да попълват текстурите автономно. Потребителите могат дори да влязат в плана и да променят нещата, ако искат да добавят сгради вместо дървета в уличен изглед или да направят очите си по-широки в портрет.

Документът сравнява резултатите си с подобни експерименти, направени с този метод, най-забележителният от които е pix2pix. Изследването на Nvidia и UC Berkeley е в състояние да генерира изображения с малки детайли и точни като четливи регистрационни номера, докато pix2pix извежда изображения, които почти приличат на акварелни картини.

Макар че този инструмент може да бъде използван, за да спечели някаква безплатна reddit карма с няколко странни снимки, авторите виждат огромен потенциал в използването на този подход за генериране на реалистична графика само с прост план.

Стотици труден труд отиват в генерирането на виртуални светове за използване в Google Карти, филми и видео игри. Лиу казва, че този модел може да послужи като начин за безболезнено получаване на по-голямата част от проектирането и след това да влезете и да настроите детайлите по-късно.

„Вместо да визуализираме света чрез явно моделиране, можем да изградим света косвено, като използваме превод от изображение към изображение, за да преведем между прост модел на света, който не съдържа никаква текстура или осветление, и фотореалистичен изход, Тази способност трябва да направи много по-евтино изграждането на виртуални светове ”, казва той обратен.

За следващата стъпка в това проучване, екипът се надява да проучи видео-към-видео превод, който ще използва невронни мрежи за създаване на реалистични видеоклипове. Целта, която Луи казва, е предизвикателство за изследователите в тази област.

Сега знаете колко лесно могат да бъдат създадени фалшиви изображения. Не се доверявайте на всичко, което виждате в изображенията на Google.

$config[ads_kvadrat] not found