The Princeton Summer Journal: The Big Funk Concert
Джи-Сунг Ким прекара ранните сутрешни часове на първия уикенд на април, зареден с кофеин и кодиращ на компютъра си, докато разработваше дълбоко обучаващ се музикален генератор. 20-годишният първокурсник по компютърни науки в Принстън имаше само 36 часа, за да завърши deepjazz по време на първия си хакатон, HackPrinceton, който се проведе на 1-3 април в университета. След като завърши маратон за кодиране, той създаде уебсайт за deepjazz и публикува изходния код на GitHub.
Но много изненада на Ким, програмата се изстреля. Deepjazz непрекъснато се насочва към Python и GitHub - достигайки най-високата седма програма на GitHub като цяло. Той дори беше представен на първата страница на HackerNews и все още генерира оживена дискусия.
"Никога не съм очаквал, че първият ми страничен проект ще бъде толкова взривоопасен по отношение на популярността", казва Ким Inverse. - Беше доста лудо и забавно.
deepjazz - Дълбоко обучено джаз поколение, използващо Keras & Theano! http://t.co/G5wscglzO7 #python
- Python Trending (@pythontrending) 11 април 2016 г.
Между яденето, съня и завършването на друга курсова работа Ким обясни, че му отне около 12 часа да разработи изходния код за deepjazz. Въпреки това, той дойде с идеята за музикален генератор за изкуствен интелект много преди HackPrinceton. По време на летен стаж в Чикагския университет той се натъкна на Google Deep Dream, фотогенератор, който интерпретира моделите в изображение и ги превръща в други обекти, които познава. Резултатът са ужасни образи, които приличат на дива мечта.
„Идеята да се използва дълбокото обучение за тълкуване на изкуството беше наистина интересна за мен“, казва Ким. "Този вид рамка на Deep Dream, която Google представи и публикува, беше наистина очарователна, защото създавате нови произведения на изкуството от съществуващите произведения на изкуството."
Deepjazz използва машинно обучение за генериране на джаз музика - “A.I. създаден, за да направи джаза ”, както е посочено в неговия SoundCloud профил. Ким, която не е взела часове по теория на музиката, но е играла кларинет в продължение на седем години, избра джаз музиката заради неконвенционалните си мелодии. A.I. музиката на системата, “може да има някои необичайни резултати, така че мисля, че джазът е бил особено подходящ за идеята за генериране на музика в движение”, казва той.
Той пренасочи съществуващ музикален генератор, оптимизиран за джаз музика, която неговият приятел Еван Чоу нарича JazzML, използвайки кода за получаване на подходящи данни, но превръщайки го в двоична матрица, която е съвместима с двете дълбоки библиотеки Keras и Theano.
Самата инфраструктура на deepjazz е двуслойна LSTM, която е вид изкуствена невронна мрежова архитектура, описва Ким. След като научи първоначалната начална последователност от семена на музикални ноти (Ким използва части от „А после и знаех“ на Път Метени), той присвоява вероятности на бележките и генерира следващата бележка въз основа на тези вероятности. Например, ако захранвате програмата с мащаб A, B, C, има голяма вероятност следващата бележка deepjazz да генерира ще бъде D, обяснява Ким.
Исторически, критиците казват, че генераторите на изкуствен интелект са поразени от продуцирането на песни, които звучат прекалено роботизирано и стерилно - липсва цветът, който се чува в музиката на хората. Джефри Билмс, бивш студент от MIT, който е написал дисертация за компютри, които възпроизвеждат музикални ритми през 1993 г., каза обратен през ноември:
"Когато се учиш да свириш музика и се учиш да играеш джаз, има интуитивно разбиране за музиката, която я прави човешка", казва Билмс. „Хората са интуитивни същества и хората често не могат да опишат как са способни да правят човешки неща. По онова време почувствах, че може би нарушавам една свещена клетва в определянето на тези неща за компютърни програми."
Когато Ким прави изследвания за deepjazz, той се натъква на много системи, които генерират музика, която звучи роботизирана.
“Музиката и изкуството са неща, които смятаме за дълбоко човешки”, казва Ким. "За да звучи по-човешко и по-реалистично, наистина е трудно да се категоризира." Ким предполага, че генераторите могат да създават песни, които звучат по-човечно, като ги програмират да звучат по-малко като на оригиналния.
Други разработчици са се свързали с Ким и се интересуват от разширяване на deepjazz, така че повече хора да могат да си взаимодействат с него. Ким може да види, че deepjazz един ден се превръща в партньор за импровизация, който може изкуствено да генерира отстъпление, за да може музикантът да се отвори. Още по-далеч в бъдещето, той може да види приложения, които създават нова, сходна музика за любимите си песни или които могат да предложат нови акорди и прогресии за музиканти.
Ким признава, че все още е далеч от това да бъде експерт в областта на дълбокото обучение, но опитът му в разработването на дълбоки състезания и обучението на стажове и Принстън му е дал ценна представа за полето.
"А.С. Вече не е вече фантастична фантазия. Това е нещо съвсем истинско и това е нещо, което се приближава с много бързи темпове, ”казва Ким. - Надяваме се да видим, че този студент, който все още не е американец, е успял да направи нещо в хакатон, е окуражаващо за други студенти, които се борят за компютърни науки.
Учените възприемат сънищата на мишката
Cue the epic Саундтракът на Hans Zimmer: Започването е реално, поне при мишки. Да не би да духате, нали? Трилърът на Кристофър Нолан от 2010 г. ни даде някои луди идеи за засаждане на мисли в нашето подсъзнание, но учени от Висшето учебно заведение в Индустриалната физика и химия в Париж взеха нещата до ...
Сънищата на Долорес в новия трейлър на "Westworld" ще доведат до революцията на робота
Нов NSFW трейлър за предстоящата серия на HBO, Westworld, току-що беше пуснат на пазара и се фокусира върху някои много силни мечти на робота от героя на Evan Rachel Wood, Dolores Abernathy. Това е първият конкретен пример за кадри, който видяхме, намеквайки, че фокусът на дългоочакваната серия - изпълнителната продукция на ...
Науката за съня: Защо не можеш да четеш в сънищата?
Има много загадки около сънищата, като например защо не можете да четете думи или да разбирате речта.