Настя и сборник новых серии про друзей
Съдържание:
Компютри са били рита нашите крехки човешки магарета на шах за няколко десетилетия. За първи път това се случи през 1996 г., когато IBM Deep Blue успя да свали световния шампион Гари Касперов. Но едно ново изследване от A.I. облекло DeepMind хвърля светлина върху това колко ограничено по обхват е, че ранната победа наистина е била.
От една страна, Касперов отскочи назад, печелейки три мача и двукратно изтегляне в шест мача за един стар Ежедневни новини доклад.
Но много по-забележително, както казва изследователят на DeepMind Джулиан Шритуисър обратен приложенията като Deep Blue също са програмирани ръчно. Това означава, че хората трябва да преподават А.И. всичко, от което се нуждаеше, за да знае как да се справи с всеки един възможен случай. С други думи, тя можеше винаги да бъде толкова добра, колкото хората, които го програмираха. И докато Deep Blue очевидно успяваше да се справи доста добре в шахмата; дайте му друга, подобна, игра като Go и тя е била невежи.
Alpha Zero е напълно различен. В ново проучване, публикувано днес в списанието наука, авторите разкриват как са успели не само да научат алфа нула как да бият хората в шах, но и как да научат алфа нула как обучавам себе си да овладеете няколко игри.
Как да преподавам A.I. Да се научи
Alpha Zero е разработена с помощта на техника, наречена учене с дълбоко подсилване. По същество това включва преподаване на A.I. нещо много просто, като основните правила на шахмата, а след това прави това просто нещо отново и отново, докато не научи по-сложни, интересни неща като стратегии и техники.
"Традиционно … хората ще вземат знанията си за играта и ще се опитат да го въведат в правилата", казва Шритвизър, който работи в Alpha Zero в продължение на почти четири години. "Нашият подход е да се инициализираме на случаен принцип и след това да го оставим да играе срещу себе си, а от самите игри може да научи какви стратегии работят."
All Alpha Zero получава основните правила и от там научава как да спечели, като играе себе си. Според новите констатации на Alpha Zero са нужни само девет часа, за да овладеят шах, 12 часа да овладеят сеги и около 13 дни да овладеят Go. Тъй като се играе сама по себе си, тя е самоучка. Направено е премахване на всички световни шампионски алгоритми за човешки ръце, побеждавайки световния шампион от 2017 г. в Шоги със 91 процента от времето.
"Той може самостоятелно да открие интересни знания за играта", казва Шритуисър. "Това води до програми, които играят по-човешки."
Въпреки че стилът му е подобен на човешки и творчески, той също е вероятно оптимален, казва той, достатъчно, за да може Alpha Zero да доминира в почти всяка игра, в която има достъп до цялата налична информация. Всъщност, Alpha Zero е толкова сложна, че може да се наложи да преминем към съвсем различен клас игри, за да продължим да движим границите на това как A.I. решава проблеми.
Защо Alpa Zero е толкова добра
А.С. Изследователите обичат да използват тези игри като тестови основи за все по-сложни форми на алгоритми за няколко причини. Те са елегантни и хората ги играят от стотици години, например, което означава, че имате много потенциални претенденти, които да тестват алгоритъма ви. Но те също са сложни и сложни, което означава, че могат да служат като стъпка към А.И. които могат да решават проблеми в реалния свят. Schrittwieser казва, че следващата област на изследване е създаването на алгоритъм като Alpha Zero, който все още може да взема оптимални решения с несъвършена информация.
- Във всички тези игри знаеш всичко, което се случва - казва той. - В реалния свят може да знаете само част от информацията. Може да знаете собствените си карти, но не знаете противника си, имате частична информация."
Все още има няколко игри, способни да дадат на алгоритми като Zero този вид предизвикателство - Schrittwieser спомена стратегията, в която играчите скриват своите движения един от друг - и Starcraft, което е друга област, интересна за изследователите, занимаващи се с игри на DeepMind.
„Искаме да създаваме все по-сложни проблеми, с които се занимаваме”, казва той. "Но винаги е едно измерение в даден момент."
В същото време следващото поколение компютризирани решатели на проблеми на Deep Mind вече показват потенциала да преминат от игралния свят към реалния свят. По-рано тази седмица той обяви друг алгоритъм, наречен AlphaFold, който е способен да екстраполира протеинова последователност в точна прогноза на нейната 3D структура.Това е проблем, който десетилетия наред объркани учени могат да помогнат да се отвори вратата за лечение на болести, вариращи от болестта на Алцхаймер до кистична фиброза.
Тази малка робот ръката разработи сериозни моторни умения и може да смаже кани
Идеалният роботизиран дом ще поддържа дома ви чист чрез миене на съдове, пране и почистване след кулинарни бедствия. Но също така трябва да го запази истинско, като ви изгони, когато спечелите кръг от Fortnite или изхвърлите шака, когато се върнете от работа.
Google, Apple търси огромни пространства в Силиконовата долина, за да разработи автомобили без шофьори
Цифрите са изумителни. Google иска 400 000 квадратни метра. Apple търси 800,000. И сякаш тези бегемоти не са били достатъчни, за да подтикнат търсенето, Тесла, БМВ и Мерцедес гледат на имоти в Силиконовата долина, за да развият автопарковете си. Призивът е очевиден: инженерите, които живеят там, ще ...
Когато хората ви игнорират: 10 причини може да изключите хората
Нищо не е по-лошо от това да се чувстваш игнориран и да бъдеш изоставен. Когато хората ви игнорират, може да е време да оцените вашето поведение и вашите взаимоотношения.