Изследванията на Microsoft откриват по-добро разпознаване на човешкия реч

What's new with Microsoft 365 | October 2020

Microsoft стана първата в света компания, разработила софтуер за разпознаване на реч, който е по-точен от хората. В доклада „Постигане на човешки паритет в разговорното разпознаване на реч”, публикуван в понеделник, софтуерът произвежда преписи, които съдържат половин процент по-малко грешки от човешките усилия, което е невероятно, като се има предвид колко добри хора са в разбирането на речта. Пробивът отваря вратата за нови А.И. помощници, които са по-точни от всякога.

Впечатляващо е колко далеч е дошла технологията за толкова кратко време. Не беше твърде отдавна, че компютърното разпознаване на реч беше странна ниша, която изглеждаше безнадеждно далечна. Гледайте тази демонстрация на софтуер за говор на Windows Vista от 2006 г.: T

Екипът използва теста на Националния институт за стандарти и технологии (NIST) 2000, използван в индустрията за измерване на надеждността на транскрипцията на речта. Разговорът се провежда между двама участници по телефона, завъртане на ред, преди резултатният скрипт да се сравни и провери с правописа на речника.

В разпределителната част, където двама непознати говорят за първи път, процентът на човешка грешка е около 5,9%, докато в частта за обаждания, където двама души, които се познават взаимно, процентът на грешки е около 11,3%. Софтуерът на Microsoft отбеляза около 0,4% по-нисък процент грешки.

Пробивът ще помогне да се въведат нови форми на потапяне A.I. През август студентът Джошуа Браудър отне тайна от своя DoNotPay chatbot, който може да помогне на бездомните да получат безплатни правни съвети. В комбинация с напредъка в разпознаването е лесно да си представите бъдеще, в което хората искат виртуален асистент за помощ за жилищно настаняване чрез редовен разговор с компютъра.

На този етап изследователите обмислят как A.I-моторното разпознаване на реч може да даде по-интелигентни отговори. Sensay, разкриващ гнева A.I. от лабораторията зад Siri, използва възможности за разширено разпознаване, за да открие дали потребителят се чувства ядосан или объркан, променяйки отговорите си, за да отговаря на ситуацията. Премахването на бариерата на разпознаването на грешки, създава вълнуващи нови възможности за виртуална помощ.

Софтуерът за разпознаване на кучета на Microsoft няма идея Какво е куче

Ако вече не сте, прегледайте What Dog Dot Net (what-dog.net), уебсайт, който колективно прескача крака на интернет от четвъртък следобед. От същите мисли на Microsoft, които ни донесоха онзи сайт, който неправилно предсказва вашата възраст, тази програма понякога правилно познава породата на вашето куче.

Жестове за шимпанзе Следвайте същите езикови закони като човешкия реч

В доклад, публикуван в сряда в списание "Proceedings of the Royal Society B", международен екип от учени докладва за техните наблюдения на шимпанзетата от общността Sonso в горския резерват Budongo в Уганда. Те твърдят, че жестовете използват шимпанзетата, които следват човешките езикови правила.

Комуникация с маймуни неочаквано сочи произхода на човешкия реч

В ново проучване, публикувано в "Neuron", учените твърдят, че невронната верига на маймуните от макак резус може да бъде ключът към разбирането на произхода на човешкия език. Учените от Рокфелеровия университет твърдят, че невронните мрежи маймуни използват за изразяване на емоции и разпознаване на лица са ключови.

$config[ads_kvadrat] not found