Изследванията на Microsoft откриват по-добро разпознаване на човешкия реч

$config[ads_kvadrat] not found

What's new with Microsoft 365 | October 2020

What's new with Microsoft 365 | October 2020
Anonim

Microsoft стана първата в света компания, разработила софтуер за разпознаване на реч, който е по-точен от хората. В доклада „Постигане на човешки паритет в разговорното разпознаване на реч”, публикуван в понеделник, софтуерът произвежда преписи, които съдържат половин процент по-малко грешки от човешките усилия, което е невероятно, като се има предвид колко добри хора са в разбирането на речта. Пробивът отваря вратата за нови А.И. помощници, които са по-точни от всякога.

Впечатляващо е колко далеч е дошла технологията за толкова кратко време. Не беше твърде отдавна, че компютърното разпознаване на реч беше странна ниша, която изглеждаше безнадеждно далечна. Гледайте тази демонстрация на софтуер за говор на Windows Vista от 2006 г.: T

Екипът използва теста на Националния институт за стандарти и технологии (NIST) 2000, използван в индустрията за измерване на надеждността на транскрипцията на речта. Разговорът се провежда между двама участници по телефона, завъртане на ред, преди резултатният скрипт да се сравни и провери с правописа на речника.

В разпределителната част, където двама непознати говорят за първи път, процентът на човешка грешка е около 5,9%, докато в частта за обаждания, където двама души, които се познават взаимно, процентът на грешки е около 11,3%. Софтуерът на Microsoft отбеляза около 0,4% по-нисък процент грешки.

Пробивът ще помогне да се въведат нови форми на потапяне A.I. През август студентът Джошуа Браудър отне тайна от своя DoNotPay chatbot, който може да помогне на бездомните да получат безплатни правни съвети. В комбинация с напредъка в разпознаването е лесно да си представите бъдеще, в което хората искат виртуален асистент за помощ за жилищно настаняване чрез редовен разговор с компютъра.

На този етап изследователите обмислят как A.I-моторното разпознаване на реч може да даде по-интелигентни отговори. Sensay, разкриващ гнева A.I. от лабораторията зад Siri, използва възможности за разширено разпознаване, за да открие дали потребителят се чувства ядосан или объркан, променяйки отговорите си, за да отговаря на ситуацията. Премахването на бариерата на разпознаването на грешки, създава вълнуващи нови възможности за виртуална помощ.

$config[ads_kvadrat] not found