Естествено езиково разбирателство е бъдещето на A.I. Гласово разпознаване

$config[ads_kvadrat] not found

Маша и Медведь (Masha and The Bear) - Подкидыш (23 Серия)

Маша и Медведь (Masha and The Bear) - Подкидыш (23 Серия)
Anonim

С навлизането на постоянния капацитет на Амазонка в Alexa и Siri да поемат повече задължения (и да стават все повече и повече), мнозина се чудят: какво следва за разбирането на естествен език и разговорен гласов интерфейс?

В тази надпревара има няколко компании, които са врата и врата. Има Wit.ai, компанията Facebook придоби - можете да играете с демо. (Опитайте тази команда: "Искам да гледам котки.") Apple има своя HomeKit и с него прави това, което Apple прави най-добре - да рита задника. Amazon също е на преден план с оборудваната от Alexa Echo и Echo Dot.

Една компания гореща по следите на разбиране за естествен език е MindMeld. MindMeld предоставя възможностите си за разбиране на естествен език на други компании, които искат да добавят интелигентни гласови интерфейси към своите продукти, услуги или устройства. Базираната в Сан Франциско компания предоставя на партньорите си инфраструктура и опции за персонализиране, така че техните устройства да могат да имат свои собствени, фино настроени лични асистенти. MindMeld наскоро обяви подобно партньорство с Spotify, но също така работи с автомобилни компании, агенции за отбрана, компании за електронна търговия и други. (И, естествено, не е в състояние да сподели много специфики на такива партньорства.)

обратен говори със Сам Васист от MindMeld за състоянието на полето за разпознаване на глас - но той бързо отбеляза, че „разпознаването на глас“, като предприятие, сега е „светска тема“. Гласовото разпознаване почти достигна своя зенит: след 50-те години на развитие AI вече могат ефективно да разпознават речта. Тези системи са почти по-добри от хората на работното място и със сигурност скоро ще надминат обикновените смъртни.

Предсказуемата следваща стъпка, а след това - подобно на развитието на детето - е да научи тези системи разбирам езика, който те вече могат да разпознаят. „Този ​​човек говори думи; това са думите “е далеч от:“ Разбирам какво казва този човек; позволете ми да помогна."

И тази по-нататъшна стъпка и развитие изисква тълкуване на значение: Имитиране на начина, по който човешкият ум обработва вербалната информация. Има две части на това уравнение. Първото е намерение: Каква е целта или желанието на човека да говори това изречение? Компютър, който може да извлече намерение от изреченото изречение, може да „разбере“ това, което човек иска да въздейства х или да си взаимодействат ш, Преплетени с този процес е втората част на уравнението: Entity. A.I. трябва да знаят как да определят обекта, към който се обръща, обекта на намерението на човека.

За да направите това, MindMeld не е (както предполагах, или се надявах) да наемат философи. В нея работят специалисти по естествен език, но голяма част от A.I. Процесът на “учене” сам по себе си е сравнително трудно. Ако обучавате системата да разбира поръчките за кафе, трябва да покажете на системата всички различни начини, по които хората вероятно биха си поръчали кафе.

"Бих искал мока."

- Може ли да изпия чаша Джо?

- Просто голямо кафе за мен.

И това е мястото, където влизат експертите по естествен език - лингвисти. Но дори и това вече не е необходимо, защото можем да съберем данните. Тези инструменти ви позволяват да задавате хиляди хора на един и същ въпрос и да компилирате техните отговори. Тогава просто храня тези отговори в A.I., и готово: A.I. може да реагира на широк спектър от възможни запитвания. „От хилядите заявки сега можем просто да научим как биха могли да се генерират милиарди други заявки”, казва Васист.

обратен попита Вашиш, който отдавна е вътрешен човек в А.И. и сферата на разбиране на естествения език, за да спекулираме за нас.

Може ли MindMeld да участва в разширен диалог? Например, ако задам един последващ въпрос, дали A.I. разбират и продължават да отговарят?

Да. Това е част от дизайна. Ако някой зададе въпрос, който е непълен - така, например, ако поръчвам кафе, и не уточнявам размера на кафето, което искам, ще се върне и ще каже: „Какъв размер на кафе правиш искаш?"

Очаквате ли някакъв напредък по теста на Тюринг?

Мисля, че сме доста близки до него. Искам да кажа, IBM Уотсън го направи Jeopardy!, и мисля, че това беше наистина добър пример. Ние сме в този момент: става много близо. Точно както сега, по отношение на разпознаването на реч, ние сме в точката, в която машините са толкова добри, колкото човешките същества, мисля, че ние - със сигурност през следващите три до пет години - ще бъдем в момент, в който повечето от тези разговорни гласове системи ще се считат за толкова добри, колкото и хората.

Какви неща за домашна автоматизация прави MindMeld?

Ние можем да приложим нашата технология към всякакъв вид продукт, всякакъв вид услуга, всякакъв вид данни. Домашната автоматизация е една от тях. В дома, имате контрол на осветлението, термостат, системи за сигурност, аудио системи, видео системи, всички тези видове неща. Ние сме в състояние да контролираме всяка от системите, при условие че има подходящ интерфейс.

Какво бихте искали да свържете с MindMeld в собствения си дом?

Мисля, че по-усъвършенствани случаи на употреба - като например разговор с моя Spotify, за да кажа „Играй плейлиста на Rolling Stones“ или „Играй класическата музика тази вечер“ - тези неща биха били… страхотни.

Нещо по-неочаквано или изненадващо, което бихте искали да контролирате с гласа си?

Нещата, които ви описах, са нещата, които мисля, че са неизбежни. С други думи, това ще се случи много скоро. Мисля, че това, което няма да се случи веднага, са неща като микровълнови печки, кафемашини и хладилници. Контролирането на този вид уреди - така че всъщност мога да кажа: „Моята машина за кафе е готова за приготвяне на кафе? Включете кафемашината “и ако не е била подготвена, тя трябва да се върне и да каже„ Съжалявам, но вашата кафемашина не е готова “- този вид интелигентност все още не съществува. Това ще бъде светият граал: където по принцип всяко устройство може да ви говори и да ви каже какво може и какво не може да направи. Но все още не сме там.

Какво мислите, че държи индустрията обратно?

Сега това са изключително евтини уреди. Искам да кажа, това са уреди, които можете да купите за почти нищо. Преди десет години те струваха много повече.Така че, изграждането на нови функции е нещо, което увеличава разходите за тези устройства. В крайна сметка предложението за сегашната стойност е много силно; повечето от тези производители не са склонни да добавят нови функции, освен ако не са на много ниска цена.

Мисля, че това е един аспект от него. Другият аспект е, че говорим за свързването на тези устройства. Така че трябва да има нещо повече от гласово устройство за свързване на тези устройства. Трябва да има повече възможности, които трябва да се движат по тази връзка, преди да станат жизнеспособни.

Знаете ли за някоя компания, която работи по този последен капацитет?

Много компании за полупроводници работят по много евтини микрофонни масиви. Това, което всъщност можете да вградите - на много ниска цена - на почти всяко устройство или приложение - което би позволило да има гласов вход. И не трябва да стоите до тези устройства - можете да говорите на разстояние от 10 фута. Изграждане на тази способност - мисля, че това е отправна точка. И мисля, че ще позволи на хората да започнат да поставят микрофони на устройствата, а след това ще последват и други, разширени възможности. Но точно сега не познавам нито една компания, която изгражда такъв тип машина за кафе, умна микровълнова печка или пералня.

Каква е най-добрата ви оценка, когато имаме напълно умни домове, напълно умни апартаменти?

Днес всъщност имаме почти всички съществени подсистеми в къщата, които хората искат да бъдат автоматизирани, които могат да бъдат автоматизирани. Това включва светлини, термостати, охранителни системи, гаражни врати, брави на предните врати - такива неща. Всички тези неща могат да бъдат направени. Проблемът наистина е около ценовите точки. Те все още са на ценова точка, когато предимно осиновители и хора, които имат наистина тежка нужда от тях. Но ценовите точки за тези неща падат драстично, много бързо. Мисля, че вероятно ще получим тези подсистеми на масовия пазар през следващите няколко години.

Другите неща, за които говорих - автоматизирането на много евтините уреди - мисля, че те са най-рано от пет до седем години. Повече като 10 години, преди те да станат реалност. Но както казах и преди, това са неща, които ще изискват редица други неща да се съберат. И това може да се случи по-рано, ако тези различни съставки се свържат по-рано.

Какво мислите, че би изглеждал апартамент в Ню Йорк или Сан Франциско, например 2050?

2050! Еха. Мисля, че ще бъдем напълно там. Нещата, които виждаме в научно-фантастичните филми - където можете да говорите с всяка система във вашия дом и да контролирате всичко с глас - мисля, че тези възможности ще бъдат широко разпространени. Разбира се в градове като Ню Йорк и Сан Франциско.

$config[ads_kvadrat] not found