Защо A.I. Може да се бори за разбиране на арабски

$config[ads_kvadrat] not found

Время и Стекло Так выпала Карта HD VKlipe Net

Время и Стекло Так выпала Карта HD VKlipe Net
Anonim

В света на изкуствения интелект данните са кралски. Колкото повече имате, толкова по-добри са вашите инструменти, тъй като системите могат да “научат” повече за това какво да очакват. Но в зависимост от платформата A.I. Според данните на Мириам Реди, изследовател на Yahoo Labs, някои езици може да са по-добре представени от други.

"Например, като Flickr, откъдето използваме данните си, някои езици са много малко представени", казва Реди, която говори на Лондонската среща за дълбоко обучение в четвъртък. - Значи имаме английски, милиони изображения за английски, но имаме може би 100 000 за арабски.

Екипът на Реди работи върху инструмент, който може да идентифицира невидими елементи към изображения, като културни ценности и емоционални конотации. Инструментът анализира текста, прикрепен към публично достъпните изображения на Flickr. С течение на времето, A.I. започва да разбира защо някой може да маркира изображение „щастлива страна“ или „неловко време“, но тези идеи ще стават все по-точни, тъй като инструментът анализира повече изображения.

„За съжаление, точността за откриване на настроения в изображенията за арабските езици е по-ниска, защото нямаме достатъчно данни“, казва Реди.

На езиците с по-големи количества данни екипът на Реди забеляза няколко интересни модела. Романските езици като френски и испански се изразяват по подобен начин, а италианският език е единственият език, на който потребителите идентифицират образите с термина „укриване на данъци“.

Езиковите бариери все още остават нещо като проблем за A.I. изследователи. Всеки, който е използвал Google Преводач, ще знае, че смяната на езици никога не е толкова проста, колкото звучи. Въпреки това, новите събития променят нещата, като Facebook обяви това лято, че се приближава към мечтата си за социална мрежа на един език, която автоматично превежда текстове за потребителите.

Развитието в премахването на езиковите бариери може да спомогне за насърчаване на международната комуникация, но за проекти като Redi's няма реално заместител на генерираните от човека данни за настроението.

$config[ads_kvadrat] not found