Фејсбук отвора за јавноста комплет од компјутерски визуелен софтвер кој може да препознае и разлики и облици на предмети на фотографиите.
Алатките кои ги разви тимот од Лабораторијата за вештачка интелигенција во Фејсбук (ФАИР) е наречен DeepМask, SharpMask и MultiPathNet, и сите три работат во тандем да се открие и контекстуалноста на содржината на сликата. Овие технологии, иако во моментов не се активни во произодите на Фејсбук кои им ги нуди на корисниците, се слични на софтверот кој компанијата го користи за да им ги опише фотографиите на слепите корисници, содржина која тие ја нарекуваат „автоматски алтернативен текст“ и кој беше пуштен во април годинава.
DeepMask и SharpMask се повеќе експериментални истражувачки проекти и се фокусирани на она што тимот од ФАИР го нарекува сегментација. Човекот може да препознае различни елементи на фотографиите за дел од секунда, додека тој процес за компјутерите е малку покомплициран, кој препознава пиксели као серија на вредности кој кореспондираат со промените во бојата. Оттука не е лесно да му се помогне на софтвер да сфати каде позадината на некој објект на фотографијата станува нејзин субјект, или кои делови од предниот дел можат да бидат препознаени како далечнни објекти. Исто така комплицирано е за компјутерот точно да го препознае објектот. Машината преку учење, метод кој нашироко се користи во техниките за учење во вештачката интелигенција (АИ), Фејсбук може да ги научи алгоритмите како да изведуваат вообичени човечки конгнитивни задачи со собирање на она што ние го нарекуваме голема база на податоци за невронските мрежи. Во суштина, овие комплети претставуваат милиони и милиони примери од кои овие невролошки системи можат да развијат и сфатат и разликуваат предмети од реалниот свет и прикази од околината. Со други зборови, покажете му на алгоритам доволно фотографии од овца – и кажете у на алгоритмот дека она што го гледа е овца – и тоа самото ќе почне да го разликува животното на фотографијата.
Процесот во кој невралната мрежа ги препознава овие предмети е наречен сегментација, која бара од компјутерот серија потврдувања преку прашања да/не во врска со сликата во обида да ја определи содржината во неа. Тоа е улогата на DeepMask, додека SharpMask се користи да се допрецизира изборот на предметот заради поголема точност.
-DeepMask не знае ништо за специфичниот вид на предмети, иако може да разликува куче од овца, тоа не може да ги одвои, вели научникот од ФИРА, Пјотр Голар во технолошката документација. За да се изведе тоа, тимот се потпира на MultiPathNet, заедно со основните техники за препознавање на предмети кои ги разви Рос Гиршик, поранешен член на Мајкрософт рисрч и сегашен истражувач во ФАИР. MulitPathNet ефикасно ги одвојува предметите и ги категоризира.
Зошто Фејсбук ги отвора овие технологии за корисниците?
– Ги отвораме нашиот извор на кодови и ги објавуваме откритијата како академски документи слободно достапни и сакаме да ги потикнеме другите истражувачи да се олесни споедлувањето на техники и технологии“, рече портпарол од Фејсбук за Верџ.
-Се надеваме дека и други ќе можат да работат со нас за да се унапредат нашите алатки и технологии. Веќе направивме извесен прогрес со компјутерските техники за слики кога се гледа видео во реално време, за тоа да разбере и клсифицира што има на видеото, на пример, мачки или храна“, објаснува Долар.
-Класификцијата во реално време може да исфрли на површина релевантни и важни видео во живот на Фејсбук, додека примената на порафинирани техники за да се препознаат локции, предмети и активности во просторото и времето можат еден ден да овозможат нарација во реално време која им е потребна за слепите лица.