22 червня 2016, середу, 18:04

Нейромережі навчилися обчислювати: обійматимуться люди чи тиснутимуть руки

Вчені розробили алгоритм, за допомогою якого нейромережі навчилися передбачати дії людей під час зустрічі. Про це повідомляє nplus1.

Співробітники Массачусетського технологічного інституту навчали штучний інтелект на відеозаписах з YouTube та серіалах "Офіс" і "Відчайдушні домогосподарки". Попередні підходи до передбачення машинами візуальних зображень включали аналіз окремих пікселів з подальшим попіксельно створенням фотореалістичного зображення-прогнозу, а також використання описів сцен, виконаних людьми. Науковий колектив розробив алгоритм нейромережевого машинного навчання, який працює з цілими фрагментами зображень (наприклад, набором пікселів, що відображають людське обличчя) і на підставі цього аналізує можливі версії того, як виглядатиме наступна сцена. При цьому за аналіз кожної дії персонажів відповідала окрема мережа алгоритму, а прогноз будувався за результатами їх спільної роботи.

Після навчання на 600 годинах відеозаписів систему перевірили на незнайомих для неї роликах. На першому етапі експерименту штучний інтелект повинен був за секунду до події передбачити, як персонажі поводитимуться під час зустрічі: вдарять по руках, потиснуть їх, обіймуться або поцілуються. Йому вдалося впоратися з цим завданням в 43 відсотках випадків, що на сім відсотків вище результатів роботи наявних алгоритмів.

Потім системі демонстрували кадр відео і просили спрогнозувати, який предмет з'явиться на екрані через п'ять секунд. Вона впоралася з цим на 30 відсотків краще, ніж перед навчанням, однак дослідники зазначили, що її середній результат не перевищує 11 відсотків. Люди успішно виконували запропоновані штучного інтелекту завдання в 71 відсотку випадків.