• Новини
  • Наука
  • В Україні навчають ШІ, щоб розпізнати "почерк лікарів"
4735

В Україні навчають ШІ, щоб розпізнати "почерк лікарів"

Штучний інтелект. Колаж УН
Штучний інтелект. Колаж УН

Міністерство економіки України разом із Державним архівом та іншими відомствами розпочало створення національного датасету україномовних рукописних матеріалів для навчання систем штучного інтелекту. Мета — навчити мовну модель розбирати старі рукописи, в тому числі — медичні довідки.

Про деталі проєкту розповів ML Lead застосунку "Мрія" та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I.

Реалізація цієї ініціативи має пришвидшити цифровізацію державних послуг і сприяти оцифруванню архівних матеріалів.

Потреба у створенні такого датасету виникла під час роботи над проєктом "єДозвіл", який передбачає переведення процесу видачі ліцензій для підприємців у цифровий формат через "Дію". Для цього алгоритмам необхідно аналізувати документи, які подають заявники.

РЕКЛАМА

Зокрема, для отримання частини ліцензій потрібно завантажувати дипломи, видані ще у 1990-х роках, які часто заповнені від руки, мають низьку якість зображення або пошкодження. Як зазначив Войтех, наявні OCR-системи не забезпечують належного розпізнавання таких матеріалів українською мовою.

За словами розробників, у відкритому доступі відсутні якісні розмічені корпуси українського рукописного тексту, необхідні для навчання моделей. Тому Мінекономіки ініціювало співпрацю з іншими державними установами для швидкого формування відповідної бази.

Ключовим партнером став Державний архів України, який зацікавлений у використанні технології для оцифрування мільйонів сторінок історичних документів і спрощення доступу до інформації.

Тим часом близько 10 тисяч письменників випустили книгу "Don't steal this book", яка містить лише перелік їхніх імен, щоб виступити проти можливого використання їхніх творів компаніями штучного інтелекту без дозволу. Видання роздавали відвідувачам Лондонського книжкового ярмарку 10 березня.

РЕКЛАМА

Хто ми такі: Про нас та Контакти. Як ми пишемо новини та наші принципи: Редакційний кодекс. Ми старались, якщо вам сподобалось – задонатьте.

Якщо Ви помітили орфографічну помилку, напишіть нам.