• Новости
  • Наука
  • В Украине обучают ИИ, чтобы распознать "почерк врачей"
933

В Украине обучают ИИ, чтобы распознать "почерк врачей"

Искусственный интеллект. Коллаж УН
Искусственный интеллект. Коллаж УН

Министерство экономики Украины вместе с Государственным архивом и другими ведомствами начало создание национального датасета украиноязычных рукописных материалов для обучения систем искусственного интеллекта. Цель — научить языковую модель разбирать старые рукописи, в том числе - медицинские справки.

О деталях проекта рассказал ML Lead приложения "Мрия" и советник по искусственному интеллекту в Минэкономики Дмитрий Войтех в подкасте AI&I.

Реализация этой инициативы должна ускорить цифровизацию государственных услуг и способствовать оцифровке архивных материалов.

Потребность в создании такого датасета возникла во время работы над проектом "еДозвил", который предусматривает перевод процесса выдачи лицензий для предпринимателей в цифровой формат через "Дію". Для этого алгоритмам необходимо анализировать документы, которые подают заявители.

РЕКЛАМА

В частности, для получения части лицензий нужно загружать дипломы, выданные еще в 1990-х годах, которые часто заполнены от руки, имеют низкое качество изображения или повреждения. Как отметил Войтех, имеющиеся OCR-системы не обеспечивают надлежащего распознавания таких материалов на украинском языке.

По словам разработчиков, в открытом доступе отсутствуют качественные размеченные корпуса украинского рукописного текста, необходимые для обучения моделей. Поэтому Минэкономики инициировало сотрудничество с другими государственными учреждениями для быстрого формирования соответствующей базы.

Ключевым партнером стал Государственный архив Украины, который заинтересован в использовании технологии для оцифровки миллионов страниц исторических документов и упрощения доступа к информации.

Тем временем около 10 тысяч писателей выпустили книгу "Don't steal this book", которая содержит лишь перечень их имен, чтобы выступить против возможного использования их произведений компаниями искусственного интеллекта без разрешения. Издание раздавали посетителям Лондонской книжной ярмарки 10 марта.

РЕКЛАМА

Кто мы такие: О нас и Контакты. Как мы пишем новости и наши принципы: Редакционный кодекс. Мы старались, если вам понравилось – задонатьте.

Если Вы заметили орфографическую ошибку, напишите нам.