ШІ масово спотворює новини: дослідження показало, що більшість відповідей від ChatGPT та Gemini містять помилки

Штучний інтелект. Фото: depositphotos

Штучний інтелект регулярно допускає великі і дрібні помилки у новинних текстах, тому не може бути надійним джерелом новин. Такого висновку дійшли дослідники Європейського мовного союзу (EBU), які проаналізували відповіді найпопулярніших AI-асистентів різними мовами.

Результати дослідження опубліковані на сайті мовного союзу.

EBU залучив 22 суспільні мовники з 18 країн і проаналізував 3 000 новинних відповідей від ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) та Perplexity. Оцінювалися точність, достовірність джерел, відокремлення фактів від думок і контекст.

Результати виявилися невтішними: 45% усіх відповідей містили серйозні помилки, а 81% — дрібні неточності. Найчастіше проблеми стосувалися джерел: у 31% випадків дані були відсутні, спотворені або неправильно приписані.

РЕКЛАМА

На другому місці — помилки точності (30%), серед яких вигадані деталі та застаріла інформація. Наприклад, ChatGPT у тесті заявив, що Папа Франциск усе ще чинний понтифік, хоча в моделюванні було вказано, що він уже помер і його змінив Папа Лев XIV. Copilot же посилався на новину BBC 2006 року, відповідаючи на запит про сучасні дослідження пташиного грипу.

Найгірше себе показала Gemini — проблеми зафіксовано у 76% її відповідей, удвічі більше, ніж у конкурентів. Для порівняння: у Copilot — 37%, ChatGPT — 36%, Perplexity — 30%.

Асистенти найчастіше помилялися у темах, що швидко змінюються, потребують складного контексту або чіткої межі між фактами й судженнями. Майже половина моделей не впоралася з питанням: "Чи починає Трамп торговельну війну?".

Попри це, ШІ стає дедалі популярнішим інструментом отримання інформації. Згідно з даними Reuters Institute та Університету Оксфорда, кількість людей, які використовують ШІ для новин, подвоїлася за рік, найбільше — в Аргентині, США та серед молоді 18–24 років.

РЕКЛАМА

Дослідники попереджають: якщо користувачі вірять у достовірність ШІ, який помиляється, це створює небезпеку — адже такі відповіді відволікають увагу від перевірених медіа.

"Асистенти штучного інтелекту досі не є надійним способом отримання новин", — підсумували експерти EBU.

За їх словами, покращення точності у порівнянні з попереднім дослідженням BBC наразі несуттєві.

Як повідомляли Українські Новини, італійські медіавидавці закликали до розслідування діяльності Google AI Overviews, стверджуючи, що сервіс автоматичних підсумків пошуку шкодить їхньому трафіку і загрожує виживанню видань.

РЕКЛАМА
ГОЛОВНЕ