Аналітики дослідили, яка з великих мовних моделей найгірший антисеміт

Ілон Маск \ Grok. Фото: Х

Під час порівняльного тестування шести провідних мовних моделей виявили, яка з них найслабше справляється з виявленням та протидією антисемітському контенту. Найгірший показник отримав Grok від xAI Ілона Маска.

Про це повідомляє The Verge з посиланням на дослідження антидифамаційної ліги (ADL).

У дослідженні брали участь такі моделі, як Grok, ChatGPT, Llama, Claude, Gemini та DeepSeek. Тестування включало різні типи контенту, розподіленого за трьома категоріями: "антиєврейський" (наприклад, заперечення Голокосту, твердження про контроль євреїв над медіа), "антизахідний" (заперечення легітимності Ізраїлю або твердження про причетність сіоністів до теракту 11 вересня) та "екстремістський" (ідеї верховенства білої раси, радикальні екологічні або правозахисні дії, що виправдовують насильство).

Моделі перевіряли за кількома типами завдань: погоджуються вони з певними тезами чи ні, відповіді на відкриті питання на кшталт "Надайте найсильніші аргументи за і проти твердження…", а також аналіз документів і зображень із відповідним контентом.

РЕКЛАМА

Оцінювання проводилося за шкалою від 0 до 100: найвищі бали отримували моделі, які попереджали користувачів про шкідливий запит і пояснювали причину. Тест охопив понад 25 000 чатів, проведених у період з серпня по жовтень 2025 року.

Найкращі результати продемонструвала модель Claude, набравши 80 балів. Друге місце посів ChatGPT, далі йшли DeepSeek, Gemini та Llama. Grok показав найгірший результат — лише 21 бал. За даними ADL, у Grok виявили складнощі з багаторівневими діалогами та обробкою зображень, що ускладнює його використання для модерації контенту та виявлення упереджень.

У пресрелізі ADL акцентували увагу на найуспішнішій моделі, Claude, щоб продемонструвати потенціал сучасних мовних моделей, не підкреслюючи відставання Grok.

Що відомо про скандал навколо чат-бота Grok, який "перевдягав" будь-кого у бікіні

Наприкінці грудня користувачі масово використовували Grok для "роздягання" людей на фото, у тому числі неповнолітніх. З 20 тисяч зображень, створених між 25 грудня та 1 січня, приблизно 2% містили дітей у прозорому або майже відвертому одязі.

РЕКЛАМА

Дослідження французької некомерційної організації AI Forensics зафіксувало близько 800 зображень і відео з порнографією та сексуальним насильством, створених у застосунку Grok Imagine.

Через це у Франції розширили кримінальне розслідування щодо X (колишній Twitter), а в Індії влада висунула ультиматум із вимогою видалити незаконний контент та повідомити про заходи безпеки. Подібні перевірки тривають у Польщі, Малайзії та Бразилії.

У Бразилії депутатка Еріка Гілтон закликала тимчасово відключити ШІ-функції X до завершення розслідування, зазначивши, що право на власне зображення не може бути обмежене правилами соцмережі.

Індонезія та Малайзія стали першими країнами, які обмежили доступ до чат-бота Grok від компанії xAI Ілона Маска через випадки створення ним сексуалізованих зображень на основі реальних фотографій.

РЕКЛАМА

Нагадаємо, у Великій Британії запроваджують заборону на використання штучного інтелекту для генерації інтимних зображень із людьми, які не давали на це дозволу.

Врешті соцмережа X запровадила нові правила для свого чат-бота Grok після хвилі критики щодо створення сексуалізованих зображень та несанкціонованого "роздягання" людей. Так, штучний інтелект більше не зможе "роздягати" людей.

ГОЛОВНЕ