• Новини
  • Наука
  • Як виявити текст, створений штучним інтелектом: мовні маркери та технічні сліди
2324

Як виявити текст, створений штучним інтелектом: мовні маркери та технічні сліди

Штучний інтелект. Колаж УН
Штучний інтелект. Колаж УН

Штучний інтелект допомагає у роботі, але іноді стає інструментом обману там, де текст повинна була б написати людина. Проте у згенерованих текстах можна розпізнати характерні стилістичні повтори, відсутність емоцій та логічні збої. А технічно — навіть приховані символи й спецзнаки.

Пояснюємо, як відрізнити ШІ-текст вручну та за допомогою інструментів.

Розпізнати текст, згенерований штучним інтелектом, можна за низкою лінгвістичних, стилістичних і технічних ознак. Ось основні:

  • Надмірна гладкість і передбачуваність. Тексти часто дуже граматично правильні, з рівномірним стилем без різких змін темпу чи емоційного забарвлення. Вони можуть виглядати “ідеальними”, але без глибини чи живого інтонаційного малюнку.
  • Повторення фраз. ШІ іноді повторює схожі слова або речення, особливо в довгих відповідях.
  • Загальність і кліше. Часто використовуються стандартні фрази на кшталт "Важливо відзначити", "У підсумку", "В результаті".
  • Відсутність особистого досвіду. ШІ не здатен створити справді унікальну точку зору або опис особистих емоцій чи вражень — ці елементи часто звучать загально або шаблонно.
  • Недоречна логіка або шаблонні переходи. Іноді між абзацами немає справжнього зв’язку, а логічні переходи від теми до теми — примітивні або занадто формальні.
  • У згарцьованих текстах часто можна зустріти невидимі символи, які є в коді.

ШІ-тексти можуть містити:

РЕКЛАМА
  • Zero-width space (U+200B) — невидимий пробіл, який не відображається на екрані, але є в коді.
  • Zero-width non-joiner (U+200C) / joiner (U+200D) — символи, що впливають на об'єднання символів, але непомітні візуально.
  • Нестандартні розділові знаки — наприклад, типографічні лапки замість стандартних " " або апострофів ’ замість '.
  • Тексти ШІ, особливо при копіюванні з інтерфейсів, можуть містити фрагменти з різним Unicode-кодуванням, яке не збігається зі стандартним набором текстового редактора.
  • У деяких ШІ-вивантаженнях лишаються структурні ознаки форматування (наприклад, - , **, <br>), які не потрібні в звичайному тексті.

Як перевірити, чи не дурять вас? Для цього треба вручну скопіювати у редактор коду (Sublime, VS Code) та увімкнути показ невидимих символів. В автоматичному режимі перевірку можна здійснити на сайтах Text Inspector чи Diffchecker.

Нагадаємо, апеляційна палата Вищого антикорупційного суду України відмовила в розгляді апеляційної скарги, складеної заявницею за допомогою чатбота зі штучним інтелектом ChatGPT. Суд розцінив такий підхід як прояв неповаги до судової системи.

Депутатка польського Сейму від опозиційної партії "Право і справедливість" Магдалена Філіпек-Собчак випадково оприлюднила в соцмережах запити до чат-бота ChatGPT, у яких просила створити критичний допис щодо прем'єр-міністра Дональда Туска.

Хто ми такі: Про нас та Контакти. Як ми пишемо новини та наші принципи: Редакційний кодекс. Ми старались, якщо вам сподобалось – задонатьте.

Якщо Ви помітили орфографічну помилку, напишіть нам.