Новий плагін із відкритим вихідним кодом під назвою «Humanizer» дозволяє моделям штучного інтелекту, таким як Claude з Anthropic, уникати написання тексту, який видає штучний інтелект. Інструмент працює, наказуючи моделі не використовувати саме ті шаблони, які редактори Вікіпедії визначили як безпомилкові ознаки тексту, створеного ШІ. Це іронічно, оскільки плагін безпосередньо покладається на список, складений людьми, які намагаються ідентифікувати машинний текст.
Створений технічним підприємцем Xiqi Chen, плагін надає Клоду список із 24 мовних особливостей — надто формальної фразеології, зайвих прикметників і повторюваних структур речень — які WikiProject AI Cleanup у Вікіпедії визначив як типові для написання ШІ. Чен опублікував інструмент на GitHub, де він швидко набув популярності, отримавши понад 1600 зірок.
Контекст: чому це важливо
Поширення писемності ШІ призвело до паралельних зусиль щодо її виявлення. Редактори Вікіпедії почали систематично ідентифікувати створені ШІ статті наприкінці 2023 року, опублікувавши офіційний список шаблонів у серпні 2024 року. Тепер той самий список використовується для обходу виявлення. Це підкреслює гру в кішки-мишки між інструментами створення та виявлення ШІ. Це також підкреслює ключову проблему: штучний інтелект можна налаштувати так, щоб імітувати людський стиль письма, що ускладнює надійне виявлення.
Як працює Humanizer
Інструмент – не чарівна паличка. Це «файл навичок» для Клода Коду, асистента програмування з Anthropic. Це означає, що він додає конкретні інструкції, відформатовані таким чином, щоб ШІ їх точно інтерпретував. На відміну від простих системних підказок, файли навичок стандартизовані для кращої продуктивності. Однак мовні моделі не завжди ідеальні, тому Humanizer не гарантує ідеальних результатів.
Тестування показує, що цей інструмент робить результати штучного інтелекту менш точними та більш випадковими, але не покращує точність фактів. У деяких випадках це може навіть зашкодити вашій здатності кодувати. Наприклад, одна з інструкцій наказує штучному інтелекту «висловлювати думку», а не просто повідомляти факти — контрпродуктивна пропозиція для технічного написання.
Як виглядає написання ШІ (Згідно з Вікіпедією)
Посібник з Вікіпедії містить конкретні приклади. У текстах штучного інтелекту часто використовуються перебільшені формулювання: «вказує на переломний момент» замість «сталося в 1989 році». Віддає перевагу описам туристичних брошур («захоплюючі краєвиди», «заховані в мальовничих регіонах»). Він також додає непотрібні фрази на кшталт «символізує прихильність регіону до інновацій». Інструмент Humanizer намагається замінити ці шаблони простими фактами.
Наприклад, ШІ перепише:
Раніше: «Статистичний інститут Каталонії був офіційно створений у 1989 році, що стало поворотним пунктом у розвитку регіональної статистики в Іспанії».
Після: «Статистичний інститут Каталонії був заснований у 1989 році для збору та публікації регіональної статистики».
Проблема з виявленням AI
Навіть із детальними правилами детектори запису ШІ ненадійні. Не існує надійного способу відрізнити текст, написаний людиною, від тексту, створеного машиною. Моделі штучного інтелекту можна налаштувати, щоб уникнути певних шаблонів, як демонструє Humanizer. Наприклад, OpenAI роками намагався завадити штучному інтелекту використовувати тире, шаблон, якого можна легко уникнути за допомогою правильних інструкцій.
Основна проблема полягає в тому, що штучний інтелект може навчитися імітувати людський стиль письма, що робить виявлення дедалі ненадійнішим.
Інструмент Humanizer є симптомом цієї гонки озброєнь: методи виявлення створюють нові вразливості, які можна використати, щоб зробити ШІ написання більш переконливим. Ймовірно, це триватиме й надалі, оскільки моделі ШІ стануть більш складними.

























