Роками нам радили спілкуватися зі штучним інтелектом так, як із людиною — ввічливо й тактовно. Однак нове дослідження Пенсильванського університету перевертає це уявлення з ніг на голову, доводячи, що великі мовні моделі (LLM), такі як ChatGPT-4o, насправді дають точніші відповіді, коли до них звертаються грубо.
Опублікована стаття демонструє разючу різницю: прямі, навіть різкі, промпти давали правильні відповіді у 84,8% випадків, тоді як м'які, ввічливі формулювання були точними лише у 80,8% випадків. Дослідники Ом Добарія та Ахіл Кумар взяли 50 стандартних запитань з математики, науки та історії й переписали їх у п'яти різних тональностях — від «дуже ввічливої» до «дуже грубої» — перш ніж подати їх ChatGPT-4o. Результати виявилися однозначними.
Ці висновки прямо суперечать попереднім дослідженням, включно з роботою 2024 року, яка припускала, що грубі запити часто погіршують якість відповідей ШІ. Нові дані свідчать про значну зміну в тому, як працюють передові моделі. «Всупереч очікуванням, неввічливі запити стабільно перевершували ввічливі», — написали автори. «Це може вказувати на те, що нові мовні моделі інакше реагують на тональність звернення».
Це означає, що сучасні ШІ перестають бути «соціальними дзеркалами», які імітують людську взаємодію. Натомість вони поводяться як суто функціональні машини, для яких прямота важливіша за люб'язності. Грубість у цьому контексті є лише формою крайньої, недвозначної інструкції.
Дослідження підтверджує нещодавні висновки Вортонської школи щодо мистецтва створення ефективних промптів, де тон виявився таким же важливим елементом, як і вибір слів. Це також узгоджується з травневим дослідженням Університету Джорджа Вашингтона, яке дійшло висновку, що ввічливість у спілкуванні з ШІ-моделями є марною тратою обчислювальних ресурсів. Послання для користувачів очевидне: якщо вам потрібна точність, забудьте про люб'язності.