Формула зелених квадратів: як математика з Бінгемтону зламала Wordle із точністю 99%

Ваш друг уже виставив результат у соцмережах: чотири зелені лінії за три спроби, посмішка в кадрі, підпис «streak = 847». Ви ж сидите перед пятим порожнім рядком у Wordle і ловите себе на думці, що забули всі пятилітерні слова англійською, які коли-небудь знали. Різниця між вами не словниковий запас, не везіння і не ранкова кава.

Математика.

Пять літер. Шість спроб. І мільйони гравців по всьому світу, які щоранку відкривають додаток New York Times, щоби розгадати секретне слово. Гра, яка нещодавно відсвяткувала своє пятиріччя, залишається цифровим ритуалом безлічі людей. Але дослідники з Університету Бінгемтона, що у штаті Нью-Йорк, зробили те, що неможливо пояснити інтуїцією: вони знайшли спосіб перемагати в Wordle із точністю 99%. І ключ до цього захований не в мові, а в теорії інформації.

Гра в кольорах

Правила Wordle прості до банальності. Гравець вводить пятилітерне слово наприклад, BRAVE і система відповідає кольорами. Сірий квадрат означає, що літери в загаданому слові немає. Жовтий літера є, але стоїть не на своєму місці. Зелений і літера правильна, і позиція вгадана. Шість рядків, двадцять девять літер і нескінченна кількість комбінацій. Здавалося б, тут працює лише мовчазне читання словника та натхнення. Проте команда на чолі з доцентом Конґю «Пітером» Ву, викладачем Школи системних наук та інженерії імені Томаса Дж. Вотсона, довела: успіх у Wordle це обчислюваний процес, а не гадання.

Не вгадувати, а пізнавати

Традиційні гравці зазвичай обирають перше слово з найчастішими літерами англійської абетки E, A, R, S, T. Це розумна тактика, яка дає приблизно 90% успішності в компютерних симуляціях. Але дослідники Бінгемтона пішли іншим шляхом. Вони використали поняття ентропії Шеннона математичний інструмент, який вимірює невизначеність. Замість того щоби шукати слово, яке найімовірніше є відповіддю, алгоритм шукає слово, яке розкриває найбільше інформації про приховане слово.

Ентропія Шеннона це міра хаосу в системі. У контексті Wordle вона відповідає на питання: скільки невідомого ще лишилося після вашого ходу? Чим вища ентропія, тим більше невизначеності. Завдання алгоритму знайти слово, яке знижує цю ентропію максимально різко. Іншими словами, замість того щоби питати «чи це слово правильне?», система питає «яке слово дасть мені найбільше корисних підказок, навіть якщо воно саме не є відповіддю?».

Кожен хід має розколоти простір можливостей навпіл.

«Уявіть, що ви зробили певну кількість спроб, пояснює Конґю Ву. Попередні відповіді виключили цілу купу варіантів. І серед тих, що лишилися, деякі слова ведуть вас траєкторією, де інформаційний виграш набагато швидший». Це означає, що оптимальне слово іноді здається абсурдним або рідкісним воно просто задає таку комбінацію літер, яка максимально звужує коло підозрюваних.

«Тонкий, але важливий інсайт нашої роботи полягає в тому, що слово не обовязково має бути найімовірнішою відповіддю воно просто має бути інформативним. Застосовуючи ентропію Шеннона, ми зміщуємо фокус із максимізації ймовірності вгадування на максимізацію очікуваного зменшення невизначеності. На практиці це призводить до розвязання головоломки за меншу кількість спроб».

Ці слова належать докторантові Дональду Стівенсу, який разом із колегами перетворив академічну вправу на повноцінне наукове дослідження. Їхній метод виглядає дещо випадковим для непосвяченого, адже він жертвує прямим прагненням до відповіді заради збору даних. Щоби скористатися стратегією в реальній грі, потрібно запустити окремий скрипт або програму, ввести отримані кольорові підказки після кожного ходу і отримати наступне слово, яке математично обіцяє найбільший інформаційний прибуток. Особливість методу в його динамічності: на відміну від статичних таблиць найкращих перших слів, які роками циркулюють інтернетом, ентропійний алгоритм перераховує стратегію після кожного кольорового відгуку. Сьогодні це слово може бути одним, а завтра зовсім іншим, залежно від того, які літери вже відкрилися.

З домашки у журнал

Найдивовижніше в цій історії те, як вона починалася. Проєкт не народився в лабораторії з багатомільйонним грантом. Він почався як звичайне домашнє завдання. Конґю Ву викладає в Томаса Дж. Вотсона Коледжі інженерії та прикладних наук одному з найпрестижніших інженерних підрозділів Університету штату Нью-Йорк. Його курс із системного аналізу вимагав не формул на дошці, а рішень для реального світу. Студенти обирали власні проєкти. Хтось узяв навігацію в місті, хтось логістику доставки. А група на чолі з Талалом Аладайлею, Дональдом Стівенсом та Маллаком Алькайсі подивилася на телефон і побачила головоломку, яку щодня розгадують мільйони. Вони вирішили перевірити, чи зможе теорія інформації перетворити аматора на чемпіона.

Звичайна аудиторна робота перетворилася на статтю в науковому виданні.

«Курси тут не просто викладають концепції вони змушують застосовувати їх так, щоби це мало реальний, тривалий вплив».

Це сказав співавтор дослідження Талал Аладайле. Сам Ву вважає роботу зразком того, як абстрактна наука покращує практичні навички. «Особливо креативним і цінним є те, каже він, що команда перетворила статичне вимірювання ентропію Шеннона на динамічне рішення, яке допомагає краще виконувати популярне завдання. Це демонструє глибоке розуміння матеріалу курсу та інженерний талант команди». Стаття «Solving Wordle Using Information Theory» зявилася у Northeast Journal of Complex Systems рецензованому виданні, яке рідко публікує матеріали про настільні ігри, але завжди відкрите до неочевидних застосувань математики.

99 проти 90

Щоби оцінити ефективність, дослідники порівняли свій ентропійний метод із класичною стратегією, що базується на частоті вживання літер. Результати виявилися настільки переконливими, що межа між «граємо для задоволення» і «вирішуємо задачу оптимізації» стерлася остаточно. Інформаційно-теоретичний підхід вирішив 99% головоломок Wordle. Традиційний метод, який покладається на поширені літери, зупинився на позначці 90%. Девять відсотків різниці це сотні тисяч слів, які ніколи б не були відгадані за шість спроб. Це також доказ того, що іноді найкращий спосіб досягти мети це тимчасово забути про мету і зосередитися на тому, що ви дізнаєтеся по дорозі.

99% успішність ентропійної стратегії в компютерних симуляціях
90% успішність традиційного методу за частотністю літер
6 спроб стандартний ліміт, якого дотримується алгоритм
5 років вік Wordle, який гра відсвяткувала нещодавно
1 курсова робота походження дослідження, що перетворилося на наукову публікацію

Що далі

Звісно, більшість гравців навряд чи запускатимуть Python-скрипт перед ранковою кавою. Але ця робота важить значно більше, ніж просто колекція зелених квадратиків. Вона показує, як теорія інформації наука, що лежить в основі стиснення даних, шифрування та роботи інтернету може бути зрозумілою через звичайну головоломку. Для студентів це нагода побачити математику не як абстракцію, а як інструмент, який працює тут і зараз. Для викладачів нагода перетворити щоденне завдання на публікацію, яку цитуватимуть. А для решти з нас нагода усвідомити, що за кожним ранковим Wordle стоїть цілий всесвіт ймовірностей, ентропії та оптимальних рішень.

Іноді найкращий хід це той, який здається найвіддаленішим від відповіді.

Завтра вранці, коли ваш екран знову засвітиться пятьма порожніми рядками, памятайте: десь у Бінгемтоні група студентів і їхній професор уже довели, що перемога вимірюється не лише зеленим кольором. Вона вимірюється в бітах інформації, які ви здобуваєте з кожною спробою. А ваш друг із ідеальним streak? Можливо, він просто знає більше пятилітерних слів. Або, можливо, він уже читав статтю Ву. Хоча ні тоді б він знав, що найімовірніше слово це ще не найкращий вибір.