Как соцсети раздувают ажиотаж вокруг ИИ: 5 провалов за месяц
Дата публикации

Скандал, который потряс мир ИИ
Глава Google DeepMind Демис Хассабис нашел всего три слова для комментария: «Это просто стыдно». Его реакция в соцсети X адресовалась коллеге из конкурирующей компании OpenAI - исследователю Себастьяну Бубеку, который с восторгом сообщил о невероятном достижении. По его словам, два математика использовали новейшую языковую модель GPT-5 и нашли решения для 10 нерешенных математических задач. «Ускорение науки через ИИ официально началось», - торжественно заявил Бубек.
Чтобы понять масштаб конфуза, стоит погрузиться в детали этой истории середины октября. Она идеально иллюстрирует главную проблему современной индустрии искусственного интеллекта.
Задачи Эрдёша и большая ошибка
Восторг Бубека вызвала серия головоломок, известных как задачи Эрдёша. Пол Эрдёш, один из самых продуктивных математиков прошлого века, оставил после себя сотни нерешенных задач. Томас Блум, математик из Манчестерского университета в Великобритании, создал сайт erdosproblems.com, где собрал более 1100 таких задач. Около 430 из них уже имеют решения, отмеченные на ресурсе.
Когда Бубек объявил о прорыве GPT-5, Блум моментально его поправил. «Это драматическое искажение фактов», - написал он в X. Блум объяснил простую вещь: если на сайте нет решения, это не значит, что задача не решена. Это означает лишь, что он сам не знал о существующем решении. Научных статей по математике существуют миллионы, и никто физически не может прочитать их все. Но GPT-5, скорее всего, проанализировал большинство из них.
Выяснилось, что вместо создания новых решений для 10 нерешенных задач, GPT-5 просто прошерстил интернет и нашел 10 существующих решений, о которых Блум не знал. Провал!
Для тех, кто интересуется практическим применением ИИ в бизнесе и науке, рекомендуем посетить AI Projects - там собраны реальные кейсы использования искусственного интеллекта без преувеличений.
Два урока из одной ошибки
Из этой ситуации можно извлечь два важных вывода. Первый: громкие заявления о прорывах не стоит делать через социальные сети без тщательной проверки. Меньше импульсивности, больше здравого смысла.
Второй урок более тонкий: способность GPT-5 находить ссылки на предыдущие работы, о которых Блум не знал, сама по себе впечатляет. Хайп затмил то, что действительно заслуживает внимания.
Математики очень заинтересованы в использовании больших языковых моделей для поиска в огромных массивах существующих результатов, рассказал мне Франсуа Шартон, научный сотрудник стартапа Axiom Math, изучающий применение языковых моделей в математике.
Но поиск литературы выглядит скучно по сравнению с настоящими открытиями, особенно для горячих сторонников ИИ в социальных сетях. Промах Бубека - не единственный пример такого рода.
Задача Ю Цумуры и новая волна хайпа
В августе два математика продемонстрировали, что ни одна языковая модель того времени не способна решить математическую головоломку, известную как 554-я задача Ю Цумуры. Два месяца спустя социальные сети взорвались доказательствами того, что GPT-5 теперь справляется с ней. «Момент Ли Седоля приближается для многих», - прокомментировал один наблюдатель, имея в виду мастера игры Го, проигравшего ИИ AlphaGo от DeepMind в 2016 году.
Но Шартон указал, что решение 554-й задачи Ю Цумуры не представляет большой ценности для математиков. «Это вопрос, который вы бы дали студенту-первокурснику», - сказал он. «Существует тенденция преувеличивать все подряд».
Трезвая оценка возможностей ИИ
Пока математики сражались в интернете из-за GPT-5, вышли два новых исследования, подробно изучающих использование языковых моделей в медицине и праве - двух областях, в которых создатели моделей заявляли об особых успехах своих технологий.
Исследователи обнаружили, что языковые модели могут ставить определенные медицинские диагнозы, но имеют серьезные недостатки при рекомендации лечения. Что касается юриспруденции, ученые выяснили, что модели часто дают противоречивые и некорректные советы. «Имеющиеся доказательства впечатляюще не соответствуют требуемому уровню», - заключили авторы.
Но такие сообщения плохо приживаются в X. «Вы видите это возбуждение, потому что все общаются как сумасшедшие - никто не хочет остаться позади», - сказал Шартон. X стал местом, где новости об ИИ появляются первыми, где трубят о новых результатах и где ключевые игроки вроде Сэма Альтмана, Янна ЛеКуна и Гэри Маркуса публично выясняют отношения. За этим трудно угнаться - и еще труднее отвести взгляд.
Пост Бубека был постыдным только потому, что его ошибку поймали. Не все промахи замечают. Пока ситуация не изменится, исследователи, инвесторы и просто энтузиасты будут продолжать подогревать друг друга. «Некоторые из них ученые, многие нет, но все они технари», - сказал мне Шартон. «Громкие заявления очень хорошо работают в этих сетях».
Неожиданное продолжение истории
История получила продолжение! Через два дня после публикации материала компания Axiom сообщила, что ее собственная математическая модель AxiomProver решила две открытые задачи Эрдёша (номер 124 и номер 481 для любителей математики). Впечатляющий результат для небольшого стартапа, основанного всего несколько месяцев назад. Да, ИИ развивается быстро!
Но это еще не все. Пять дней спустя компания объявила, что AxiomProver решил 9 из 12 задач конкурса Патнэма этого года - математического состязания университетского уровня, которое некоторые считают сложнее известной Международной математической олимпиады (где языковые модели от Google DeepMind и OpenAI показали отличные результаты несколько месяцев назад).
Результат Патнэма получил одобрение в X от крупных имен в отрасли, включая Джеффа Дина, главного научного сотрудника Google DeepMind, и Томаса Вольфа, сооснователя компании Hugging Face. Снова в ответах развернулись знакомые дебаты. Несколько исследователей отметили, что Международная математическая олимпиада требует более творческого решения задач, тогда как конкурс Патнэма проверяет математические знания - что делает его невероятно сложным для студентов, но теоретически проще для языковых моделей, поглотивших интернет.
Чтобы узнать больше о реальных возможностях ИИ и получить практические рекомендации по внедрению технологий, загляните на AI Projects.
Как правильно оценивать достижения ИИ
Как следует судить о достижениях Axiom? Точно не по социальным сетям. И впечатляющие победы в соревнованиях - это только начальная точка. Определение того, насколько хороши языковые модели в математике, потребует глубокого погружения в детали того, что именно эти модели делают, когда решают сложные (читай: сложные для людей) математические задачи.
Социальные сети превратились в площадку, где шум заглушает сигнал, где скорость важнее точности, а громкие заявления ценятся выше скромных, но реальных достижений. Пока индустрия ИИ не научится отделять настоящие прорывы от технологического шоу, мы будем свидетелями новых конфузов вроде истории с задачами Эрдёша.