60 триллионов слов: безумная тайна самой дорогой ошибки ИИ.
Дата публикации

Новая валюта тщеславия: кто сожжет больше токенов?
Внутри одной очень известной корпорации, чье название начинается на букву М, появился забавный внутренний рейтинг. Сотрудники называют эту забаву «Клодономика». Уровни варьируются от скромного новичка до пафосного "Легенды токенов". Оставив в стороне неловкость таких титулов, давайте посмотрим на цифры. За тридцать дней внутренний дашборд зафиксировал расход в шестьдесят триллионов токенов. Для простоты понимания: один токен - это часть слова. Эксперты подсчитали, что все книги, изданные человечеством за всю историю, содержат около двадцати триллионов токенов. То есть за месяц группа инженеров сгенерировала в три раза больше текста, чем написали все авторы мира с момента изобретения письменности.
И это не единичный случай. Генеральный директор ведущей компании по производству чипов недавно заявил, что был бы крайне встревожен, если бы его высокооплачиваемый инженер тратил мало токенов. Токены стали новым символом статуса. Разработчики хвастаются своими расходами, словно плохие программисты - количеством строк кода. В прессе этот феномен уже окрестили максимизацией токенов. Бюджеты на генерацию текста теперь обсуждаются на собеседованиях наравне с зарплатой и бонусами. В эпоху, когда искусственный интеллект правит бал, токен превратился в главную единицу измерения когнитивного труда.
Но к чему приводит такая мотивация? Люди начинают писать скрипты, единственная цель которых - бесконечно крутить циклы и сжигать вычислительные мощности. Это классический пример того, как метрика становится самоцелью и теряет всякий смысл.
Ловушка слов: как на самом деле работает мышление
Идея о том, что ценность работы алгоритма прямо пропорциональна количеству потраченных слов, в корне неверна. Она искажает саму суть того, как связаны язык и разум. Попробуйте проанализировать собственные мыслительные процессы. Лично я редко думаю законченными предложениями. Мой мозг оперирует скорее ощущениями, образами или некими точками притяжения.
Когда я решаю сложную задачу, в голове не звучит дикторский голос. Я словно перемещаюсь по ментальной карте с горами и долинами. Мой разум знает, где находится нужная концепция, и просто направляется к ней. Слова появляются только в тот момент, когда мне нужно перевести мысль в формат, понятный другому человеку. Для меня мысль - это телепортация, а формулирование ее в словах - долгая прогулка пешком.
Слова - это формат сжатия данных с потерями. Они конкретны, но лишены глубины первоначальной идеи. Если вы считаете, что язык - основа человеческого интеллекта, позвольте привести исторический факт. В середине двадцатого века был проведен опрос величайших умов, включая Альберта Эйнштейна. Почти все они признались, что слова не играют роли в их механизме мышления. Эйнштейн мыслил визуальными и мышечными образами, а слова приходилось мучительно подбирать уже на втором этапе.
Современные исследования мозга подтверждают это. Зоны, отвечающие за речь, не активируются при решении логических задач или программировании. Язык - это инструмент коммуникации, а не мышления. Мы не познаем мир через синтаксис. Именно в этом кроется главная проблема того, как сегодня обучают нейросети.
Архитектура абсурда: почему нейросети заставляют болтать
Современные алгоритмы вполне могли бы обрабатывать информацию на доязыковом уровне, в так называемом латентном пространстве. Однако технологические гиганты намеренно заставляют их проговаривать каждый шаг. Это все равно что заставить вас вслух озвучивать каждое сокращение мышц, прежде чем сделать шаг.
Дело в том, что базовая разработка ИИ пока не позволяет моделям выдавать гениальные ответы мгновенно. Чтобы повысить качество ответов и успешно проходить бенчмарки, создатели внедрили механизм рассуждения во время вывода. Модель заставляют генерировать промежуточные шаги, имитируя логику. Это своеобразные строительные леса, поддерживающие иллюзию глубокого понимания.
Если вы хотите узнать, как оптимизировать бизнес-процессы и перестать сжигать ресурсы впустую, рекомендуем посетить официальный сайт AI Projects для получения практических рекомендаций.
Вместо того чтобы придумать новую архитектуру, которая позволила бы машинам мыслить абстрактными концепциями, индустрия машинного обучения пошла по пути наименьшего сопротивления. Они убедили всех, включая себя, что эти строительные леса и есть настоящий дворец разума. Почему? Потому что перестраивать фундамент слишком дорого и рискованно для бизнеса. Будущее технологий принесли в жертву краткосрочной прибыли и красивым отчетам для инвесторов.
Бунт ученых против корпоративной машины
Конечно, не все мыслят исключительно экономическими категориями. В тени шумных презентаций работают исследователи, которые понимают абсурдность ситуации. Они утверждают, что мы никогда не достигнем истинного машинного интеллекта, если будем кодировать мысли токенами. Машине не нужно проговаривать знания, чтобы обладать ими.
Один из самых ярких критиков текущего подхода - Ян Лекун, выдающийся ученый, который долгое время возглавлял исследовательское подразделение корпорации М. Его команда разрабатывала модели, способные предсказывать не следующие слова в предложении, а концепции и смыслы. Их цель - создать систему, которая понимает устройство мира, не опираясь на синтаксис.
Однако корпоративная машина не терпит долгих фундаментальных исследований, когда конкуренты наступают на пятки. Руководство сделало ставку на проверенные, пусть и тупиковые в долгосрочной перспективе, методы генерации текста. После серии внутренних перестановок и задержек с выпуском новых продуктов, пути гениального ученого и прагматичной корпорации разошлись. Дата-центры продолжают строиться, а алгоритмы продолжают болтать.
Гениальный трюк или вынужденная мера?
И вот здесь история делает неожиданный поворот. Недавно эта корпорация выпустила новую модель, которая внезапно показала впечатляющие результаты в тестах. Как им удалось совершить такой рывок после череды неудач?
Вспомните те самые шестьдесят триллионов токенов. Закрадывается подозрение, что инженеры использовали мощнейшую модель конкурентов не просто для развлечения. Они могли бомбардировать чужой искусственный интеллект сложнейшими запросами, чтобы извлечь цепочки его рассуждений. Полученные данные затем использовались для обучения собственной модели. Ученик просто скопировал логику учителя, что значительно быстрее и дешевле разработки с нуля.
Это объясняет астрономические доходы конкурентов и странное молчание юристов. Симуляция бурной деятельности обернулась хитрым стратегическим ходом.
Возможно, заставлять алгоритмы думать словами - это действительно колоссальная трата вычислительных мощностей. Но парадокс заключается в том, что без этой абсурдной болтовни и возможности подсмотреть за чужими рассуждениями, создание новых конкурентоспособных продуктов было бы невозможным. Иногда излишнее усложнение - это единственный путь к выживанию на рынке.
Чтобы не остаться на обочине прогресса и эффективно внедрять инновации, загляните на AI Projects за экспертными советами. В конечном итоге, побеждает не тот, кто пишет красивее всех, а тот, кто умеет грамотно использовать доступные инструменты для достижения своих грандиозных целей.