Статистическое чудо: Рождение логики из текстового хаоса в ИИ
Перемножение больших матриц — преимущественно квадратных, иногда квадратных на прямоугольные, когда задача становится особенно сложной — это, по сути, и есть основа «мышления» современных мощных систем искусственного интеллекта. Но как к этому относиться? Интересно ли это разработчикам ИИ? Давайте разберемся.
Рассмотрим скорость. Человеческий мозг, несмотря на свою параллельную природу (миллиарды нейронов), работает значительно медленнее цифровых систем. Причина фундаментальна: в мозге сигналы передаются химически, тогда как в искусственных нейронных сетях — чисто электрически. Несмотря на это, современный ИИ демонстрирует результаты, сопоставимые с некоторыми аспектами биологического интеллекта. Возникает вопрос: может ли мозг быть эффективнее на структурном уровне?
Масштаб связей — ключевой параметр. В человеческом мозге около 86 миллиардов нейронов, каждый из которых образует порядка 5000 синаптических связей. Умножая, получаем колоссальную цифру: примерно 430 триллионов связей.
Современные же крупнейшие нейросети оперируют параметрами (весами), выполняющими схожую функцию, но в значительно меньшем масштабе — от десятков миллиардов до примерно триллиона. То есть, в 100-1000 раз меньше, чем в биологическом мозге. Это существенный разрыв.
Структурное различие и текущие ограничения. Хотя архитектуры биологического и цифрового интеллекта принципиально различны, их базовые «вычислительные элементы» (синапсы и параметры сети) в какой-то мере сопоставимы по функциональной роли. И по их количеству ИИ пока серьезно отстает.
Если представить, что параметров в нейросетях станет хотя бы на порядок больше (в 10 раз), это может открыть путь к качественному скачку — например, в обработке и понимании сложной мультимодальной информации, такой как видео, что остается серьезной проблемой.
Парадокс современного ИИ. Сегодняшнее «чудо» искусственного интеллекта имеет и свое очевидное ограничение: оно в основном работает с текстом. Когда говорят об ИИ, чаще всего имеют в виду именно языковые модели. Эти системы лишены сенсоров: они не видят, не слышат, не чувствуют мир напрямую. Их реальность — это гигантский массив текстов, созданных человеком. Это «мозг» и «речевой аппарат», обученные на всех доступных книгах, статьях и записях. И из этого «бульона» букв и слов, из выявленных статистических закономерностей, неожиданно рождаются логически связные фразы и подобие знаний. Но является ли это пониманием в человеческом смысле? Вопрос остается открытым.
© Блог Игоря Ураева