По данным Ассоциации больших данных (АБД) и Сбербанка, по завершении 2024 года объем российского сегмента Big Data достиг 433 млрд рублей, заметно превысив прогноз в 319 млрд. Такой результат отмечен приростом в 33% год к году — темпом, который примерно в полтора раза опережает средний рост всего ИТ-сектора страны. Ассоциация предложила несколько возможных траекторий развития индустрии на ближайшее пятилетие.
По прогнозу АБД, к 2030 году масштаб российского рынка больших данных должен достичь как минимум 1,2 трлн рублей. Для достижения этой цели требуется обеспечить широкую доступность надежных данных для аналитики и систем искусственного интеллекта, развивать отечественные технологические решения, укреплять сотрудничество между российскими и зарубежными участниками рынка, а также уделять первостепенное внимание безопасности и повышению доверия к национальным данным. В базовом сценарии предполагается, что распространение технологий больших данных способно принести экономике страны к 2030 году дополнительно около 10,5 трлн рублей, а при оптимистичном сценарии — от 12,5 до 14,5 трлн рублей.
Для выполнения оптимистичного варианта развития — трехкратного увеличения рынка, существенного расширения его вклада в экономический рост и сохранения ведущих позиций России в сфере искусственного интеллекта — Ассоциация предлагает комплекс согласованных инициатив для бизнеса и государства.
Технологическое лидерство становится важнейшим элементом национального суверенитета. У России уже сформирована прочная база, однако для сохранения высоких темпов развития необходимо сосредоточиться на ключевых направлениях. Дополнительные 2–4 трлн рублей экономического эффекта вполне достижимы при условии реализации системных мер: обеспечения доступа к качественным данным для AI — включая отраслевые датасеты и механизмы обмена, стимулирования внедрения больших данных и ИИ в тех секторах, где их проникновение пока низкое, поддержки фундаментальных исследований, разработки конкурентоспособных технологий и продуктов, развития инфраструктуры и подготовки специалистов мирового уровня.
Рынок больших данных и искусственного интеллекта продолжает стремительно расти, и особенно заметна динамика сегмента ИИ-платформ, увеличивающегося ежегодно примерно на 35%. В глобальном масштабе 78% компаний уже используют технологии ИИ и планируют наращивать вложения. Тренд отражает глубокие изменения в архитектуре цифровых экосистем: бизнес переходит от разрозненных решений к AI-native-экосистемам, где данные и ИИ образуют единый технологический фундамент.
В Сбербанке отмечают, что прогресс в области генеративного ИИ приводит к кардинальным трансформациям в индустрии данных. Появление AI-агентов требует пересмотра традиционных подходов к построению платформ управления данными: перехода от моделей Data Warehouse и Data Lake к гибридным Data Lakehouse, а также перестройки систем управления знаниями, позволяющей представлять данные в удобном для работы генеративных моделей виде. Создание простейшего агента уже не представляет сложности, но вывести его способности на уровень, близкий к человеческому, крайне сложно. Качество его работы напрямую зависит от объема и качества данных, доступных как для обучения, так и для дальнейшей работы. В результате индустрия переживает настоящую технологическую революцию: формируется AI-native data stack, растет значение данных в реальном времени, ускоряется внедрение систем управления данными на основе генеративного ИИ. Именно в этой сфере сейчас сосредоточены усилия технологических лидеров.
Рынок AI-агентов развивается стремительно, но даже наиболее продвинутые системы пока ограничены в автономности и точности выполнения задач, подчеркнули в Upgini. Для преодоления этих ограничений в Upgini создали и протестировали новый функциональный навык для агентов ИИ — автономный поиск и ранжирование источников данных с использованием собственного сервиса компании. Благодаря этому агент способен самостоятельно действовать как покупатель данных: находить новые источники, оценивать их релевантность и выбирать те, что обеспечивают устойчивый рост качества модели. Проверка на бенчмарках, включая MLE-Bench, а также на реальных коммерческих задачах показала улучшение качества решения на 10,2%. Такой значительный прирост, достигнутый за счет автономного поиска и выбора данных, демонстрирует: роль AI-агентов в экономике данных в ближайшие годы станет ключевой.