Компании, работающие в нефтегазовой сфере, отказались от идеи создания единой платформы генеративного искусственного интеллекта. Главная причина заключается в том, что ни одна из них не готова делиться собственными закрытыми данными для обучения нейросетей, рассказал глава консалтинговой «Выгон консалтинг» Григорий Выгон.
Совместная инициатива «Выгон консалтинг» и «Газпром нефти» была представлена в прошлом году в рамках мероприятий индустриальных центров компетенций «Нефтегаз, нефтехимия и недропользование». ИЦК, созданные в 2022 году по поручению премьер-министра Михаила Мишустина, объединяют промышленные компании и IT-разработчиков для создания отечественных программных решений взамен зарубежных. Однако идея отраслевой платформы поддержки со стороны участников пока так и не получила. По словам одного из собеседников, проект предлагался как инструмент для решения инженерных задач, включая реверс-инжиниринг и генеративное проектирование при разработке новых материалов и технологий.
Выгон уточнил, что самостоятельная разработка подобных решений обходится слишком дорого для отдельной компании. Совместная платформа позволила бы объединить ресурсы и снизить затраты. Речь идет о необходимости в мощной инфраструктуре – от видеокарт и датасетов для обучения и тестирования до мультимодальных данных, опенсорсных репозиториев и даже коммерческих языковых моделей. Особенно важно иметь доступ к большему массиву информации для анализа инцидентов и аварий, поскольку в рамках одной компании объем данных часто ограничен.
По его мнению, использование готовых генеративных моделей, например от «Яндекса» или «Сбера», напрямую в нефтегазовой отрасли невозможно. Так, геологам, например, критически важно учитывать специфику российского законодательства, процедуры экспертизы и классификации запасов. Эти материалы часто недоступны в открытых источниках. Даже внутри одной компании существует множество локальных задач, требующих индивидуализированных решений, а на уровне бизнес-процессов их сложность многократно возрастает. Именно поэтому совместная работа над прототипами могла бы быть эффективной.
«Сибур» заявил о заинтересованности в отраслевых инициативах, но подчеркнул необходимость создания нормативной базы для защиты конфиденциальных данных. Компания уже тестирует пилотные проекты генеративного ИИ в ключевых направлениях, включая R&D, финансы и закупки, а также внедряет корпоративных цифровых помощников. Кроме того, в «Сибуре» разворачивают собственную инфраструктуру больших языковых моделей во внутреннем контуре, что позволит расширять использование ИИ без ущерба для информационной безопасности.
Эксперты отмечают, что объединение данных российских компаний в единую систему в теории возможно. Это мог бы быть аналог международной платформы IHS EDIN, где собирается информация о разведке, добыче и транспортировке углеводородов. Так, у «Газпром нефти» уже есть структурированная база данных по российским месторождениям, включающая сведения вплоть до отдельных скважин.
Однако вертикально интегрированные компании (ВИНК), работающие полным циклом — от разведки до сбыта, — не видят выгоды в том, чтобы делиться собственными наработками. У них и так накоплены колоссальные массивы информации о геологических условиях и стоимости разработки месторождений.
По мнению экспертов, только решение со стороны государства, например Минэнерго, способно заставить компании объединить свои базы данных на единой платформе ВИНК. В качестве компромисса предлагается использование защищенных дата-спейсов, где информация будет обезличена, но сохранит ценность для обучения нейросетей.
В то же время нефтегазовые игроки крайне осторожно относятся к внедрению генеративного ИИ в критически важные процессы из-за риска ошибок. Пока такие технологии тестируют лишь во в непроизводственных функциях. Например, «Татнефть» совместно с ИТМО создали чат-бота «Акела» для помощи сотрудникам в работе с корпоративными данными и бизнес-процессами. «Газпром нефть» вместе с Университетом Иннополис и Nedra Digital работает над ИИ-платформой для геомеханического моделирования, которая помогает оценивать продуктивность месторождений и подбирать оптимальные методы их разработки.
Большинство крупных игроков нефтегаза в мире все же делают ставку не на генеративный ИИ, а на продвинутую аналитику данных, машинное обучение и прогнозное моделирование. Как отмечают консультанты, именно эти технологии пока остаются более надежным инструментом цифровизации в отрасли.