Какие ограничения текущей ситуации нужно преодолеть, чтобы открыть новые горизонты? Действительно ли нейросети заменят труд человека? Рассказывает Михаил Исаев, CTO в Madison Tech, старший член глобальной ассоциации IEEE.
Согласно прогнозам McKinsey & Company, искусственный интеллект может принести мировой экономике до $4,4 трлн в год. По сравнению с предыдущими оценками экспертов в 2017 году, показатель экономического воздействия в 2023 году увеличился на 15-40%. Такое повышение связано с активным внедрением ИИ как крупными, так и небольшими компаниями. Судя по цифрам, аналитики убеждены в том, что в ближайшее время мы достигнем более высокого уровня технологического потенциала.
Сегодня почти в каждой отрасли есть компании, которые применяют в своей работе искусственный интеллект. Наиболее активные «пользователи» — сферы финансов и маркетинга.
Банки совершенствуют системы распознавания паттернов и аномалий в реальном времени. В сфере торговли, в стриминговых сервисах и других клиентоориентированных бизнесах идет интенсивное внедрение и тренировка нейросетей для предоставления персонализированных рекомендаций пользователям. Активно развиваются текстовые и голосовые чат-боты.
За последние пару лет произошел большой скачок в достижениях ИИ:
Создание «универсального переводчика», который распознает и переводит речь на 200 языков в режиме реального времени. Компания Meta*, лето 2022.
Появление большой языковой модели PaLM 2, которая демонстрирует высокую производительность в обработке естественных языков, то есть широта понимания ИИ увеличивается. Компания Google, май 2023.
Разработка системы Gato, которая значительно отличается от традиционных моделей ИИ, выполняющих конкретные задачи в узких областях. Gato — многозадачная модель, она работает с различными модальностями (например, текстом, изображениями, движениями рук робота) и может выполнять 604 задания. Это указывает на прогресс развития универсальных способностей ИИ. Компания DeepMind, ноябрь 2022.
Запуск платформы AlphaCode, которая способна конкурировать с людьми в написании компьютерных программ. Это значительный шаг в решении задач по созданию и отладке кода. Компания DeepMind, декабрь 2022.
Современные системы искусственного интеллекта основаны на сложных алгоритмах, которым нужен достаточно большой массив данных. Если нет возможности собрать большой датасет, то невозможно обучить нейросети чему-то адекватному. Почему только крупные компании могут позволить себе выпустить что-то наподобие GPT? Только у них есть ресурсы для хранения и обработки огромных баз данных. Покупка дата-центров или серверов — удовольствие не из дешевых.
Есть ряд других проблем.
Ситуации, когда система уверенно генерирует недостоверную или вымышленную информацию, поэтому пользователи могут воспринимать ее как правдивую. Эта проблема может возникнуть в областях, где ИИ генерирует текст, изображения, звуки и т.д. Ее можно устранить, если бы ИИ и ChatGPT в частности выдавал долю вероятности промежуточному или итоговому результату. Тогда мы бы понимали, «сгаллюционировал» чат или нет.
Обычно ИИ-системы обучаются решать конкретные задачи, и их знания ограничиваются определенной областью. Это означает, что если ИИ был обучен для выполнения одной задачи, например игры в шахматы, он не сможет автоматически переключиться на решение другой задачи, например, генерации музыки.
Из-за узкой специализации ИИ не совсем понимает задачи, которые он выполняет. Он просто следует заранее запрограммированным шаблонам, которые взял из данных. Например,
в области медицинской диагностики ИИ-системы могут быть обучены на больших базах медицинских данных и способны точно распознавать определенные закономерности. Но они могут не до конца понимать клиническую картину, что может привести к ложному диагнозу или неправильным рекомендациям по лечению.
В обществе давно обсуждаются потенциальные угрозы искусственного интеллекта. Вопрос пугает и само технологическое сообщество, включая «крестного отца ИИ» Джеффри Хинтона, который опасается, что нейросети приведут к дезинформации и массовым увольнениям.
Основатель Tesla и SpaceX Илон Маск тоже относится к числу алармистов: он и более чем 33 тысячи человек в открытом письме 2023 года призвали на полгода приостановить эксперименты с искусственным интеллектом, подчеркнув, что технология может представлять серьезные риски для человечества и «вытеснить» людей.
На самом деле, сегодняшний ИИ не представляет настолько большой угрозы. Он может заменить только сотрудников, чья работа укладывается в определенный шаблон и повторяющиеся действия. Автоматизация не заменит опытных и постоянно развивающихся специалистов. На текущий момент ИИ думает преимущественно через текстовые операции, в то время как опытный специалист опирается на множество вводных, включая зрительные и звуковые восприятия, тактильные ощущения, контекст окружающей среды, свой опыт и интуицию. К тому же, у технологии нет креативности и способности к состраданию или эмпатии. Скорее, это инструмент для усиления человеческого творчества.
Что касается опасений по поводу захвата мира, то это маловероятно. Мы наделяем ИИ человеческими качествами и прогнозируем его развитие исходя из этого. Но он не испытывает зависти, ему не присуще чувство конкуренции и другие моменты, которые есть у людей. Развитие технологии будет зависеть от того, какие стимулы в него заложит человек. Если заложит стимул быть злым и хитрым, то получатся такие проекты, как WormGPT и FraudGPT. Проблема заключается в том, что сложно эффективно управлять стимулами ИИ. Представьте робота с мышлением, зрением, слухом и физической способностью взаимодействия. Трудно учесть все аспекты при соприкосновении робота с реальным миром. По просьбе что-то сделать он выберет оптимальный маршрут с учетом встроенных стимулов. Если не заложить в него какие-то аспекты, он может проявить неожиданное поведение. Проблема станет особенно актуальной на этапе, когда мы займемся разработкой полноценных роботов.
В следующей ступени развития ИИ нас определенно ждет расширение его когнитивных способностей. Еще в 2014 году исследователь из Беларуси Дмитрий Богданов придумал инновационный метод, который расширил границы в развитии технологии, — «механизм внимания». Он улучшил качество и эффективность работы моделей ИИ, поскольку позволяет им более точно адаптироваться к разным данным и контекстам. Развитие этого подхода добавит новые перспективы для совершенствования, в первую очередь — позволит увеличить объем данных, которые модель ИИ может использовать. Это подобно расширению «мозгов» и наращиванию интеллектуальных ресурсов искусственного интеллекта. Чем больше ресурсов, тем более мощными становятся его способности. Если в модель добавят еще тысячи миллиардов данных, это может привести к грандиозным результатам. Сейчас модель GPT демонстрирует внушительные знания и превосходит в эрудиции людей. Но при дополнительном увеличении данных и качества обучения она станет еще более универсальной, способной к глубокому анализу и обучению своих когнитивных способностей.
Вероятно, может быть реализован потенциал для самосознания ИИ. Несмотря на спорность этого вопроса, мы не можем утверждать, что это невозможно. Искусственный интеллект создан и строится на подобной людям архитектуре нейронных сетей, а у нас самосознание есть. Следовательно, не стоит категорично отказывать в этом и другой форме жизни.
Будут активно совершенствоваться текстовые модели вроде GPT. Сейчас чат-боту не хватает новых аспектов, таких как зрение и слух. Несмотря на то, что GPT способен переводить аудио в текст, он не учитывает интонацию, тембр, громкость и другие параметры речи, которые позволили бы ему быть в большем контексте с пользователем. Когда появятся GPT-роботы, они будут наделены ориентацией в пространстве и осязанием, это колоссально расширит степень их взаимодействия с окружающим миром и адаптирует к разным задачам.
Сегодня есть ограничение, связанное с использованием оборудования для машинного обучения. Текущая вычислительная техника недостаточно мощная, чтобы создавать модели большой емкости, которые позволили бы строить новые связи. Прорывы могут произойти благодаря новым разработкам в технике. Например, если появится доступный и работоспособный квантовый компьютер. Или если продолжат развиваться энергоэффективные механизмы — тогда у нас появится огромное преимущество, потому что обучение станет быстрее и дешевле. Компания IBM уже разработала энергоэффективный аналоговый чип для ИИ, который позволяет выполнять задачи быстрее и потребляя меньше энергии. Концепция аналога имеет огромный потенциал, но нужно проделать еще много работы, чтобы она привела к революционным возможностям.
Следующий наиболее захватывающий этап — это nextgen. Подобно тому, как игровые консоли стремятся достичь более реалистичной графики, в области искусственного интеллекта мы можем ожидать наличие полноценного ИИ непосредственно на смартфонах, без необходимости постоянного подключения к облаку через интернет.
В целом, ИИ дает нам «сверхспособности». Он сможет автоматизировать многие рутинные задачи, которые люди выполняют в течение рабочего дня, чтобы мы могли быть продуктивнее и выполнять более интересную работу. Мы сможем уделять больше времени человеческим связям и аспектам взаимодействия, чего ИИ не может отнять у людей.
*Meta - ее деятельность признана в России экстремистской и запрещена.