По тегу "тест" найдены следующие результаты:
Компания Alibaba представила свою новейшую мультимодальную модель искусственного интеллекта Qwen2.5-VL-32B, выпущенную под лицензией Apache 2.0. Предварительные тесты показывают, что эта модель превосходит более крупных конкурентов, таких как Gemma 3-27B и Mistral Small 3.1 24B. В некоторых тестах он даже превосходит собственный Qwen2-VL-72B от Alibaba и более старые версии GPT-4o от OpenAI, но не текущую версию.
Компания «Нанософт» приглашает принять участие в бета-тестировании nano360 – новейшего онлайн-сервиса для управления проектными данными. Сервис позволяет хранить, обмениваться и просматривать файлы различных форматов , работать с BIM-моделями онлайн и управлять версионностью. Участие бесплатное.
Холдинги «Росэлектроника» и «Ростелеком» провели испытания системы для управления мобильными устройствами. Проверялась совместимость программно‑аппаратного комплекса виртуализации ЕСР VeiL производства НИИ «Масштаб» и платформы централизованного управления мобильными устройствами «Аврора Центр» компании «Открытая мобильная платформа» . Тесты подтвердили, что система сохраняет эффективность вне зависимости от количества устройств.
В 2021 году был создан BIG-Bench — универсальный инструмент для тестирования больших языковых моделей. Однако с развитием технологий современные модели стали обеспечивать точность более 90%, и BIG-Bench достиг своего предела. В ответ на это Google DeepMind разработала тест BIG-Bench Extra Hard , который позволяет выявлять существенные недостатки даже в самых передовых моделях ИИ.
Банк России совместно с отечественными банками завершил тестирование российских межсетевых экранов . Эти устройства фильтруют сетевой трафик и защищают данные от несанкционированного доступа. Заместитель директора департамента информационной безопасности ЦБ Андрей Выборнов сообщил, что результаты оказались лучше ожидаемого. По его словам, ситуация с отечественными файерволами не критическая, но требует доработок.
Думали, что «Pokemon» — сложный тест для ИИ? Одна группа исследователей утверждает, что Super Mario Bros. ещё сложнее.
Microsoft тестирует в Windows 11 размещение кнопки выбора эмодзи на панели задач. Она открывает панель, на которой можно быстро получить доступ к эмодзи и GIF-файлам, аналогично тому, как это работает с помощью сочетания клавиш Win +.
Компания Anthropic использовала Pokémon для тестирования своей новейшей модели искусственного интеллекта.
Появляется новая волна агентов, использующих браузеры на базе искусственного интеллекта, которые обещают изменить то, как предприятия взаимодействуют с Интернетом. Эти агенты могут автономно перемещаться по веб-сайтам, получать информацию и даже завершать транзакции, но предварительное тестирование выявило значительные расхождения между обещаниями и производительностью.
Двадцать первого февраля во всем мире отметили Международный день родного языка
Каждое воскресенье ведущий NPR Уилл Шортц, гуру кроссвордов из The New York Times, проводит викторину для тысяч слушателей в рамках долгоиграющего сегмента под названием «Воскресная головоломка». Несмотря на то, что головоломки составлены так, чтобы их можно было решить, не слишком полагаясь на знания, они обычно сложны даже для опытных участников.
В октябре 2024 года Microsoft анонсировала обновления приложения Photos в Windows 11. Пользователи ПК Copilot+ получили встроенный апскейлер изображений, а всем остальным стало доступно оптическое распознавание символов . В ноябре компания приостановила развёртывание OCR, чтобы улучшить функцию, и теперь вновь вернула её для тестировщиков.
ChatGPT Operator от OpenAI впервые используется пользователями из США, у которых есть ранний доступ к этому инструменту. В то время как на мероприятии по запуску OpenAI были продемонстрированы базовые функции, такие как бронирование столиков в ресторанах и планирование поездок, пользователи расширяют границы возможностей этого AI-агента, чтобы увидеть, на что он действительно способен.
Специалисты «Базис», сотрудники ИСП РАН и испытательной лаборатории «Фобос‑НТ» протестировали компоненты в инструментах виртуализации с открытым исходным кодом по всему миру, включая ПО компаний. Результатом тестов стало обнаружение и последующее устранение 191 дефектов в коде, некоторые из которых были расценены как уязвимости.
Разработчик из Intel в рамках тестов выяснил, что принятый без особой проверки в код ядра Linux 6.13 патч от сотрудника Microsoft оказался проблемным. Примечательно, что это изменение, ставшее в итоге причинами сбоя в некоторых тестовых ситуациях, было подано нестандартно, но изначально принято, хотя не получило ни одного подтверждения от мэйнтайнеров архитектуры x86, что является нарушением общепринятых практик в разработке проектов, включая ядро Linux.
Сторонники оппозиции разблокировали проспект Руставели у президента Грузии
Президент Грузии Зурабишвили пришла на акцию протеста в Тбилиси
Компания T-Mobile сообщила об открытии регистрации на бета-версию сервиса «T-Mobile Starlink», который позволит отправлять текстовые сообщения через спутники в мертвых зонах, не охваченных вышек сотовой связи. О том, что Федеральная комиссия по связи США разрешила SpaceX протестировать спутниковый интернет системы Starlink напрямую на смартфонах Хабр писал 27 ноября.