Результаты поиска

По тегу "тест" найдены следующие результаты:

Мультимодальная модель Qwen2.5-VL-32B: успехи в понимании медиа и математических задачах

Компания Alibaba представила свою новейшую мультимодальную модель искусственного интеллекта Qwen2.5-VL-32B, выпущенную под лицензией Apache 2.0. Предварительные тесты показывают, что эта модель превосходит более крупных конкурентов, таких как Gemma 3-27B и Mistral Small 3.1 24B. В некоторых тестах он даже превосходит собственный Qwen2-VL-72B от Alibaba и более старые версии GPT-4o от OpenAI, но не текущую версию.

Протестируйте новую облачную СОД nano360

Компания «Нанософт» приглашает принять участие в бета-тестировании nano360 – новейшего онлайн-сервиса для управления проектными данными. Сервис позволяет хранить, обмениваться и просматривать файлы различных форматов , работать с BIM-моделями онлайн и управлять версионностью. Участие бесплатное.

«Росэлектроника» и «Ростелеком» провели испытания решения для управления мобильными устройствами

Холдинги «Росэлектроника» и «Ростелеком» провели испытания системы для управления мобильными устройствами. Проверялась совместимость программно‑аппаратного комплекса виртуализации ЕСР VeiL производства НИИ «Масштаб» и платформы централизованного управления мобильными устройствами «Аврора Центр» компании «Открытая мобильная платформа» . Тесты подтвердили, что система сохраняет эффективность вне зависимости от количества устройств.

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях

В 2021 году был создан BIG-Bench — универсальный инструмент для тестирования больших языковых моделей. Однако с развитием технологий современные модели стали обеспечивать точность более 90%, и BIG-Bench достиг своего предела. В ответ на это Google DeepMind разработала тест BIG-Bench Extra Hard , который позволяет выявлять существенные недостатки даже в самых передовых моделях ИИ.

Банк России протестировал российские NGFW

Банк России совместно с отечественными банками завершил тестирование российских межсетевых экранов . Эти устройства фильтруют сетевой трафик и защищают данные от несанкционированного доступа. Заместитель директора департамента информационной безопасности ЦБ Андрей Выборнов сообщил, что результаты оказались лучше ожидаемого. По его словам, ситуация с отечественными файерволами не критическая, но требует доработок.

ИИ учится играть в Super Mario Bros.: какие модели показали лучшие результаты

Думали, что «Pokemon» — сложный тест для ИИ? Одна группа исследователей утверждает, что Super Mario Bros. ещё сложнее.

Microsoft тестирует в Windows 11 размещение кнопки эмодзи на панели задач

Microsoft тестирует в Windows 11 размещение кнопки выбора эмодзи на панели задач. Она открывает панель, на которой можно быстро получить доступ к эмодзи и GIF-файлам, аналогично тому, как это работает с помощью сочетания клавиш Win +.

Anthropic протестировала модель Claude 3.7 Sonnet на игре Pokémon Red

Компания Anthropic использовала Pokémon для тестирования своей новейшей модели искусственного интеллекта.

Рост популярности агентов, использующих браузеры: почему Proxy превосходит Operator

Появляется новая волна агентов, использующих браузеры на базе искусственного интеллекта, которые обещают изменить то, как предприятия взаимодействуют с Интернетом. Эти агенты могут автономно перемещаться по веб-сайтам, получать информацию и даже завершать транзакции, но предварительное тестирование выявило значительные расхождения между обещаниями и производительностью.

Проверь себя: как ты знаешь русский и другие языки родной страны

Двадцать первого февраля во всем мире отметили Международный день родного языка

Модели AI на «экзамене» по решению головоломок: исследование выявило неожиданные результаты

Каждое воскресенье ведущий NPR Уилл Шортц, гуру кроссвордов из The New York Times, проводит викторину для тысяч слушателей в рамках долгоиграющего сегмента под названием «Воскресная головоломка». Несмотря на то, что головоломки составлены так, чтобы их можно было решить, не слишком полагаясь на знания, они обычно сложны даже для опытных участников.

В приложение «Фотографии» Windows вернулась поддержка OCR

В октябре 2024 года Microsoft анонсировала обновления приложения Photos в Windows 11. Пользователи ПК Copilot+ получили встроенный апскейлер изображений, а всем остальным стало доступно оптическое распознавание символов . В ноябре компания приостановила развёртывание OCR, чтобы улучшить функцию, и теперь вновь вернула её для тестировщиков.

Первые пользователи протестировали ChatGPT Operator от OpenAI на реальных задачах

ChatGPT Operator от OpenAI впервые используется пользователями из США, у которых есть ранний доступ к этому инструменту. В то время как на мероприятии по запуску OpenAI были продемонстрированы базовые функции, такие как бронирование столиков в ресторанах и планирование поездок, пользователи расширяют границы возможностей этого AI-агента, чтобы увидеть, на что он действительно способен.

«Базис» и ИСП РАН при поддержке «Фобос‑НТ» обнаружили уязвимости в популярном open source ПО виртуализации

Специалисты «Базис», сотрудники ИСП РАН и испытательной лаборатории «Фобос‑НТ» протестировали компоненты в инструментах виртуализации с открытым исходным кодом по всему миру, включая ПО компаний. Результатом тестов стало обнаружение и последующее устранение 191 дефектов в коде, некоторые из которых были расценены как уязвимости.

В Intel выяснили, что принятый без проверки в код ядра Linux 6.13 патч от сотрудника Microsoft оказался проблемным

Разработчик из Intel в рамках тестов выяснил, что принятый без особой проверки в код ядра Linux 6.13 патч от сотрудника Microsoft оказался проблемным. Примечательно, что это изменение, ставшее в итоге причинами сбоя в некоторых тестовых ситуациях, было подано нестандартно, но изначально принято, хотя не получило ни одного подтверждения от мэйнтайнеров архитектуры x86, что является нарушением общепринятых практик в разработке проектов, включая ядро Linux.

Сторонники оппозиции разблокировали проспект у парламента Грузии

Сторонники оппозиции разблокировали проспект Руставели у президента Грузии

Зурабишвили пришла на очередную акцию протеста в Тбилиси

Президент Грузии Зурабишвили пришла на акцию протеста в Тбилиси

T-Mobile и Starlink: спутниковая связь для смартфонов. Регистрация на бета-тест открыта

Компания T-Mobile сообщила об открытии регистрации на бета-версию сервиса «T-Mobile Starlink», который позволит отправлять текстовые сообщения через спутники в мертвых зонах, не охваченных вышек сотовой связи. О том, что Федеральная комиссия по связи США разрешила SpaceX протестировать спутниковый интернет системы Starlink напрямую на смартфонах Хабр писал 27 ноября.