Microsoft пока не сообщает, когда OCR будет доступен за пределами программы Insider.
Поддержка OCR доступна в «Ножницах» в Windows 11 через кнопку панели инструментов «Копировать весь текст» и сочетания клавиш Ctrl + A и Ctrl + C.
А осенью 2024 года состоялся релиз открытой системы распознавания текста Tesseract 5.5.0. Проект поддерживает Unicode и работает с более чем 100 языками. Итоговый результат распознавания может сохраняться как открытым текстом, так и в форматах HTML (hOCR), ALTO (XML), PDF и TSV. Исходный код проекта написан на языке C++ и опубликован на GitHub под лицензией Apache 2.0.
Обсудить