Chandra от Datalab — OCR, который действительно понимает документы

Забудьте всё, что вы знали о распознавании текста. Команда Datalab представила Chandra — современную, точную и умную OCR-модель, которая превращает сканы PDF, фото и сложные макеты в аккуратные текстовые документы. И не просто в «сырой» текст, а в структурированный HTML, Markdown или JSON — с сохранением таблиц, формул, колонок, подписей, чекбоксов и даже рукописных заметок.

Вот что делает Chandra особенной:

  • Понимает сложные структуры: таблицы, математические формулы, бланки, схемы — всё остаётся на своих местах.
  • Поддерживает более 40 языков, включая русский, китайский, арабский и другие.
  • Бьёт конкурентов в бенчмарках: обходит DeepSeek, Mistral, Gemini и многих других по точности распознавания.
  • Работает и онлайн, и офлайн: используйте удобный веб-плеер или установите локально — ваши данные никуда не уходят.
  • Совершенно бесплатно для личного использования и стартапов.

Хотите попробовать прямо сейчас?
Запустить онлайн в браузере
Установить локально с GitHub

Chandra — не просто распознавание. Это восстановление смысла документа.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *