SmolDocling: Новый Открытый Модель OCR для Эффективной Обработки Документов от IBM и Hugging Face

Преобразование документов в структурированные данные

Преобразование сложных документов в структурированные данные долгое время было значительной проблемой в области компьютерных наук. Традиционные подходы, такие как ансамблевые системы или крупные модели, часто сталкиваются с трудностями, такими как сложность тонкой настройки, проблемы с обобщением и высокие вычислительные затраты.

Решение от IBM и Hugging Face

Исследователи из IBM и Hugging Face представили SmolDocling — 256-миллионную открытую модель, предназначенную для многомодальных задач преобразования документов. SmolDocling обрабатывает целые страницы через одну модель, что значительно упрощает процесс и снижает вычислительные затраты.

Преимущества SmolDocling

SmolDocling использует компактную архитектуру SmolVLM-256M, что позволяет значительно снизить вычислительную сложность. Основное преимущество модели заключается в формате DocTags, который четко разделяет элементы документа, текстовое содержание и визуальную информацию.

Эффективность и производительность

SmolDocling демонстрирует высокую производительность в тестах на преобразование документов, превосходя более крупные модели. Например, в задачах OCR SmolDocling достигла низкой редакционной дистанции и высокой оценки F1, что подтверждает ее эффективность.

Широкие возможности применения

SmolDocling может обрабатывать разнообразные элементы документов, включая коды, графики и уравнения, что делает ее полезной для научных статей, патентов и бизнес-документации. Формат DocTags устраняет неоднозначности, улучшая удобство использования преобразованных документов.

Заключение

SmolDocling представляет собой значительный прорыв в технологии преобразования документов, показывая, что компактные модели могут не только конкурировать, но и превосходить более крупные модели в ключевых задачах. Это открывает новые возможности для применения ИИ в бизнесе.

Практические рекомендации

Изучите, как технологии искусственного интеллекта могут изменить ваш подход к работе. Найдите процессы, которые можно автоматизировать, и определите ключевые показатели эффективности для оценки влияния ИИ на бизнес.

Начните с небольшого проекта, собирайте данные о его эффективности и постепенно расширяйте использование ИИ в вашей работе. Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru.

Подпишитесь на наш Telegram, чтобы быть в курсе последних новостей ИИ: https://t.me/itinai.

Посмотрите пример решения на базе ИИ: продажный бот, который автоматизирует взаимодействие с клиентами и управляет процессами на всех этапах пути клиента.


Новости в сфере искусственного интеллекта