ИИ для работы с документами: как мы заменили ручной перенос данных на ИИ-конвейер и ускорили разработку с помощью генерации кода

Заказчик: NDA

Исполнитель: ItFox

itfox-web.ru

ИИ для работы с документами: как мы заменили ручной перенос данных на ИИ-конвейер и ускорили разработку с помощью генерации кода

Главное о кейсе

Российская строительная компания из Москвы, работающая на рынке промышленного и гражданского строительства РФ, ежемесячно обрабатывает сотни смет и спецификаций от десятков подрядчиков со всей страны и из-за рубежа. Документы приходят на русском и английском языках в хаотичных форматах: небрежные сканы, фотографии, таблицы с разной структурой и названиями колонок. Сотрудники часами вручную переписывали каждую позицию в корпоративную таблицу.
Мы построили ИИ-конвейер, который за минуты превращает фото спецификации в готовый Excel с возможностью точечной корректировки. Начали с прототипа, чтобы проверить ключевую механику распознавания и собрать обратную связь. Поскольку на этом этапе не было жёстких требований к интерфейсу, фронтенд построили с помощью генерации кода — это позволило реализовать весь проект силами одного разработчика.
Стек: Python, FastAPI, OpenCV, EasyOCR, LangChain, YandexGPT, GigaChat, Flutter.

Как проект изменил жизнь пользователей

Раньше: сотрудник открывает скан, вглядывается в цифры, переписывает строку за строкой в Excel. Один документ — час работы. Монотонно, выматывающе, с риском ошибки.
Теперь: загрузил фото — получил готовую таблицу. Просмотрел, поправил неточности за пару кликов, выгрузил. Документ, на который уходил час, обрабатывается за несколько минут. Анализ системы управления документами показал: время сократилось в 5–7 раз.
Московский заказчик, годами делавший это руками, был готов к 30% точности — мы превзошли этот порог. Люди перестали бояться входящих спецификаций.

Бизнес-задача и ее решение

Задача: исключить ручной перенос данных из нестандартизированных документов в корпоративный формат. Нужен был корпоративный ИИ для бизнеса, адаптированный под российский рынок и мультиязычную документацию, который сам распознаёт сканы, понимает содержимое и выдаёт готовый Excel.
Сложность: на старте мы выявили нюанс, который не был очевиден. Предполагалось, что входные данные — PDF с текстовым слоем. По факту — «мёртвые» сканы, просто картинки без возможности копирования. Это меняло архитектуру: требовалось не извлечение текста, а полноценное компьютерное зрение. Мы проверили платный аналог за 20 $/мес: таблицу отрисовывал, но ошибался в цифрах и названиях. Для российского бизнеса, где ошибка грозит срывом сроков и финансовыми потерями, это не годилось. Требовалась автоматизация проверки документов на всех этапах.
С чего мы начали: мы решили строить не готовый продукт сразу, а прототип — проверить ключевую механику распознавания и сопоставления, показать заказчику работающий конвейер и собрать обратную связь. Никаких жёстких требований к дизайну, удобству интерфейса и масштабируемости на этом этапе не было — только точность распознавания и корректность выгрузки. Такой подход позволял двигаться быстро и не перегружать первый этап лишними трудозатратами.
Решение: поэтапный конвейер с обязательной верификацией.
1. Компьютерное зрение находит таблицу на картинке и извлекает сырой текст.
2. Нейросеть сопоставляет колонки по смыслу: «Масса единицы» → «Вес изделия», «Труба ДН677 600» → разделяет на «Наименование» и «Техническую характеристику».
3. Пользователь проверяет результат на промежуточном экране и точечно правит ошибки.
Готовый Excel выгружается в едином корпоративном формате.

Крафт (мастерство), реализация, технические детали

Нейросеть получает две сущности: список колонок из входящего документа и список колонок целевой таблицы заказчика. Задача — найти смысловые соответствия. «Масса единицы» у поставщика — это «Вес изделия» у заказчика. «Труба ДН677 600» — это не одна колонка, а две: наименование и техническая характеристика. Нейросеть сама разделяет такие данные и распределяет по нужным полям, в том числе в международных документах, где терминология может отличаться. Оркестрация — через LangChain, модели — ЯндексGPT и GigaChat.
Этап 3. Страховочный пояс: верификация
Мы не обещаем 100% точности — это технологически невозможно, и ни один зрелый сервис таких гарантий не даёт. Вместо этого мы встроили в архитектуру промежуточный экран, где пользователь видит распознанное, сверяет с исходной картинкой и поправляет ошибки за секунды. Автоматизация проверки документов — не заплатка, а часть архитектуры, которая обеспечивает гарантированно корректный финальный результат.
Генерация кода как инженерный инструмент
Поскольку на этапе прототипа не требовалась глубокая фронтенд-проработка, мы использовали генерацию кода для создания интерфейса на Flutter. Разработчик описывал желаемый UI, ИИ генерировал код, который затем проходил ревью и дорабатывался. Это позволило реализовать весь проект силами одного специалиста и кратно сократить время прототипирования: интерфейс, достаточный для демонстрации заказчику и сбора обратной связи, был собран за часы.
При этом мы отдаём себе отчёт в ограничениях: ИИ дописывает новый код поверх старого, не удаляя неиспользуемое. Кодовая база быстро распухает. Без профильной экспертизы разработчик не может оценить качество и заметить неоптимальности. Поэтому для перехода от прототипа к стабильному, готовому к эксплуатации продукту сгенерированный код должен проходить профессиональное ревью — это наше принципиальное требование к качеству.

Инсайты, гипотезы, процесс создания и взаимодействия с заказчиком

Глубже, чем ожидалось. На старте мы не просто приняли задачу — мы провели аудит входящей документации и выявили, что реальный формат данных отличается от заявленного. Думали, что работать с PDF легко — там есть текстовый слой. Оказалось, заказчик использует сканы без него. Буквы и цифры — просто цветные точки. Задача из рутинной превратилась в исследовательскую: нужно не «прочитать», а «увидеть» и «понять». Это позволило сразу заложить правильную архитектуру, а не перестраиваться на ходу.
Платный аналог не прошёл проверку. Мы не просто взялись строить своё — мы проверили существующие решения. Сервис за 20 $/мес неплохо отрисовывал границы таблиц, но ошибался в содержании — пропускал цифры, путал надписи. Для процессов, где цена ошибки высока, это было неприемлемо. Решение строить свой конвейер было не амбицией, а результатом анализа.
Прототип как осознанная стратегия. Мы не пытались сделать готовый продукт с первого захода. Сфокусировались на ключевой механике — точности распознавания и сопоставления. Отсутствие жёстких требований к интерфейсу позволило использовать генерацию кода и собрать фронтенд за часы. Это дало возможность быстро показать результат заказчику и получить обратную связь.
Реакция заказчика. Московский заказчик, годами делавший это руками, был готов, что машина осилит хотя бы 30% — и уже это сэкономило бы время. Фактическая точность оказалась значительно выше. Главное, что увидел заказчик: процесс меняется качественно. Не «быстрее переписывать», а «загрузить, проверить, выгрузить».
Перспективы. Конвейер не привязан к стройке. Та же задача — нестандартизированные документы от разных контрагентов, которые нужно приводить к единому формату, — есть в логистике, гостиничном бизнесе, финансах. Масштабирование корпоративного ИИ для бизнеса на другие индустрии и международные рынки — вопрос адаптации нейросетевого слоя под новую доменную модель.

Скриншоты

Дата запуска

1 июня 2026 года

Авторы

Станислава Богданова - маркетолог

Ссылки

itfox-web.ru