Главное о кейсе
Команда книги билайн первой в индустрии сформулировала задачу — научить AI работать с литературными текстами не по ключевым словам, а по смыслу. Для этого нужно было не просто применить готовые модели, а выстроить инфраструктуру, которая сможет анализировать метаданные и контент более чем 500 тыс. книг: авторов, жанры, аннотации и описания.
Чтобы превратить идею в рабочее решение, к проекту подключилась компания red_mad_robot в качестве технологического партнёра. Мы взяли на себя архитектуру, обработку данных и разработку гибридного поиска на основе LLM и векторной базы.
Всё началось с внутреннего исследования, которое провела команда книги билайн. Оно показало, что 54% пользователей затрудняются выбрать книгу, если у них нет конкретного названия на уме. При этом большинство формулируют запросы через ощущения («лёгкое чтиво на вечер», «история о сильной женщине», «нуарный детектив с харизматичным главным героем»). На основе этих инсайтов родилась гипотеза: если научить AI понимать такие запросы, можно упростить поиск и повысить вовлечённость читателей.
Команда red_mad_robot подключилась, чтобы превратить эту идею в технологию: мы векторизовали метаданные полумиллиона книг, обучили LLM и собрали гибридную систему, которая подбирает литературу по смыслу и контексту — даже если запрос звучит просто как «что-нибудь про путешествия во времени». Наша задача — построить систему AI-поиска, способную обрабатывать смысловые запросы и сопоставлять их с каталогом, где каждое произведение описано в десятках параметров.
Как проект изменил жизнь пользователей
AI-поиск сократил путь пользователя от запроса до подходящей книги и одновременно повысил эффективность самого сервиса. Через полгода после запуска:
x10 рост MAU — ежемесячной аудитории сервиса;
+11% к ARPU — средней выручке на пользователя;
+23% к оборачиваемости каталога — теперь каждое четвёртое произведение попадает в поисковую выдачу и читательский поток;
x4 рост LT — среднего срока подписки клиента.
Уже в первый месяц после запуска сервис получил 1,1 млн просмотров страниц поиска и 520 тыс. уникальных пользователей — фактически охватив весь активный рынок цифрового чтения. Рост числа подписок и глубины взаимодействия показал, что пользователи быстро адаптировались к новому формату поиска.
Сервис помогает тем, кто ищет произведения по настроению, стилю, атмосфере или персонажам, находить книги, которые точно соответствуют эмоциональному и смысловому запросу, будь то «мрачный скандинавский детектив с харизматичным злодеем» или «про любовь, но без клише».
Бизнес-задача и ее решение
Бизнес-задача:
Рынок цифровых книг устроен довольно однотипно: у большинства сервисов схожие каталоги и базовый набор функций — чтение, прослушивание, синхронизация между устройствами. В таких условиях внимание пользователя становится главным конкурентным преимуществом.
Мы поставили перед собой задачу создать первую в России гибридную AI-систему смыслового поиска книг, которая превращает эмоции, настроение и абстрактные ожидания читателя в точные рекомендации. Наша цель — рост числа подписок и глубины взаимодействия.
Решение:
За два месяца нужно было разработать систему AI-поиска, которая позволяла бы пользователям находить книги по свободному описанию — без точного указания автора или названия.
Ключевые этапы работы:
структурировать и очистить метаданные более 500 тыс. книг;
загрузить их в векторную базу данных;
настроить взаимодействие с LLM для обработки смысловых запросов и безопасной выдачи;
разработать интерфейс, в котором результаты поиска будут понятны и визуально упорядочены.
На момент старта проекта ни один книжный сервис не позволял искать литературу по абстрактным или эмоциональным описаниям. Чтобы это реализовать, мы создали гибридную архитектуру поиска, в которой сочетаются классический NLP, векторный анализ и LLM. Такая комбинация позволила системе не просто сопоставлять ключевые слова, а интерпретировать смысл запроса и подбирать книги по содержанию, стилю и тематике.
Крафт (мастерство), реализация, технические детали
Люди описывают книги через эмоции и ассоциации и хотят, чтобы их понимали («что-то как Сумерки, но менее наивное»). Подобное описание нельзя напрямую связать с метаданными — автором, жанром или аннотацией.
Чтобы перевести такие человеческие запросы на язык машин, нужно было научить модель распознавать смысловые паттерны, а не только ключевые слова. Мы проанализировали, какие характеристики текста лучше отражают атмосферу — от тематики и динамики сюжета до типа персонажей. Параллельно пришлось решить и неожиданные задачи: например, цензурные фильтры LLM блокировали ответы на запросы, связанные с преступлениями или романтическими сценами — хотя без них невозможен ни один детектив.
В процессе стало понятно: создание AI-поиска для книг — это не просто про технологии, а про понимание контекста и культуры чтения. Чтобы вывести продукт на рынок первыми, нужно было не только разработать архитектуру, но и быстро адаптировать модель под особенности литературных данных.
Достижения стали возможны благодаря:
гибридной архитектуре, объединяющей LLM, векторный поиск и классический NLP;
специализированной обработке миллионов неструктурированных данных о книгах;
системе контроля галлюцинаций, построенной на реальных кейсах;
тесной синергии бизнес-команды книги билайн и технологического партнёра red_mad_robot, которая объединила продуктовую стратегию и техническую экспертизу.
Решение меняет саму природу взаимодействия с библиотекой: пользователи находят книги «по смыслу», открывают новых авторов и жанры, превращая цифровой каталог в «умного читателя», который понимает атмосферу, сюжет и глубинный смысл текста.
Инсайты, гипотезы, процесс создания и взаимодействия с заказчиком
Инсайты
Команда книги билайн задумалась, как сделать процесс выбора книги интуитивным и «живым». В ходе пользовательских интервью они заметили закономерность: читатели чаще описывают, что хотят прочитать, не через названия или авторов, а через настроение и атмосферу. На этом наблюдении построили гипотезу — если AI сможет распознавать такие запросы, то поиск станет по-настоящему персонализированным.
Кроме того, анализ пользовательского поведения показал структурную проблему самого рынка. У любого книжного сервиса есть условное разделение аудитории: небольшая группа «профессиональных» читателей с продуманным списком литературы и большинство пользователей, которые открывают приложение без чёткого запроса. Они не знают, что хотят прочитать сегодня, и ориентируются на рекомендации или обложки.
При этом каталоги цифровых библиотек насчитывают сотни тысяч произведений, а интерфейс может показать пользователю лишь несколько десятков. В итоге на виду оказываются самые популярные книги, а остальная часть контента остаётся «под водой». Это создаёт две задачи:
— как раскрыть весь потенциал каталога, если пользователь видит только его верхушку;
— и как удержать интерес аудитории, предлагая релевантные, но неочевидные книги.
Так сформировалась идея AI-поиска по смыслу — технологии, которая могла бы связать читательские ожидания с реальным контентом.
Во время тестирования мы обнаружили, что поиск по аннотациям не даёт точных результатов: в большинстве случаев аннотация — это маркетинговое описание, а не отражение содержания. Поэтому для следующей версии сервиса мы с командой билайна исследуем переход на анализ логлайна — краткого, но строго структурированного описания книги, включающего место действия, персонажей и основную фабулу. Это позволит повысить точность смыслового поиска и улучшить рекомендации.
Решение, созданное совместно с командой книги билайн, стало первым примером гибридного AI-поиска, в котором нейросеть и семантический поиск работают параллельно. Система не ограничивается поиском по ключевым словам: она анализирует смысл запроса и сопоставляет его с характеристиками произведений — жанром, темой, стилем и эмоциональной тональностью.
Использование весовых коэффициентов позволило улучшить ранжирование результатов и повысить точность выдачи.
Партнерство:
Для реализации замысла билайн искал партнёра с сильной экспертизой в прикладном AI. Команда red_mad_robot подключилась, чтобы построить технологическую платформу, способную работать с миллионами неструктурированных литературных данных и обеспечивать точные смысловые рекомендации.
AI-поиск стал результатом совместной работы двух команд: книги билайн сформулировали идею и продуктовое направление, а red_mad_robot реализовал технологическую часть и архитектуру, позволившую масштабировать решение. Этот проект — отличный пример синергии классических цифровых технологий — в частности, полнотекстового поиска — и современных AI-подходов.
Скриншоты
Комментарий заказчика
«Мы хотели научить AI понимать книги — не просто искать по словам, а видеть смысл. Год искали партнёра, кто способен реализовать такую идею, и в red_mad_robot нашли ту самую команду, которая не боится идти в неизведанное. Оказалось, что структурировать книги гораздо сложнее, чем, скажем, музыку. Даже если решить проблему с векторизацией огромного массива литературных данных, никто не застрахован от галлюцинаций LLM. У нас было много смешных кейсов, например, когда модель сочинила новую историю про Колобка вместо поиска реальной сказки, причём подмену заметили далеко не сразу».