Главное о кейсе
Daisy — умный чат-бот от команды red_mad_robot. Работает на технологии ChatGPT, Speech KIT Recognition и Stable Diffusion. Бот умеет сочинять тексты, писать код, рерайтить SEО-статьи, делать лингвистические переводы, создавать краткие обобщения, создавать художественные изображения и решать задачи по различным дисциплинам. А ещё он понимает речь, поэтому с ним можно общаться голосом.
Результаты в цифрах:
- более 8000 уникальных пользователей;
- общее количество активных пользователей в неделю — 1 450 человек;
- в неделю бот отвечает более чем на 5000 сообщений.
Как проект изменил жизнь пользователей
Главная фишка Daisy — это доступная и лёгкая в использовании помощь в работе и рутине. Для решения рабочих задач ей могут пользоваться создатели контента, разработчики, дизайнеры, стартаперы и многие другие.
C помощью Daisy, например, можно написать функциональные требования и спецификации методов API и сэкономить на этом 30–50% времени. А ещё — построить UML-диаграммы и написать SQL-запросы. Кроме того, Daisy даёт советы по решению задач на Backend, резюмирует текст, составляет технические задания и ищет ошибки в коде.
Daisy понимает речь и умеет отвечать на вопросы голосом: для многих это удобно и экономит время, и, например, маленькие дети некоторых сотрудников red_mad_robot любят общаться с ней на разные познавательные темы.
Дизайн-команда red_mad_robot использует Daisy для генерации изображений: зачастую это различные элементы айдентики в стиле компании.
Для упрощения бытовых задач Daisy полезна всем: составить план поездки, распланировать встречи на неделю, перевести текст (сразу на десять языков) и многое другое.
Бизнес-задача и ее решение
Проект вырос из личной инициативы сотрудников red_mad_robot: ребята в свободное от задач время изучали новые технологии, чтобы решить бытовые сложности с доступом к AI-технологиям (необходимость в сильном VPN, трудности с оплатой с российских карт).
Также целью было создание доступного голосового помощника, который помог бы серьёзно повысить производительность сотрудников различных профессий.
Решение — чат-бот на основе технологий:
- GPT (LLM) — новейшее поколение AI для обработки естественного языка с улучшенной способностью к генерации текста.
- Stable Diffusion — технология улучшения алгоритмов синтеза изображений для повышения производительности дизайнеров в рутинных задачах.
- Voice2Text/Text2Voice — opensource технологии распознавания
и генерации голоса «под капотом».
В итоге у нас получилась Daisy: чат-бот, который воспринимает речь, сочиняет тексты, пишет код, делает лингвистические переводы, создаёт краткие обобщения, художественные изображения и решает задачи по различным дисциплинам. И всё это доступно в Telegram: с возможностью пользоваться ботом бесплатно, а также выбрать один из платных тарифов, подключив любую банковскую карту и автоплатёж.
Крафт (мастерство), реализация, технические детали
Как мы создавали Daisy:
- Проектирование и реализация архитектура сервиса.
Выстраивание межсервисного взаимодействия на основе webhook.
- Создание своего кластера генерации изображений в основу легли технологии трансформерных сетей и дообучение кастомных моделей onpremise сервера.
- Балансировка нагрузки RPM-сервисов.
- Создание своего кластера Voice2Text/Text2Voice onpremise сервера.
- Создание методов взаимодействия с WebApp (Telegram).
10+ GPU С суммарным объемом памяти 240GB + надёжные сервера.
Инсайты, гипотезы, процесс создания и взаимодействия с заказчиком
Первую версию мы написали с помощью ChatGPT: создали бота, позволяющего общаться с ChatGPT. На код, порождённый ИИ, без слёз взглянуть было сложно, поэтому первым делом ребята всё переписали до приличного состояния технической демо-версии. К ней же решили добавить и функцию создания изображений.
Изначально их генерировала DALLE-2, но итоговый результат устраивал не всегда. Поэтому в качестве челленджа ребята решили перейти на свободную Stable Diffusion — она даёт в разы больший простор для творчества. И именно эта технология сейчас генерирует картинки в Daisy.
Прочая информация о кейсе
Умная база знаний
Сейчас команда нового юнита red_mad_robot —
Neuraldeep.tech — работает над расширением возможностей Daisy для бизнеса. Мы видим массу преимуществ для компаний благодаря корпоративной Daisy и не только: создание кастомных векторных баз знаний, уменьшение расходов за счёт использования собственного контента, семантический анализ запросов.
Эти функции полезны разным областям бизнеса, например:
Туризм: помощь в выборе оптимальных путешествий и организации поездок.
Продажи: повышение уровня понимания потребностей клиентов для эффективных продаж.
Финтех, ритейл и другие сферы: более высококачественная поддержка клиентов благодаря оптимизации базы знаний.
Скриншоты