Издательская группа «Альпина»
AI-решения для бизнеса
Совместно со студией разработки МФТИ
12 августа 2025
КП №2025-08-SBER-DL-v2
Для СберУниверситета

Цифровой библиотекарь Истра
с AI-аватаром

Интеллектуальный помощник для библиотеки СберУниверситета
на базе передовых технологий искусственного интеллекта

О проекте

Создание инновационного цифрового библиотекаря — AI-ассистента с реалистичным аватаром Истры, который поможет сотрудникам и студентам СберУниверситета быстро находить нужную литературу, получать персонализированные рекомендации и взаимодействовать с библиотечным фондом через естественный голосовой диалог.

Цель проекта

Повышение эффективности работы библиотеки и улучшение пользовательского опыта через внедрение ИИ технологий

База знаний

Интеграция с полным каталогом библиотеки СберУниверситета с векторным хранилищем для интеллектуального поиска

Технологии

D-ID/HeyGen для аватара, GPT-4/Claude/GigaChat для диалогов, DeepGram/Whisper для распознавания речи

Аудитория

Сотрудники и студенты СберУниверситета, посетители библиотеки, международные гости

Варианты реализации

Вариант 2: Комплексное решение Pro

Полностью кастомизированная разработка с решением всех технических вызовов

8 000 000 ₽
без НДС

Преимущества расширенной версии:

  • Кастомная система распознавания речи с обучением на библиотечной лексике
  • Продвинутый синтез речи с правильными ударениями (наработки из проекта аудиокниг)
  • Мультиязычная поддержка (русский + английский + другие языки)
  • Интеллектуальная система определения говорящего в шумной среде
  • Возможность прерывания и управления диалогом
  • Снижение задержки ответа до 2-3 секунд (локальная инфраструктура)
  • 3D-аватар в полный рост с расширенной анимацией
  • Глубокая интеграция с GigaChat и корпоративными системами Сбера
  • Локальное векторное хранилище в контуре Сбера
  • Точность распознавания речи >95%
Техническая архитектура

Технологический стек:

  • Инфраструктура: Серверы Сбера, локальное развертывание
  • 3D-аватар: Кастомная разработка, Unreal Engine
  • Speech-to-Text: Кастомная модель на базе Whisper, обученная на домене
  • LLM: GigaChat + резервный GPT/Claude
  • Text-to-Speech: Кастомная модель с корректными ударениями
  • База знаний: Локальное RAG-решение на базе FAISS
  • Оркестрация: Kubernetes в контуре Сбера

Полностью локальное решение, максимальная скорость и безопасность

Вариант 3: Пилот → Полное решение

Поэтапная реализация: сначала MVP, затем доработка на основе опыта

3М + 3-4М ₽
без НДС (поэтапно)

Преимущества поэтапного подхода:

  • Этап 1: Запуск MVP за 3 млн руб (Вариант 1)
  • Сбор обратной связи и выявление реальных проблем
  • Этап 2: Целевые доработки критичных проблем (3-4 млн руб)
  • Экономия на решении только реально важных задач
  • Возможность остановиться на MVP, если качество устраивает
  • Итоговая стоимость ниже, чем Вариант 2

Оптимальная стратегия: Запускаем пилот → Тестируем 2-3 месяца → Определяем критичные проблемы → Решаем только то, что действительно важно

Вариант 4: Локальное решение на железе

Полностью автономное решение на локальном оборудовании без облака

~10-12М ₽
без НДС + оборудование

Особенности локального решения:

  • Серверная стойка с GPU для инференса моделей (A100/H100)
  • Локальная LLM (уменьшенная версия, ограниченные возможности)
  • Полная автономность от интернета
  • Минимальная задержка (~1-2 сек)
  • Высокая стоимость железа (импорт GPU)
  • Сложность обслуживания и обновления
  • Требуется серверная комната (не поместится за стойкой)
  • Необходимо закупить GPU (сложности с импортом)
  • Ограниченные возможности локальных LLM vs облачных
  • Высокие эксплуатационные расходы
Вариант 5: Только видео-сервис

Мы предоставляем API для генерации видео, вы разрабатываете backend

900 000 ₽
без НДС

Что включено:

  • API для генерации видео с аватаром
  • Вход: текст для озвучивания
  • Выход: видеопоток с говорящим аватаром
  • Техническая документация и примеры
  • Базовая техподдержка

Вся логика работы с книгами, распознавание речи и LLM — на стороне Сбера

Путь развития решения

Рекомендуемая стратегия поэтапного внедрения и улучшения системы

MVP запуск
3 млн ₽
10 недель
Пилотирование
2-3 месяца
Сбор метрик
Анализ проблем
Приоритизация
доработок
Доработка
3-4 млн ₽
2-3 месяца
Pro версия
Полнофункциональное
решение

Инновационные возможности

Интеллектуальная подсветка полок

Революционная система навигации по библиотеке с автоматической подсветкой нужных полок

  • RFID-метки на книгах для точного позиционирования
  • LED-подсветка полок, синхронизированная с рекомендациями
  • Визуальная навигация к нужной книге
  • Автоматическая инвентаризация фонда
Стоимость системы: от 1 500 000 ₽ (зависит от количества полок)
Включает RFID-считыватели, LED-ленты, контроллеры и интеграцию

Рекомендуемое оборудование

Профессиональное оборудование для оптимальной работы цифрового библиотекаря

Ростовой экран

55" 4K дисплей
на мобильной стойке
Вертикальная ориентация

180 000 ₽

Профессиональный микрофон

Суперкардиоидный
с шумоподавлением
Направленный паттерн

120 000 ₽

Акустическая система

Направленные динамики
для чистого звука
Без эха

50 000 ₽

Общая стоимость оборудования: 350 000 ₽

Этапы реализации проекта

1
Анализ и проектирование
2 недели
2
Разработка прототипа
4 недели
3
Тестирование и доработка
3 недели
4
Запуск и поддержка
1 неделя + 30 дней

Общий срок реализации: 10 недель для Варианта 1 (MVP)
Вариант 2: 16-20 недель | Вариант 3: 10 недель + 8-10 недель на доработки

Дополнительные услуги

Создание 3D-аватара в полный рост

Разработка полноростового 3D-аватара Истры с расширенной анимацией, жестикуляцией и мимикой

от 1 500 000 ₽

Интеграция с GigaChat

Подключение и настройка работы с языковой моделью GigaChat от Сбера (требует API-моста)

от 500 000 ₽

Мультиязычная поддержка

Добавление поддержки английского и других языков для международных гостей

от 800 000 ₽

Система подсветки полок

RFID-метки + LED-подсветка для визуальной навигации к рекомендованным книгам

от 1 500 000 ₽

Итоговое предложение

Разработка MVP (Вариант 1)
3 000 000 ₽
Оборудование
350 000 ₽
Итого к оплате
3 350 000 ₽

Все цены указаны без учета НДС • Возможна поэтапная оплата • Специальные условия для долгосрочного сотрудничества

Специальный бонус

3 месяца бесплатного доступа к платформе AlpinaGPT
25+ AI-моделей для работы библиотеки и СберУниверситета:
GPT-5, Claude 4.1 Opus, Midjourney, FLUX, HeyGen и другие инструменты.
Платформа включает готовых библиотекарей-ассистентов и возможность создания агентов.

Готовы обсудить проект?

Мы открыты для вопросов и готовы адаптировать решение под ваши задачи

Ольга Староста

Директор по продажам B2B

o.starosta@alpinadigital.ru

+7 915 211 73 75

Жемал Хамидун

CPO Alpina Digital

j.hamidun@alpinadigital.ru

+7 960 712 25 72

Telegram: @JHamidun

Егор Задворнов

Founder AI Avatars

Партнер Студия разработки МФТИ

Эксперт по AI и аватарам

Инна Соина

Руководитель отдела консалтинга

i.soina@alpinadigital.ru

+7 915 181 86 06