Коммерческое предложение: Цифровой библиотекарь | Alpina Digital для СберУниверситета

Для СберУниверситета

Цифровой библиотекарь Истра
с AI-аватаром

Интеллектуальный помощник для библиотеки СберУниверситета
на базе передовых технологий искусственного интеллекта

О проекте

Создание инновационного цифрового библиотекаря — AI-ассистента с реалистичным аватаром Истры, который поможет сотрудникам и студентам СберУниверситета быстро находить нужную литературу, получать персонализированные рекомендации и взаимодействовать с библиотечным фондом через естественный голосовой диалог.

Цель проекта

Повышение эффективности работы библиотеки и улучшение пользовательского опыта через внедрение ИИ технологий

База знаний

Интеграция с полным каталогом библиотеки СберУниверситета с векторным хранилищем для интеллектуального поиска

Технологии

D-ID/HeyGen для аватара, GPT-4/Claude/GigaChat для диалогов, DeepGram/Whisper для распознавания речи

Аудитория

Сотрудники и студенты СберУниверситета, посетители библиотеки, международные гости

Варианты реализации

РЕКОМЕНДУЕМ ДЛЯ СТАРТА

Вариант 1: MVP с готовыми технологиями

Быстрый запуск на проверенных облачных решениях с возможностью масштабирования

3 000 000 ₽

без НДС

Что входит в решение:

Интеграция платформы D-ID для создания реалистичного аватара из фотографии
Подключение GPT-5/Claude 4.1 Opus для интеллектуальных диалогов
Настройка векторного хранилища (Pinecone) для базы знаний библиотеки
Система распознавания речи DeepGram/Whisper
Синтез речи через ElevenLabs с интеграцией в D-ID
Веб-интерфейс для отображения на 55" экране
Промпт-инжиниринг против галлюцинаций модели
Система рекомендаций с аналитикой запросов
30 дней технической поддержки после запуска

Известные ограничения (решаем в следующих итерациях):

Возможны ошибки в произношении сложных фамилий авторов (особенно индийских)
Задержка ответа 6-8 секунд из-за облачного рендеринга
Аватар отображается по пояс (не полноростовой)
Отсутствие функции прерывания ответа
Поддержка только русского языка на первом этапе
Ошибки распознавания речи ~10% случаев

Техническая архитектура

Технологический стек:

Frontend: React-приложение, WebRTC для стриминга
Аватар: D-ID API для генерации видео
Speech-to-Text: DeepGram/Whisper API
LLM: Claude 4.1 Opus / GPT-5 через API
Text-to-Speech: ElevenLabs API
База знаний: Pinecone векторное хранилище
Backend: Node.js/Python FastAPI

Все компоненты работают через API в облаке, минимальные требования к локальной инфраструктуре

Вариант 2: Комплексное решение Pro

Полностью кастомизированная разработка с решением всех технических вызовов

8 000 000 ₽

без НДС

Преимущества расширенной версии:

Кастомная система распознавания речи с обучением на библиотечной лексике
Продвинутый синтез речи с правильными ударениями (наработки из проекта аудиокниг)
Мультиязычная поддержка (русский + английский + другие языки)
Интеллектуальная система определения говорящего в шумной среде
Возможность прерывания и управления диалогом
Снижение задержки ответа до 2-3 секунд (локальная инфраструктура)
3D-аватар в полный рост с расширенной анимацией
Глубокая интеграция с GigaChat и корпоративными системами Сбера
Локальное векторное хранилище в контуре Сбера
Точность распознавания речи >95%

Техническая архитектура

Технологический стек:

Инфраструктура: Серверы Сбера, локальное развертывание
3D-аватар: Кастомная разработка, Unreal Engine
Speech-to-Text: Кастомная модель на базе Whisper, обученная на домене
LLM: GigaChat + резервный GPT/Claude
Text-to-Speech: Кастомная модель с корректными ударениями
База знаний: Локальное RAG-решение на базе FAISS
Оркестрация: Kubernetes в контуре Сбера

Полностью локальное решение, максимальная скорость и безопасность

Вариант 3: Пилот → Полное решение

Поэтапная реализация: сначала MVP, затем доработка на основе опыта

3М + 3-4М ₽

без НДС (поэтапно)

Преимущества поэтапного подхода:

Этап 1: Запуск MVP за 3 млн руб (Вариант 1)
Сбор обратной связи и выявление реальных проблем
Этап 2: Целевые доработки критичных проблем (3-4 млн руб)
Экономия на решении только реально важных задач
Возможность остановиться на MVP, если качество устраивает
Итоговая стоимость ниже, чем Вариант 2

Оптимальная стратегия: Запускаем пилот → Тестируем 2-3 месяца → Определяем критичные проблемы → Решаем только то, что действительно важно

Вариант 4: Локальное решение на железе

Полностью автономное решение на локальном оборудовании без облака

~10-12М ₽

без НДС + оборудование

Особенности локального решения:

Серверная стойка с GPU для инференса моделей (A100/H100)
Локальная LLM (уменьшенная версия, ограниченные возможности)
Полная автономность от интернета
Минимальная задержка (~1-2 сек)
Высокая стоимость железа (импорт GPU)
Сложность обслуживания и обновления

Требуется серверная комната (не поместится за стойкой)
Необходимо закупить GPU (сложности с импортом)
Ограниченные возможности локальных LLM vs облачных
Высокие эксплуатационные расходы

Вариант 5: Только видео-сервис

Мы предоставляем API для генерации видео, вы разрабатываете backend

900 000 ₽

без НДС

Что включено:

API для генерации видео с аватаром
Вход: текст для озвучивания
Выход: видеопоток с говорящим аватаром
Техническая документация и примеры
Базовая техподдержка

Вся логика работы с книгами, распознавание речи и LLM — на стороне Сбера

Путь развития решения

Рекомендуемая стратегия поэтапного внедрения и улучшения системы

MVP запуск

3 млн ₽
10 недель

Пилотирование

2-3 месяца
Сбор метрик

Анализ проблем

Приоритизация
доработок

Доработка

3-4 млн ₽
2-3 месяца

Pro версия

Полнофункциональное
решение

Инновационные возможности

Интеллектуальная подсветка полок

Революционная система навигации по библиотеке с автоматической подсветкой нужных полок

RFID-метки на книгах для точного позиционирования
LED-подсветка полок, синхронизированная с рекомендациями
Визуальная навигация к нужной книге
Автоматическая инвентаризация фонда

Стоимость системы: от 1 500 000 ₽ (зависит от количества полок)
Включает RFID-считыватели, LED-ленты, контроллеры и интеграцию

Этапы реализации проекта

Анализ и проектирование

2 недели

Разработка прототипа

4 недели

Тестирование и доработка

3 недели

Запуск и поддержка

1 неделя + 30 дней

Общий срок реализации: 10 недель для Варианта 1 (MVP)
Вариант 2: 16-20 недель | Вариант 3: 10 недель + 8-10 недель на доработки

Дополнительные услуги

Создание 3D-аватара в полный рост

Разработка полноростового 3D-аватара Истры с расширенной анимацией, жестикуляцией и мимикой

от 1 500 000 ₽

Интеграция с GigaChat

Подключение и настройка работы с языковой моделью GigaChat от Сбера (требует API-моста)

от 500 000 ₽

Мультиязычная поддержка

Добавление поддержки английского и других языков для международных гостей

от 800 000 ₽

Система подсветки полок

RFID-метки + LED-подсветка для визуальной навигации к рекомендованным книгам

от 1 500 000 ₽

Итоговое предложение

Разработка MVP (Вариант 1)

3 000 000 ₽

Оборудование

350 000 ₽

Итого к оплате

3 350 000 ₽

Все цены указаны без учета НДС • Возможна поэтапная оплата • Специальные условия для долгосрочного сотрудничества

Специальный бонус

3 месяца бесплатного доступа к платформе AlpinaGPT
25+ AI-моделей для работы библиотеки и СберУниверситета:
GPT-5, Claude 4.1 Opus, Midjourney, FLUX, HeyGen и другие инструменты.
Платформа включает готовых библиотекарей-ассистентов и возможность создания агентов.

Готовы обсудить проект?

Мы открыты для вопросов и готовы адаптировать решение под ваши задачи

Ольга Староста

Директор по продажам B2B

o.starosta@alpinadigital.ru

+7 915 211 73 75

Жемал Хамидун

CPO Alpina Digital

j.hamidun@alpinadigital.ru

+7 960 712 25 72

Telegram: @JHamidun

Егор Задворнов

Founder AI Avatars

Партнер Студия разработки МФТИ

Эксперт по AI и аватарам

Инна Соина

Руководитель отдела консалтинга

i.soina@alpinadigital.ru

+7 915 181 86 06

Цифровой библиотекарь Истра
с AI-аватаром

О проекте

Цель проекта

База знаний

Технологии

Аудитория

Варианты реализации

Что входит в решение:

Известные ограничения (решаем в следующих итерациях):

Технологический стек:

Преимущества расширенной версии:

Технологический стек:

Преимущества поэтапного подхода:

Особенности локального решения:

Что включено:

Путь развития решения

Инновационные возможности

Интеллектуальная подсветка полок

Рекомендуемое оборудование

Ростовой экран

Профессиональный микрофон

Акустическая система

Этапы реализации проекта

Дополнительные услуги

Создание 3D-аватара в полный рост

Интеграция с GigaChat

Мультиязычная поддержка

Система подсветки полок

Итоговое предложение

Специальный бонус

Готовы обсудить проект?

Ольга Староста

Жемал Хамидун

Егор Задворнов

Инна Соина

Доступ к документу

Цифровой библиотекарь Истрас AI-аватаром

О проекте

Цель проекта

База знаний

Технологии

Аудитория

Варианты реализации

Что входит в решение:

Известные ограничения (решаем в следующих итерациях):

Технологический стек:

Преимущества расширенной версии:

Технологический стек:

Преимущества поэтапного подхода:

Особенности локального решения:

Что включено:

Путь развития решения

Инновационные возможности

Интеллектуальная подсветка полок

Рекомендуемое оборудование

Ростовой экран

Профессиональный микрофон

Акустическая система

Этапы реализации проекта

Дополнительные услуги

Создание 3D-аватара в полный рост

Интеграция с GigaChat

Мультиязычная поддержка

Система подсветки полок

Итоговое предложение

Специальный бонус

Готовы обсудить проект?

Ольга Староста

Жемал Хамидун

Егор Задворнов

Инна Соина

Цифровой библиотекарь Истра
с AI-аватаром