Наши кейсы - Voice2Text AI
Преобразование голоса в текст с нулевым риском утечек и автоматизированной суммаризацией важных деталей — ключевая потребность организаций.
- Клиент
- NDA
- Год реализации
- Категория
- AI Работа с голосом

Обзор кейса.
Компания - заказчик имела задачу — автоматизировать транскрибацию голосовых сообщений на внутренней инфраструктуре, чтобы соблюсти требования безопасности и конфиденциальности. Важно было не только преобразовывать речь в текст, но и структурировать её, а также обезличивать данные, чтобы минимизировать риски утечек личной информации.
Мы разработали систему Voice2Text AI, которая позволяет безопасно транскрибировать голосовые данные и структурировать их в отчёты с помощью ИИ.
Система использует:
- Vosk — для преобразования аудио в текст.
- Gemini и GPT — для извлечения контекста, организации данных и генерации структурированных документов.
- Обезличивание — с помощью технологий аннотирования и удаления идентифицирующих данных.
В результате клиент получил решение, которое:
- автоматизирует процесс транскрибации,
- поддерживает полное обезличивание аудиофайлов и текста,
- структурирует данные для дальнейшей работы, без риска утечек.
Стек технологий.
- Python
- Vosk
- Gemini
- ChatGPT
- Беопасности благодаря предобработке
- 99+%
- времени на обработка аудиофайлов
- -90%
- к качеству обработки отчетов
- +50%