VK Tech Talks
Вы приглашены на очередной митап от команды VK! Вечером 20 января разработчики расскажут о распознавании и расшифровке речи в голосовых сообщениях и видео.
1. Эволюция в расшифровке речи ВКонтакте: зачем, а главное, почему? - Иван Самсонов, продакт-менеджер из команды прикладных исследований ИИ, ВКонтакте
Какие технологические и продуктовые сложности преодолевали разработчики:
- как решали, что субтитры в видео необходимы;
- как меняли ASR ВКонтакте;
- что такое «речевой домен».
2. Распознавание речи для субтитров в VK Видео - Виталий Шутов, программист-разработчик из VK Видео
Как работает ASR внутри ВКонтакте и с какими проблемами столкнулись разработчики, адаптируя её для создания автосубтитров к записям любой длины.
3. Инфраструктура для автоматической генерации субтитров в VK Видео - Филипп Мальковский, разработчик из VK Видео
Как адаптировали существующий пайплайн по распознаванию речи ВКонтакте для работы в инфраструктуре VK Видео, внедряли новые компоненты и оптимизировали получившееся решение.