- Сообщения
- 222
- Реакции
- 3
- Баллы
- 0
Простой сервис с 73 млн параметров распознавания речи и генерацией временных меток. Поддерживается 100 языков.
Процесс транскрибации выполняется локально в браузере с помощью Transformers.js и ONNX Runtime Web, никаких API-вызовов на сервер. Можно использовать сервис без интернета.
Чтобы получить текст с видео/аудио, нужно просто загрузить в поле Input audio/video. Перед этим нужно скачать модель, нажав на Load Model.
Просмотр скрытого контента доступен только зарегистрированным пользователям!