Documentation
О Dpunk
Платформа AI-дубляжа — многоголосый закадровый дубляж на GPU.
3Users
1Dubbed
12+Languages
500MB max
SpeechLab Engine
GPU-пайплайн на базе Whisper (ASR), LLM-перевода и Qwen3-TTS VoiceDesign. Одна задача на сервер — полная мощность GPU.
Multi-Speaker Casting
AI определяет спикеров через diarization и назначает уникальный голос каждому. Автоматически или через промпт.
Гибкая настройка
voice_gender, voice_age, voice_prompt, dub_volume_percent, original_audio_ratio — полный контроль через API и UI.
API Reference
Эндпоинты SpeechLab
GET
/health
Проверка сервера (без ключа)
200 OK
POST
/api/v1/dub
Создать задачу дубляжа
202 Accepted
GET
/api/v1/jobs
Список последних 50 задач
200 OK
GET
/api/v1/jobs/{id}
Статус задачи
200 OK
GET
/api/v1/jobs/{id}/download
Скачать MP4
200 OK
Architecture
Архитектура пайплайна
📹 Upload
→
🎙 Whisper ASR
→
👥 Diarization
→
🌐 LLM Translate
→
🔊 Qwen3-TTS
→
🎬 MP4 Export