О Dpunk

Платформа AI-дубляжа — многоголосый закадровый дубляж на GPU.

3Users
1Dubbed
12+Languages
500MB max

SpeechLab Engine

GPU-пайплайн на базе Whisper (ASR), LLM-перевода и Qwen3-TTS VoiceDesign. Одна задача на сервер — полная мощность GPU.

🎭

Multi-Speaker Casting

AI определяет спикеров через diarization и назначает уникальный голос каждому. Автоматически или через промпт.

🔧

Гибкая настройка

voice_gender, voice_age, voice_prompt, dub_volume_percent, original_audio_ratio — полный контроль через API и UI.

Эндпоинты SpeechLab

GET /health Проверка сервера (без ключа) 200 OK
POST /api/v1/dub Создать задачу дубляжа 202 Accepted
GET /api/v1/jobs Список последних 50 задач 200 OK
GET /api/v1/jobs/{id} Статус задачи 200 OK
GET /api/v1/jobs/{id}/download Скачать MP4 200 OK

Архитектура пайплайна

📹 Upload
🎙 Whisper ASR
👥 Diarization
🌐 LLM Translate
🔊 Qwen3-TTS
🎬 MP4 Export
Начать работу