Discussions
Eleven Labs V3 en API para voces clonadas
*Asunto:** Escalamiento - El parámetro elevanlabs_settings con modelo eleven_v3 no se aplica vía API*
CONTEXTO DEL CASO:
Estamos desarrollando una integración con la API de HeyGen (endpoint /v2/video/generate) para generar videos automatizados con un avatar personalizado y una voz clonada. Necesitamos que los videos se generen específicamente con el modelo de voz ElevenLabs V3, ya que ofrece mejor calidad para nuestro caso de uso.
Problema inicial:
Al generar videos vía API, el parámetro del modelo de voz siempre quedaba en "Auto" sin importar lo que enviáramos.
Primera respuesta de soporte:
Nos indicaron que debíamos usar los siguientes parámetros dentro del objeto voice:
voice.elevanlabs_settings.model="eleven_v3"voice.elevanlabs_settings.stability=1.0(valores permitidos: 0, 0.5, 1.0)
Segunda respuesta de soporte:
Nos confirmaron que:
- El nombre correcto del parámetro es
elevanlabs_settings(sin la segunda "e") - El objeto debe estar dentro de
voiceen el payload
Lo que hicimos:
Implementamos los parámetros exactamente como nos indicaron y realizamos 4 pruebas, todas con el mismo resultado: el modelo de voz sigue apareciendo como "Auto".
PRUEBAS REALIZADAS:
| # | Variante probada | Video ID | Resultado |
|---|---|---|---|
| 1 | elevenlabs_settings (con segunda "e") | 89f81ce84a824d8a94a04b6f13f91061 | Auto ❌ |
| 2 | elevanlabs_settings (sin segunda "e", según soporte) | 5569d4615e0a4f9ebd6573bde4f16422 | Auto ❌ |
| 3 | elevanlabs_settings + debug del payload completo | 80c4949412f54eb4bc2fe9ac32162ae6 | Auto ❌ |
| 4 | elevanlabs_settings + texto largo de prueba | c0ac59ede8da4bb381874b129a5af40b | Auto ❌ |
ID de voz clonada: 8bd728ec2db24d439aecd001154ec193
PAYLOAD EXACTO QUE ESTAMOS ENVIANDO:
{
"video_inputs": [
{
"character": {
"type": "avatar",
"avatar_id": "fcaa4100a56344e0bb4bddf3974cca49",
"avatar_style": "normal",
"scale": 1.2,
"offset": {
"x": 0,
"y": 0
}
},
"voice": {
"type": "text",
"voice_id": "8bd728ec2db24d439aecd001154ec193",
"input_text": "Texto de prueba",
"speed": 1.0,
"pitch": 0,
"elevanlabs_settings": {
"model": "eleven_v3",
"stability": 1.0
}
},
"background": {
"type": "color",
"value": "#FFFFFF"
}
}
],
"caption": true,
"dimension": {
"width": 1080,
"height": 1920
}
}
RESUMEN DE LA SITUACION:
- Soporte nos indicó los parámetros correctos
- Soporte confirmó que la estructura de nuestro payload es correcta
- Hemos probado ambas variantes del nombre del parámetro (
elevenlabs_settingsyelevanlabs_settings) - Los 4 videos se generan exitosamente, pero ninguno respeta el modelo
eleven_v3; todos quedan en "Auto" - Descartamos error de nuestro lado, ya que el payload coincide exactamente con lo que nos indicaron
LO QUE SOLICITAMOS:
- Revisión técnica de por qué el parámetro
elevanlabs_settings.model = "eleven_v3"no se está aplicando a pesar de estar correctamente estructurado en el payload - Verificación de si existe un problema de compatibilidad entre las voces clonadas y el modelo ElevenLabs V3 a través de la API
- Si es un bug conocido, un estimado de cuándo se resolverá
- Un ejemplo de payload confirmado como funcional por su equipo técnico que genere un video con ElevenLabs V3 exitosamente
Agradecemos la atención y quedamos atentos a su respuesta.
Y algo más, la idea es hacer videos a escala con otras voces clonadas pero con Elven Labs V3.