Discussions

Ask a Question
Back to all

Eleven Labs V3 en API para voces clonadas


*Asunto:** Escalamiento - El parámetro elevanlabs_settings con modelo eleven_v3 no se aplica vía API*


CONTEXTO DEL CASO:

Estamos desarrollando una integración con la API de HeyGen (endpoint /v2/video/generate) para generar videos automatizados con un avatar personalizado y una voz clonada. Necesitamos que los videos se generen específicamente con el modelo de voz ElevenLabs V3, ya que ofrece mejor calidad para nuestro caso de uso.

Problema inicial:
Al generar videos vía API, el parámetro del modelo de voz siempre quedaba en "Auto" sin importar lo que enviáramos.

Primera respuesta de soporte:
Nos indicaron que debíamos usar los siguientes parámetros dentro del objeto voice:

  • voice.elevanlabs_settings.model = "eleven_v3"
  • voice.elevanlabs_settings.stability = 1.0 (valores permitidos: 0, 0.5, 1.0)

Segunda respuesta de soporte:
Nos confirmaron que:

  • El nombre correcto del parámetro es elevanlabs_settings (sin la segunda "e")
  • El objeto debe estar dentro de voice en el payload

Lo que hicimos:
Implementamos los parámetros exactamente como nos indicaron y realizamos 4 pruebas, todas con el mismo resultado: el modelo de voz sigue apareciendo como "Auto".


PRUEBAS REALIZADAS:

#Variante probadaVideo IDResultado
1elevenlabs_settings (con segunda "e")89f81ce84a824d8a94a04b6f13f91061Auto ❌
2elevanlabs_settings (sin segunda "e", según soporte)5569d4615e0a4f9ebd6573bde4f16422Auto ❌
3elevanlabs_settings + debug del payload completo80c4949412f54eb4bc2fe9ac32162ae6Auto ❌
4elevanlabs_settings + texto largo de pruebac0ac59ede8da4bb381874b129a5af40bAuto ❌

ID de voz clonada: 8bd728ec2db24d439aecd001154ec193


PAYLOAD EXACTO QUE ESTAMOS ENVIANDO:

{
  "video_inputs": [
    {
      "character": {
        "type": "avatar",
        "avatar_id": "fcaa4100a56344e0bb4bddf3974cca49",
        "avatar_style": "normal",
        "scale": 1.2,
        "offset": {
          "x": 0,
          "y": 0
        }
      },
      "voice": {
        "type": "text",
        "voice_id": "8bd728ec2db24d439aecd001154ec193",
        "input_text": "Texto de prueba",
        "speed": 1.0,
        "pitch": 0,
        "elevanlabs_settings": {
          "model": "eleven_v3",
          "stability": 1.0
        }
      },
      "background": {
        "type": "color",
        "value": "#FFFFFF"
      }
    }
  ],
  "caption": true,
  "dimension": {
    "width": 1080,
    "height": 1920
  }
}

RESUMEN DE LA SITUACION:

  • Soporte nos indicó los parámetros correctos
  • Soporte confirmó que la estructura de nuestro payload es correcta
  • Hemos probado ambas variantes del nombre del parámetro (elevenlabs_settings y elevanlabs_settings)
  • Los 4 videos se generan exitosamente, pero ninguno respeta el modelo eleven_v3; todos quedan en "Auto"
  • Descartamos error de nuestro lado, ya que el payload coincide exactamente con lo que nos indicaron

LO QUE SOLICITAMOS:

  1. Revisión técnica de por qué el parámetro elevanlabs_settings.model = "eleven_v3" no se está aplicando a pesar de estar correctamente estructurado en el payload
  2. Verificación de si existe un problema de compatibilidad entre las voces clonadas y el modelo ElevenLabs V3 a través de la API
  3. Si es un bug conocido, un estimado de cuándo se resolverá
  4. Un ejemplo de payload confirmado como funcional por su equipo técnico que genere un video con ElevenLabs V3 exitosamente

Agradecemos la atención y quedamos atentos a su respuesta.

Y algo más, la idea es hacer videos a escala con otras voces clonadas pero con Elven Labs V3.