streaming / DEPLOYMENT.md
rjzevallos's picture
Whisper Gradio
87071e6

Guía Rápida de Despliegue en Hugging Face Spaces

Requisitos previos

  1. Cuenta en Hugging Face: https://huggingface.co (registrarse si es necesario)
  2. Token de HF generado: https://huggingface.co/settings/tokens (copiar el token)
  3. Git instalado en tu máquina
  4. Git LFS (para modelos grandes): git lfs install

Pasos del despliegue (5 minutos)

Paso 1: Login en Hugging Face

huggingface-cli login
# Pega tu token cuando se pida

Paso 2: Crear un Space nuevo

Ve a https://huggingface.co/spaces y pulsa "Create new Space":

  • Space name: simulstreaming-asr (o tu nombre preferido)
  • License: MIT (o la que prefieras)
  • SDK: Docker (IMPORTANTE para control de dependencias)
  • Crear Space

Paso 3: Clonar el repositorio del Space

git clone https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr
cd simulstreaming-asr

Reemplaza <tu-usuario> con tu nombre en HF.

Paso 4: Copiar archivos del proyecto

# Desde el directorio del Space clonado
cp -r /gpfs/projects/bsc88/speech/TTS/repos/Streaming_Mamba/SimulStreaming/space/* .

Paso 5: Git LFS para el modelo (opcional)

Si quieres versionar el modelo large-v3.pt en el repositorio:

# Dentro del repositorio del Space
git lfs install
git add .gitattributes
git add large-v3.pt

Si NO quieres versionar el modelo (recomendado para no saturar el repo):

  • Ignora este paso.
  • El modelo se descargará automáticamente en el Space durante el startup.

Paso 6: Hacer push

git add .
git commit -m "Initial commit: SimulStreaming ASR"
git push

Paso 7: ¡Esperar a que se despliegue!

Ve a https://huggingface.co/spaces//simulstreaming-asr y espera:

  1. Building (construye Docker) → ~3 min
  2. Running (descargando modelo y cargando) → ~5-10 min (la primera vez)
  3. Listo — ¡Prueba grabando audio!

Troubleshooting rápido

Problema Solución
"ImportError: No module named 'simul_whisper'" El código intenta importar desde SimulStreaming/; asegúrate de que los paths relativos son correctos en server_wrapper.py
"Model download timeout" El modelo large-v3.pt (~3GB) tarda. Usa small.pt en server_wrapper.py línea ~34
"Out of memory" Reduce el modelo a small.pt o tiny.pt
No se captura audio en navegador Asegúrate de acceder por HTTPS (HF Spaces usa HTTPS por defecto)

Cambios si necesitas otro idioma

Edita space/server_wrapper.py, línea ~40:

'lan': 'es',  # Español. Opciones: 'en', 'es', 'de', 'fr', 'pt', etc.

Luego haz push nuevamente.

URLs de referencia

  • Tu Space: https://huggingface.co/spaces//simulstreaming-asr
  • API Endpoint (desde dentro del Space): http://localhost:7860/api/chunk
  • Logs (si algo falla): En la UI del Space, sección "Logs"

¿Problemas? Mira el archivo README.md para más detalles.