streaming / DEPLOYMENT.md
rjzevallos's picture
Whisper Gradio
87071e6
# Guía Rápida de Despliegue en Hugging Face Spaces
## Requisitos previos
1. **Cuenta en Hugging Face**: https://huggingface.co (registrarse si es necesario)
2. **Token de HF generado**: https://huggingface.co/settings/tokens (copiar el token)
3. **Git instalado** en tu máquina
4. **Git LFS** (para modelos grandes): `git lfs install`
## Pasos del despliegue (5 minutos)
### Paso 1: Login en Hugging Face
```bash
huggingface-cli login
# Pega tu token cuando se pida
```
### Paso 2: Crear un Space nuevo
Ve a https://huggingface.co/spaces y pulsa "Create new Space":
- **Space name**: `simulstreaming-asr` (o tu nombre preferido)
- **License**: MIT (o la que prefieras)
- **SDK**: Docker (IMPORTANTE para control de dependencias)
- Crear Space
### Paso 3: Clonar el repositorio del Space
```bash
git clone https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr
cd simulstreaming-asr
```
Reemplaza `<tu-usuario>` con tu nombre en HF.
### Paso 4: Copiar archivos del proyecto
```bash
# Desde el directorio del Space clonado
cp -r /gpfs/projects/bsc88/speech/TTS/repos/Streaming_Mamba/SimulStreaming/space/* .
```
### Paso 5: Git LFS para el modelo (opcional)
Si quieres versionar el modelo `large-v3.pt` en el repositorio:
```bash
# Dentro del repositorio del Space
git lfs install
git add .gitattributes
git add large-v3.pt
```
Si **NO** quieres versionar el modelo (recomendado para no saturar el repo):
- Ignora este paso.
- El modelo se descargará automáticamente en el Space durante el startup.
### Paso 6: Hacer push
```bash
git add .
git commit -m "Initial commit: SimulStreaming ASR"
git push
```
### Paso 7: ¡Esperar a que se despliegue!
Ve a https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr y espera:
1. **Building** (construye Docker) → ~3 min
2. **Running** (descargando modelo y cargando) → ~5-10 min (la primera vez)
3.**Listo** — ¡Prueba grabando audio!
## Troubleshooting rápido
| Problema | Solución |
|----------|----------|
| "ImportError: No module named 'simul_whisper'" | El código intenta importar desde `SimulStreaming/`; asegúrate de que los paths relativos son correctos en `server_wrapper.py` |
| "Model download timeout" | El modelo `large-v3.pt` (~3GB) tarda. Usa `small.pt` en `server_wrapper.py` línea ~34 |
| "Out of memory" | Reduce el modelo a `small.pt` o `tiny.pt` |
| No se captura audio en navegador | Asegúrate de acceder por HTTPS (HF Spaces usa HTTPS por defecto) |
## Cambios si necesitas otro idioma
Edita `space/server_wrapper.py`, línea ~40:
```python
'lan': 'es', # Español. Opciones: 'en', 'es', 'de', 'fr', 'pt', etc.
```
Luego haz push nuevamente.
## URLs de referencia
- **Tu Space**: https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr
- **API Endpoint (desde dentro del Space)**: `http://localhost:7860/api/chunk`
- **Logs (si algo falla)**: En la UI del Space, sección "Logs"
---
¿Problemas? Mira el archivo `README.md` para más detalles.