Instructions to use ruaccent/RUAccent-stressed-encoder with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use ruaccent/RUAccent-stressed-encoder with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("feature-extraction", model="ruaccent/RUAccent-stressed-encoder")# Load model directly from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("ruaccent/RUAccent-stressed-encoder") model = AutoModel.from_pretrained("ruaccent/RUAccent-stressed-encoder") - Notebooks
- Google Colab
- Kaggle
metadata
license: mit
language:
- ru
RUAccent-stressed-encoder
Эта модель представляет собой дистиллированную версию StressCDLM, специально обученную char level модель для экспериментов, когда модели нужно видеть символы и отфайнтюненую на корпусе ударений.
Описание модели
RUAccent-stressed-encoder - это энкодер, оптимизированный для обработки русского текста с ударениями. Предназначен для интеграции в качестве текстового энкодера в TTS системы.
Использование
import torch
from transformers import AutoModel
import chartk
tokenizer = chartk.CharacterTokenizer.from_pretrained('ruaccent/RUAccent-stressed-encoder')
model = AutoModel.from_pretrained('ruaccent/RUAccent-stressed-encoder')
text = "На гор+е сто+ит з+амок"
inputs = tokenizer(text, return_tensors='pt', padding=True, truncation=True, max_length=512)
with torch.no_grad():
outputs = model(**inputs)
last_hidden_state = outputs.last_hidden_state