Портативная русская версия LavaSR — ультрабыстрой модели улучшения речи.
- Собрал Nerual Dreaming — основатель ArtGeneration.me, техноблогер и нейро-евангелист.
- Нейро-Софт — репаки и портативки полезных нейросетей
- Повышение частоты дискретизации — апсемплинг с 8-48 кГц до чистых 48 кГц
- Шумоподавление — удаление фонового шума из речи
- Пакетная обработка — обработка множества файлов за раз с сохранением в output/
- Запись с микрофона — улучшение записи в реальном времени
- Полная изоляция — ничего не устанавливается в систему
- Поддержка GPU и CPU — NVIDIA GTX 10xx и новее, или CPU
| Параметр | Требование |
|---|---|
| ОС | Windows 10/11 (64-bit) |
| GPU | NVIDIA GTX 10xx+ (рекомендуется) или CPU |
| VRAM | ~500 МБ |
| ОЗУ | 4 ГБ+ |
| Диск | ~2 ГБ (Python + зависимости + модель) |
| Интернет | Для первой установки и загрузки модели |
| Серия | Архитектура | CUDA |
|---|---|---|
| GTX 10xx | Pascal | 11.8 |
| RTX 20xx | Turing | 11.8 |
| RTX 30xx | Ampere | 12.6 |
| RTX 40xx | Ada Lovelace | 12.8 |
| RTX 50xx | Blackwell | 12.8 |
-
Скачайте или клонируйте репозиторий:
git clone <URL_РЕПОЗИТОРИЯ>Или скачайте ZIP-архив и распакуйте.
-
Запустите установщик:
install.batСледуйте инструкциям — выберите вашу видеокарту, всё остальное автоматически.
-
Для запуска используйте:
run.batИнтерфейс откроется в браузере автоматически по адресу http://127.0.0.1:7860
- Запустите
run.bat - Загрузите аудиофайл или запишите с микрофона
- Настройте параметры (частота дискретизации, шумоподавление)
- Нажмите «Улучшить аудио»
- Прослушайте результат и сохраните при необходимости
WAV, MP3, FLAC, OGG, M4A и другие (через librosa/ffmpeg)
LavaSR_portable_ru/ ├── app.py # Приложение ├── install.bat # Установщик ├── run.bat # Запуск ├── update.bat # Обновление ├── requirements.txt # Зависимости ├── python/ # Портативный Python (создаётся при установке) ├── models/ # Кэш моделей HuggingFace (создаётся при установке) ├── ffmpeg/ # Портативный FFmpeg (создаётся при установке) ├── output/ # Сохранённые результаты ├── temp/ # Временные файлы └── cache/ # Кэш Приложение полностью изолировано от системы:
- Портативный Python (не требует установки)
- Все кэши (HuggingFace, PyTorch, temp) хранятся локально
- Ничего не записывается в системные папки пользователя
- Можно перенести на USB-накопитель
Ошибка «CUDA out of memory»:
- Закройте другие приложения, использующие GPU
- Попробуйте переустановить с выбором CPU
Ошибка при загрузке модели:
- Проверьте интернет-соединение
- Удалите папку
models/и запустите заново
Не открывается браузер:
- Откройте http://127.0.0.1:7860 вручную
Ошибка установки PyTorch:
- Обновите драйверы NVIDIA
- Переустановите с другой версией CUDA
| Устройство | Скорость |
|---|---|
| GPU (NVIDIA) | ~5000x реального времени |
| CPU | ~60x реального времени |
Размер модели: ~50 МБ, потребление VRAM: ~500 МБ.
- LavaSR — оригинальная модель (Yatharth Sharma)
- Vocos — нейровокодер
- UL-UNAS — архитектура шумоподавления
Apache 2.0 (следует лицензии оригинального LavaSR)