Skip to content

timoncool/LavaSR_portable_ru

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

LavaSR Portable — Улучшение и суперразрешение аудио

Портативная русская версия LavaSR — ультрабыстрой модели улучшения речи.

Авторы

Возможности

  • Повышение частоты дискретизации — апсемплинг с 8-48 кГц до чистых 48 кГц
  • Шумоподавление — удаление фонового шума из речи
  • Пакетная обработка — обработка множества файлов за раз с сохранением в output/
  • Запись с микрофона — улучшение записи в реальном времени
  • Полная изоляция — ничего не устанавливается в систему
  • Поддержка GPU и CPU — NVIDIA GTX 10xx и новее, или CPU

Системные требования

Параметр Требование
ОС Windows 10/11 (64-bit)
GPU NVIDIA GTX 10xx+ (рекомендуется) или CPU
VRAM ~500 МБ
ОЗУ 4 ГБ+
Диск ~2 ГБ (Python + зависимости + модель)
Интернет Для первой установки и загрузки модели

Совместимость GPU

Серия Архитектура CUDA
GTX 10xx Pascal 11.8
RTX 20xx Turing 11.8
RTX 30xx Ampere 12.6
RTX 40xx Ada Lovelace 12.8
RTX 50xx Blackwell 12.8

Установка

  1. Скачайте или клонируйте репозиторий:

    git clone <URL_РЕПОЗИТОРИЯ> 

    Или скачайте ZIP-архив и распакуйте.

  2. Запустите установщик:

    install.bat 

    Следуйте инструкциям — выберите вашу видеокарту, всё остальное автоматически.

  3. Для запуска используйте:

    run.bat 

    Интерфейс откроется в браузере автоматически по адресу http://127.0.0.1:7860

Использование

  1. Запустите run.bat
  2. Загрузите аудиофайл или запишите с микрофона
  3. Настройте параметры (частота дискретизации, шумоподавление)
  4. Нажмите «Улучшить аудио»
  5. Прослушайте результат и сохраните при необходимости

Поддерживаемые форматы

WAV, MP3, FLAC, OGG, M4A и другие (через librosa/ffmpeg)

Структура папок

LavaSR_portable_ru/ ├── app.py # Приложение ├── install.bat # Установщик ├── run.bat # Запуск ├── update.bat # Обновление ├── requirements.txt # Зависимости ├── python/ # Портативный Python (создаётся при установке) ├── models/ # Кэш моделей HuggingFace (создаётся при установке) ├── ffmpeg/ # Портативный FFmpeg (создаётся при установке) ├── output/ # Сохранённые результаты ├── temp/ # Временные файлы └── cache/ # Кэш 

Изоляция

Приложение полностью изолировано от системы:

  • Портативный Python (не требует установки)
  • Все кэши (HuggingFace, PyTorch, temp) хранятся локально
  • Ничего не записывается в системные папки пользователя
  • Можно перенести на USB-накопитель

Решение проблем

Ошибка «CUDA out of memory»:

  • Закройте другие приложения, использующие GPU
  • Попробуйте переустановить с выбором CPU

Ошибка при загрузке модели:

  • Проверьте интернет-соединение
  • Удалите папку models/ и запустите заново

Не открывается браузер:

Ошибка установки PyTorch:

  • Обновите драйверы NVIDIA
  • Переустановите с другой версией CUDA

Производительность

Устройство Скорость
GPU (NVIDIA) ~5000x реального времени
CPU ~60x реального времени

Размер модели: ~50 МБ, потребление VRAM: ~500 МБ.

Благодарности

  • LavaSR — оригинальная модель (Yatharth Sharma)
  • Vocos — нейровокодер
  • UL-UNAS — архитектура шумоподавления

Лицензия

Apache 2.0 (следует лицензии оригинального LavaSR)

About

LavaSR Portable - audio enhancement

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors