Полная обработка аудио: шумоподавление, нормализация, компрессия, эквалайзер, нарезка — без звукорежиссёра
Можно просто сказать: «Очисти и нормализуй» — GistIQ подберёт параметры сам
Sox двухпроходное — создаёт профиль шума из тихого участка записи, затем подавляет по всему файлу. Лучший результат для стационарного шума (кондиционер, вентилятор, гул). RNNoise (FFmpeg) — нейросетевое шумоподавление в реальном времени. Для сложного шума (улица, кафе). FFT-based (afftdn) — частотное шумоподавление для тонкой настройки. Noise gate — автоматическое подавление звука ниже порога (тихий фоновый шум между фразами).
EBU R128 (loudnorm) — стандарт YouTube, Spotify, Apple Podcasts. Все файлы одинаково громкие. Компрессор — тихие места громче, громкие тише. Комфортное прослушивание без регулировки громкости. Лимитер — предотвращение клиппинга (перегрузки). Пиковая нормализация — приведение к заданному уровню.
Параметрический эквалайзер — 18 полос, точная настройка частот. Highpass — убрать гул, низкочастотный шум (ниже 80 Hz). Lowpass — убрать свист, высокочастотный шум. Bass/Treble — быстрая коррекция низов и верхов. De-essing — уменьшение свистящих звуков (с, ш).
Удаление тишины — из начала, конца и середины записи с настраиваемым порогом. Детекция тишины — автоматическое определение пауз для нарезки по ним. VAD (Voice Activity Detection) — определение участков с голосом.
Склейка нескольких аудио в один файл с crossfade. Наложение музыки под голос с автоматическим ducking (приглушение музыки когда говорит спикер). Fade in/out. Изменение темпа без изменения тональности (и наоборот). Конвертация моно ↔ стерео.
Любой формат → любой формат: WAV, MP3, FLAC, OGG, M4A, AAC, AIFF. Настройка битрейта, частоты дискретизации, каналов. Спектрограмма — визуализация частот в PNG (для анализа качества).
Преподаватель записывает лекции на диктофон телефона. 20 записей по 40–90 минут. Качество — шум аудитории, хлопки дверей, неравномерная громкость, длинные паузы.
GistIQ пакетно обрабатывает все 20 файлов: Sox-шумоподавление (профиль из тихого участка) → highpass 80 Hz (убрать гул) → удаление пауз длиннее 3 секунд → компрессия динамического диапазона → нормализация EBU R128 → конвертация в MP3 128 kbps. На выходе — 20 чистых, ровных записей, готовых для прослушивания или транскрипции. Спектрограммы до/после показывают разницу.