Диктофон + аудио редактор. Восстановление аудиозаписи до разборчивого состояния

Ставилась задача: Преобразовать плохую аудиозапись с диктофона в текст на бумаге.

Первая часть.
Установив аудио редактор http://audacity.sourceforge.net/ правим фонограмму.

В качестве подопытного, был взят голос прокурора, который говорил очень тихо, скороговоркой, проглатывая окончания слов.

С помощью редактора удалось улучшить аудиозапись до разборчивого состояния.
Использовался «эффекты» — «компрессор» без галочки «компрессия по пикам»

Можно безболезненно повторять эту процедуру до четырех раз без потери качества сигнала.
Тонкие настройки рассматривать не будем. Это объёмный сложный раздел, требующий вдумчивого подхода и многих часов работы.

Можно поступить проще, усилив сигнал на 20 дб. Больше не советую, т.к. появятся искажения на ограничениях пиков. Компрессия дает лучший результат.

Порядок работы с аудио редактором:
В меню «Файл» — «импортировать» — «звуковой файл» из открывшегося окна загружается ваша аудиозапись.
Предпочтительно работать с несжатыми .WAV файлами но, к сожалению, простые диктофоны в таком формате файлы не пишут и сразу сжимают в .MP3, что ведет к большой потере информации.
В окне аудио редактора сразу появится осциллограмма фонограммы.
Наведя мышку на интересующий участок, нажмите левую кнопку и проведите, не отпуская вправо или влево.
Выделится участок фонограммы, который вы можете прослушивать нажатием клавиши «пробел».
Подведя мышку к краю отмеченного участка, увидите указующий перст, с помощью которого можно раздвинуть участок просмотра.
Увеличивая или уменьшая масштаб записи можно визуально выделять и редактировать интересующий фрагмент.

Задействованы все привычные сочетания клавиш, как в текстовом редакторе.
Для работы с полной фонограммой имеются большие кнопки вверху. А внизу в окошечках показаны счетчики начала и конца фрагмента в секундах. Их можно править вручную.
Можно сделать копию фонограммы и мучить её в новом окне. Так даже лучше.
Можно в том же окне создать новый трек, поместив туда дубль, который предстоит улучшать.
«Дорожки»- «создать» — «монофонические дорожки»
Полезно дополнительно «дорожки» — «создать» — «дорожка пометок», где помечается выделяемый для работы участок фонограммы,

Проигрывать варианты редактируемых дорожек, сравнивать качество звучания.
Не забыв перед этим в левой части окна дорожки нажать на «тихо» и прослушивать только «соло» интересующей дорожки.
Думаю, вам понравится эта фишка.
Дорожку можно свернуть, убрать, удалить.

Если редактирование закончено и всё устраивает, тогда сохраняем результат
«файл» — “Export select audio” сохранить в формате .WAV
Для сохранения в .MP3 нужно прикрутить специальный плагин. Думаю, нет смысла.

Вторая часть.
Пишем аудио на бумагу.
Облом — с!
С микрофона пишет, а из файла толком не работает.
Причина: Война гигантов.
Корректное распознавание только из файлов .HTML5, да и то очень криво.

Давал системе скушать чистый ровный голос профессионального диктора. Перевирает и тупит.

Потратил весь день и оставил эту затею.
Отрицательный результат тоже результат.
Кто-то, прочитав статью, сэкономит время.

В довершение, маленький ролик.
http://youtu.be/xwAQKd8KD3o

Этот ролик лучше скачать и запустить в проигрывателе.

Юрист pavelmizin 06 Февраля 2015, 23:29 # ↓

Я предварительно убираю шумы в фонограмме. Программа замечательная.

+4
- Адвокат Шарапов Олег Александрович 07 Февраля 2015, 03:29 # ↑ ↓
  
  Уважаемый Павел Леонидович, по шагам можно убирание шумов? (handshake)
  
  +3
  - Юрист pavelmizin 08 Февраля 2015, 10:58 # ↑ ↓
    
    НЕ понял вопроса. Я беру участок фонограммы без голоса, но с шумами (в том числе шумами самого диктофона) задаю параметр что это шум, а потом со все фонограммы его удаляю одной командой.
    
    0
    - Адвокат Шарапов Олег Александрович 08 Февраля 2015, 17:05 # ↑ ↓
      
      Вопрос в том, чтобы не сказать, как Вы это делаете,
      я уже понял, что умеете, а в том, чтобы научить и нас, (handshake)неспособных…
      
      0
      - Юрист pavelmizin 08 Февраля 2015, 20:35 # ↑ ↓
        
        http://www.youtube.com/watch?v=OQuOcZc1Gfo
        
        Гуглим по запросу - audacity убираем шумы.
        На ютубе достаточно много очень хороших уроков.
        
        0
        
        Адвокат Шарапов Олег Александрович 11 Февраля 2015, 16:14 # ↑ ↓
        
        Уважаемый Павел Леонидович, Спасибо.
        
        +1
Адвокат Шарапов Олег Александрович 07 Февраля 2015, 03:30 # ↓

Уважаемый Александр Валерианович, Супер!.
можно ли для чайников запись текста с микрофона?
(Y)

+4
- Эксперт dedush 07 Февраля 2015, 06:08 # ↑ ↓
  
  Уважаемый Олег Александрович, вопрос ёмкий.
  Попробую ответить тезисно.
  
  Улучшить качество записи в зале можно, используя остронаправленные микрофоны. СТС НПИ.
  
  На месте, слепите акустический лабиринт из «клячки», выстроив стенки от шума из окна и других источников помех. Прислушиваясь в лесу, мы прислоняем ладонь к уху и крутим головой.
  
  Диктофон должен лежать на мягком массивном основании: силиконовый коврик от мышки, шапка, перчатки, чехол от очков.
  Я использовал фотоаппарат CASIO ex-75 в режиме диктофона на чехле от очков из флиса.
  
  Уровень звукового давления падает с квадратом расстояния от источника звука.
  
  Правильный аудиорекордер, размером с две пачки сигарет, содержит в каждом канале микросхему, стоимость которой соизмерима со стоимостью навороченного бытового диктофона.
  
  Запись на диктофон вести только в формате .WAV
  
  Для программы speechpad особых условий не надо, если Вы сами диктуете текст перед микрофоном обычной веб камеры.
  Результаты не стабильны т.к. оцифрованный сигнал уходит на сервер Gogle, ждет очереди на обработку, и затем возвращается назад. Непрерывный поток алгоритмом не предусмотрен.
  
  +2
Юрист Коробов Евгений Алексеевич 07 Февраля 2015, 05:23 # ↓

Уважаемый Александр Валерианович, спасибо. Присоединяюсь к пожеланиям Олега Александровича — можно ли для чайников запись текста с микрофона? (call)

+3
Адвокат Бозов Алексей Анатольевич 07 Февраля 2015, 09:23 # ↓

Уважаемый Александр Валерианович, я правильно понял что нифига не получилось и придется нанимать расшифровщика?

+5
- Эксперт dedush 07 Февраля 2015, 12:49 # ↑ ↓
  
  Уважаемый Алексей Анатольевич, с Google Speechpad фокус не прошел. У них другие задачи.
  И вариант Климушкина здесь не прокатит.
  Хотя он был на верном пути и наверняка с полнодуплексной звуковой картой.
  оцифрованный сигнал уходит на сервер Gogle, ждет очереди на обработку, и затем возвращается назад. Непрерывный поток обработки информации алгоритмом не предусмотрен.
  
  0
  - Адвокат Бозов Алексей Анатольевич 07 Февраля 2015, 15:16 # ↑ ↓
    
    Александр Валерианович, я тебя непонимайт))) просто можно сказать: Да или Нет?
    
    +5
Эксперт dedush 07 Февраля 2015, 15:25 # ↓

Уважаемый Алексей Анатольевич, Нет.
Пока нет.
Накопаю, проверю, поделюсь.

+1

dedush

Диктофон + аудио редактор. Восстановление аудиозаписи до разборчивого состояния

Ваши персональные заметки к публикации (видны только вам)

Другие публикации автора

Похожие публикации

Продвигаемые публикации