Ставилась задача: Преобразовать плохую аудиозапись с диктофона в текст на бумаге.

Первая часть.
Установив аудио редактор http://audacity.sourceforge.net/ правим фонограмму.

В качестве подопытного, был взят голос прокурора, который говорил очень тихо, скороговоркой, проглатывая окончания слов.

С помощью редактора удалось улучшить аудиозапись до разборчивого состояния.
Использовался «эффекты» — «компрессор» без галочки «компрессия по пикам»

Можно безболезненно повторять эту процедуру до четырех раз без потери качества сигнала.
Тонкие настройки рассматривать не будем. Это объёмный сложный раздел, требующий вдумчивого подхода и многих часов работы.

Можно поступить проще, усилив сигнал на 20 дб. Больше не советую, т.к. появятся искажения на ограничениях пиков. Компрессия дает лучший результат.

Порядок работы с аудио редактором:
В меню «Файл» — «импортировать» — «звуковой файл» из открывшегося окна загружается ваша аудиозапись.
Предпочтительно работать с несжатыми .WAV файлами но, к сожалению, простые диктофоны в таком формате файлы не пишут и сразу сжимают в .MP3, что ведет к большой потере информации.
В окне аудио редактора сразу появится осциллограмма фонограммы.
Наведя мышку на интересующий участок, нажмите левую кнопку и проведите, не отпуская вправо или влево.
Выделится участок фонограммы, который вы можете прослушивать нажатием клавиши «пробел».
Подведя мышку к краю отмеченного участка, увидите указующий перст, с помощью которого можно раздвинуть участок просмотра.
Увеличивая или уменьшая масштаб записи можно визуально выделять и редактировать интересующий фрагмент.

Задействованы все привычные сочетания клавиш, как в текстовом редакторе.
Для работы с полной фонограммой имеются большие кнопки вверху. А внизу в окошечках показаны счетчики начала и конца фрагмента в секундах. Их можно править вручную.
Можно сделать копию фонограммы и мучить её в новом окне. Так даже лучше.
Можно в том же окне создать новый трек, поместив туда дубль, который предстоит улучшать.
«Дорожки»- «создать» — «монофонические дорожки»
Полезно дополнительно «дорожки» — «создать» — «дорожка пометок», где помечается выделяемый для работы участок фонограммы,

Проигрывать варианты редактируемых дорожек, сравнивать качество звучания.
Не забыв перед этим в левой части окна дорожки нажать на «тихо» и прослушивать только «соло» интересующей дорожки.
Думаю, вам понравится эта фишка.
Дорожку можно свернуть, убрать, удалить.

Если редактирование закончено и всё устраивает, тогда сохраняем результат 
«файл» — “Export select audio” сохранить в формате .WAV
Для сохранения в .MP3 нужно прикрутить специальный плагин. Думаю, нет смысла.

Вторая часть.
Пишем аудио на бумагу.
Облом — с!
С микрофона пишет, а из файла толком не работает.
Причина: Война гигантов.
Корректное распознавание только из файлов .HTML5, да и то очень криво.

Давал системе скушать чистый ровный голос профессионального диктора. Перевирает и тупит.

Потратил весь день и оставил эту затею.
Отрицательный результат тоже результат.
Кто-то, прочитав статью, сэкономит время.
 
В довершение,  маленький ролик.
http://youtu.be/xwAQKd8KD3o

Этот ролик лучше скачать и запустить в проигрывателе.

Да 10 10

Ваши голоса очень важны и позволяют выявлять действительно полезные материалы, интересные широкому кругу профессионалов. При этом бесполезные или откровенно рекламные тексты будут скрываться от посетителей и поисковых систем (Яндекс, Google и т.п.).

Участники дискуссии: pavelmizin, Шарапов Олег, Коробов Евгений, dedush, Бозов Алексей
  • 06 Февраля 2015, 23:29 #

    Я предварительно убираю шумы в фонограмме.   Программа замечательная.

    +4
  • 07 Февраля 2015, 03:30 #

    Уважаемый Александр Валерианович, Супер!.
    можно ли для чайников запись текста с микрофона?
    (Y)

    +4
    • 07 Февраля 2015, 06:08 #

      Уважаемый Олег Александрович, вопрос ёмкий.
      Попробую ответить тезисно.

      Улучшить качество записи в зале можно, используя остронаправленные микрофоны.  СТС НПИ.

      На месте, слепите акустический лабиринт из «клячки», выстроив стенки от шума из окна и других источников помех. Прислушиваясь в лесу,  мы прислоняем ладонь к уху и крутим головой.

      Диктофон должен лежать на мягком массивном основании: силиконовый коврик от мышки, шапка, перчатки, чехол от очков.
      Я использовал фотоаппарат CASIO ex-75 в режиме диктофона на чехле от очков из флиса.
       
      Уровень звукового давления падает с квадратом расстояния от источника звука.

      Правильный аудиорекордер, размером с две пачки сигарет, содержит в каждом канале микросхему, стоимость которой соизмерима со стоимостью навороченного бытового диктофона.
       
      Запись на диктофон вести только в формате .WAV 

      Для программы speechpad особых условий не надо, если Вы сами диктуете текст перед микрофоном обычной веб камеры.
      Результаты не стабильны т.к. оцифрованный сигнал уходит на сервер Gogle, ждет очереди на обработку, и затем возвращается назад. Непрерывный поток алгоритмом не предусмотрен. 

      +2
  • 07 Февраля 2015, 05:23 #

    Уважаемый Александр Валерианович, спасибо. Присоединяюсь к пожеланиям Олега Александровича — можно ли для чайников запись текста с микрофона? (call)

    +3
  • 07 Февраля 2015, 09:23 #

    Уважаемый Александр Валерианович, я правильно понял что нифига не получилось и придется нанимать расшифровщика?

    +5
    • 07 Февраля 2015, 12:49 #

      Уважаемый Алексей Анатольевич, с Google Speechpad фокус не прошел. У них другие задачи.
      И вариант Климушкина  здесь не прокатит.
      Хотя он был на верном пути и наверняка с полнодуплексной звуковой картой.
      оцифрованный сигнал уходит на сервер Gogle, ждет очереди на обработку, и затем возвращается назад. Непрерывный поток обработки информации алгоритмом не предусмотрен.

      0
  • 07 Февраля 2015, 15:25 #

    Уважаемый Алексей Анатольевич, Нет.
    Пока нет.
    Накопаю, проверю, поделюсь.

    +1

Да 10 10

Ваши голоса очень важны и позволяют выявлять действительно полезные материалы, интересные широкому кругу профессионалов. При этом бесполезные или откровенно рекламные тексты будут скрываться от посетителей и поисковых систем (Яндекс, Google и т.п.).

Для комментирования необходимо Авторизоваться или Зарегистрироваться

Ваши персональные заметки к публикации (видны только вам)

Рейтинг публикации: «Диктофон + аудио редактор. Восстановление аудиозаписи до разборчивого состояния» 2 звезд из 5 на основе 10 оценок.
Адвокат Фищук Александр Алексеевич
Краснодар, Россия
+7 (926) 004-7837
Персональная консультация
Банкротство, арбитражный управляющий: списание, взыскание долгов, оспаривание сделок, субсидиарная ответственность. Абонентское сопровождение бизнеса. Арбитраж, СОЮ, защита по налоговым преступлениям
https://fishchuk.pravorub.ru/
Адвокат Морохин Иван Николаевич
Кемерово, Россия
+7 (923) 538-8302
Персональная консультация
Сложные гражданские, уголовные и административные дела экономической направленности.
Дорого, но качественно. Все встречи и консультации, в т.ч. дистанционные только по предварительной записи.
https://morokhin.pravorub.ru/
Адвокат Архипенко Анна Анатольевна
Южно-Сахалинск, Россия
+7 (924) 186-0606
Персональная консультация
Защита прав и свобод граждан в уголовном судопроизводстве и оперативно-розыскной деятельности.
https://arkhipenko6.pravorub.ru/

Похожие публикации

Продвигаемые публикации