Перевод аудио в текст — обзор программ для транскрибации

Содержание
  1. Транскрибация вручную
  2. Выполнение дополнительные мероприятий
  3. Заказ перевода аудио в текст у специалистов
  4. Speechpad — Блокнот для речевого ввода
  5. Бот в Telegram
  6. Субтитры Ютуб
  7. Otter.ai
  8. Работа расшифровщиком 
  9. Какие навыки должны быть у дешифровщика
  10. Подходит ли вам эта работа?
  11. Как начать зарабатывать на транскрибации
  12. Еще пара важных моментов для начинающих расшифровщиков
  13. Где искать работу (для транскрибаторов) или расшифровщиков (для работодателей)?
  14. Cloud Speech-to-Text
  15. Программа Express Scribe (Экспресс Скрайб)
  16. Инструменты для транскрибации
  17. Для автоматической транскрибации
  18. Для ручной транскрибации
  19. Программа Lossplay
  20. В каких сферах применяется транскрибация?
  21. Сайт и программа Speechpad (Спичпэд)
  22. Онлайн-сервис dictation.io
  23. Способ 1. Google Docs
  24. Сайт и программа RealSpeaker
  25. Программа Transcriber-pro
  26. Онлайн сервис Dictation.io
  27. Программа RSPlayer
  28. Приложение Windows – VOCO
  29. Программа Virtual Audio Cable
  30. Гугл Документы
  31. Какие способы существуют и какой лучше выбрать
  32. Программные средства транскрибирования онлайн
  33. Virtual Audio Cable
  34. Как сделать эмуляцию виртуального кабеля без программок
  35. Speechpad «Блокнот для речевого ввода» – сервис для надиктовки (транскрибирования текста)
  36. Realspeaker – программа для транскрибирования и расшифровки
  37. Google Translate – просто переводчик и не только
  38. Google Docs – самый универсальный инструмент перевода звука в текст онлайн
  39. Как и чем пользоваться если нужно надиктовывать голосом?
  40. Нужно надиктовать быстро, а под рукой только мобильный телефон?
  41. Если у вас iPhone

Транскрибация вручную

Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.

Это достаточно сложно. Точнее, технически-то, как раз ничего сложного нет. Берете аудиозапись, прослушиваете несколько секунд. Записываете. Возвращаетесь. Слушаете снова. Проверяете, все ли верно записали. И так следующий кусок. То есть, идея простая.

Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? :) Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.

Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:

  • В комнате шумно
  • Диктор говорит тихо
  • Диктор говорит с сильным акцентов
  • У диктора “фефекты фикции”
  • Записан на плохой микрофон
  • Одновременно говорит много людей
  • Диктор “вклинивает” иностранные фразы. Или малоупотребительные

Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.

Выполнение дополнительные мероприятий

На некоторых компьютерах понадобится установить драйвер VB-CABLE Virtual Audio Device. В параметрах микшера громкости нужно включить виртуальный аудио кабель для того, чтобы на ПК работал голосовой ввод при использовании онлайн сервисов или в некоторых программах.

виртуальный кабель

На ПК со звуковыми картами Realtek устанавливать драйвер не потребуется, в настройках звука, в окне «Звук», во вкладке «Запись» включите опцию «Стерео микшер».

стерео микшер

На моем компьютере не потребовалось выполнять данные манипуляции. Поэтому, прежде чем устанавливать драйвер виртуального кабеля, проверьте работу микрофона в онлайн переводчике. Если голосовой ввод с микрофона работает, установка драйвера не потребуется.

Заказ перевода аудио в текст у специалистов

Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.

Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы :( Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.

Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…

Записано 1

Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.

Записано 2

  • Начну с главного. C личного кабинета. Главный упор данного сервиса сделан на удобстве использования. Мне понравилось то, что можно заказ оформить прямо онлайн, тут же пообщаться с менеджерами и т.п. И все в одном месте. Не нужно никуда звонить, писать письма…Это здорово экономит время и нервы.
  • Цены на расшифровку аудио на удивление вменяемые. Причем, эти цены даны уже “под ключ”! Кстати, я провожу сравнение стоимости расшифровки на сервисе “Записано” с фрилансеровскими в моем видео внизу этого абзаца. Много интересных моментов выясняется. Рекомендую посмотреть!
  • Что еще? Есть работа с юр.лицами! Это просто супер! Можно платить по безналу по счету. А не искать наличку для платежа. Этого мне не хватало при работе с биржами фриланса.
  • Есть защита информации. У многих бесплатных программ транскрибации  Ваши данные могут уходить в “общий котел”. Это не есть зер гут! У “Записано” с этим все строго!

Записано 3

Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.

  • Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
  • Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
  • Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..

Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.

Ну а тем, кто все-таки хочет самостоятельно освоить все тонкости расшифровки аудио в текст, нужно читать дальше

Speechpad — Блокнот для речевого ввода

Онлайн сервис speechpad.ru работает в браузере Google Chrome. Для речевого перевода используются служба переводчика Google. Имеется расширение SpeechPad (голосовой ввод текста) для браузера, с помощью которого можно вводить текст с голоса на сайтах в интернете.

Для получения лучшего качества, рекомендуется использовать внешний микрофон.

На странице сайта spechpad.ru выполните следующие действия:

  1. На странице сервиса «Блокнот для речевого ввода» нажмите на кнопку «включить запись».
  2. В поле «Результирующее поле» станет отображаться текст, извлеченный из вашего голоса.

текст в результирующем поле

  1. Отредактируйте полученный текст, а затем скачайте его на компьютер.

Время записи в этом режиме ограничено 15 минутами.

Вам также может быть интересно:

  • Перевод речи в текст на Андроид — 10 способов
  • Переводчик по фото онлайн — 5 способов

Сервис умеет переводить в текст видео или аудио файлы из интернета или с компьютера. Для этого, можно использовать два способа.

1 способ:

  1. В другой вкладке браузера запустите воспроизведение видео или аудио в интернете, или запустите аудио или видео файл со своего компьютера в плеере.
  2. На странице речевого блокнота Spechpad нажмите на кнопку «включить запись».
  3. В результирующем поле появится текст из видео или аудио.

2 способ:

  1. На главной странице сервиса нажмите на кнопку «Транскрибацию», которая расположена под результирующем полем.
  2. На странице «Панель транскрибации» выберите файл с компьютера, или введите URL-адрес медиа файла.
  3. Запустите воспроизведение медиа во встроенном плеере. Для видео с YouTube вставьте в поле не полную ссылку, а идентификатор видео, как на примере.

выбор медиафайла

Здесь имеет много настроек, которые можно изменить для получения лучшего результата.

Бот в Telegram

Чуть более функциональную онлайн-расшифровку аудио в текст предоставляет бот Voicy, расположенный в мессенджере Telegram. Он работает с голосовыми сообщениями и отдельно загруженными файлами. Качество распознавания находится на среднем уровне. Поддерживается смена «движка» на Google Speach, однако для этого потребуется предварительно оформить подписку в сервисе Cloud Speech-to-Text. По умолчанию используется бесплатная система Wit.ai.

Инструкция по работе с ботом:

  • Перейти по ссылке для добавления чата в мессенджер.
  • Дать команду «/language» для выбора языка.
  • Бот в Telegram

  • Если требует перевести файл, следует использовать команду «/files».
  • Далее остается только прикрепить аудиозапись, после чего бот сообщит о запуске процесса распознавания.

Для просмотра всех команд Voicy необходимо отправить ему сообщение с текстом «/help».

Подведем итоги. Программа для преобразования голоса в текст на Виндовс присутствует только в сервисе Speechpad. Однако даже там основная часть данных берется с серверов. Прочие предложенные инструменты работают онлайн. Лучшим по качеству распознавания является Cloud Speech-to-Text. Бесплатная альтернатива представлена Google Переводчиком, где после установки специального драйвера получится проводить транскрибацию аудиофайлов.

Субтитры Ютуб

Если Вам лень устанавливать какие-либо программы, а Вам нужно срочно провести транскрибацию аудиозаписи в текст, то… то просто воспользуйтесь Ютубом. Точнее субтитрами Ютуб. Как это сделать? Все просто.

Шаг 1. Залейте видео на свой канал Ютуб.

Transkribatsija-3

Шаг 2. Включите субтитры

Transkribatsija-4

Ша

Шаг 3. Нажать кнопку “Посмотреть расшифровку видео”

Transkribatsija-5

Шаг 4. Копируйте себе в блокнот полученный текст.

Transkribatsija-6

Шаг 5. Удалите метки времени и “причешите текст. Вот и все.

Transkribatsija-7

Субтитры Ютуб создает достаточно качественные. Единственное, много времени уходит на приведение текста в порядок. Но и в других программах, расстановка знаков препинания и приведение текста к нормальному виду тоже нужно делать. Так что…

Otter.ai

Зарубежный сервис распознавания речи, в настоящее время поддерживает работу только с английским языком. Предоставляет около 600 минут распознавания аудиофайлов на месяц. Если потребуется больше, присутствует премиум-подписка.

Otter.ai

На сайте сохраняются все распознавания голосовых записей, обработка вновь добавленного файла выполняется достаточно быстро. В итоговых результатах сервис выделяет ключевые слова, обозначает отдельных собеседников (если на записи присутствует несколько голосов), выставляет параграфы. Со знаками препинания ситуация не лучше, чем на других сервисах – их придется расставлять самостоятельно.

Работа расшифровщиком 

Сейчас работа расшифровщика не похожа на деятельность стенографисток прошлого века. Компьютеры помогают обходиться без диких сокращений и шифров. Да и работать чаще приходится с записью, а не с речью толпы ученых, перебивающих друг друга в реальном времени. Но свои сложности в этой деятельности тоже имеются. 

Какие навыки должны быть у дешифровщика

  • Нужно быть внимательным к деталям. Перфекционизм в этой сфере идет на пользу. Заказчик платит за качественную расшифровку, он не заинтересован в тексте, транскрибированном только силами искусственного интеллекта. 

  • Печатать нужно быстро, минимум от 70 знаков в минуту. Проверьте скорость своих пальцев с помощью тренажера перед трудоустройством. 

  • Нужно идеально знать правила языка, с которым предстоит работать. 

  • В тех случаях, когда придется работать с конфиденциальными данными (на бизнес-заседаниях), надо осторожничать и случайно не раскрыть засекреченную информацию. 

  • Придется освоить специальные утилиты для упрощения транскрибации. Без них вы не будете конкурентоспособны. 

  • Хороший слух, отличающийся способностью выудить даже речь дикторов, «проглатывающих» половину слов. 

Подходит ли вам эта работа?

Надо оценить для себя соотношение плюсов и минусов профессии дешифровщика и на основании этого соотношения сделать выбор.

Из хорошего в работе транскрибатором стоит выделить гибкий график работы без строгих рамок. Требуется укладываться в дедлайн, но не работать в фиксированные часы. Для работы обычно хватает ПК, поэтому можно выполнять свои обязанности, не покидая постели. Сам процесс расшифровки «непыльный», не требует обучения и диплома. 

Из плохого опытные транскрибаторы отмечают, что работать надо в основном с материалами низкого качества. В таких ситуациях уходит куча времени на попытки опознать сказанные слова и целые предложения. Встречается много узкой терминологии: если кругозор у вас не слишком широкий, придется много и усердно гуглить. Да и фриланс – это нестабильно: работы то в достатке, то ее нет вообще, а в области транскрибации еще и дикая конкуренция из-за низкого порога вхождения в профессию. 

Как начать зарабатывать на транскрибации

Стать транскрибатором не очень сложно. Надо обзавестись необходимых оборудованием: компьютером средней мощности и качественно воспроизводящими звук наушниками (в идеале с шумоподавлением).

Стенографистки

Тем, кто будет записывать речь в реальном времени, понадобится еще и хороший микрофон для подкастов. После этого можно смело открывать фриланс-биржу и искать вакансии на «расшифровку» и «транскрибацию». Оставляем отклики, выполняем задачи. А чтобы перестать быть вне закона, регистрируемся как самозанятый через банк или приложение «Мои налоги».

Еще пара важных моментов для начинающих расшифровщиков

  • Работать дома не так легко, как кажется. Соблазн отвлечься на сериал огромный. Самодисциплина должна быть на уровне.

  • Это не прибыльно. За расшифровку аудио- и видеофайлов платят скромно. Средняя ставка 400-800 рублей за час контента. И если вы думаете, что это 800 рублей в час, то глубоко заблуждаетесь, ведь на расшифровку часа контента уходит до 4-6 часов. 

  • Это временное пристанище. Чтобы расти, нужно будет учиться дальше и получать новые навыки, например навыки копирайтинга. 

Где искать работу (для транскрибаторов) или расшифровщиков (для работодателей)?

Работа есть на фриланс-биржах в духе FL.ru, freelance.ru, weblancer и им подобных, на текстовых биржах типа etxt.ru, text.ru, advego.com. На общепринятых площадках для поиска работы тоже можно искать: это HH.ru, Workzilla, YouDo, Авито и т.п. Я дополнительно порекомендую finder.vc, хотя найти там подобные вакансии обычно намного сложнее.

Cloud Speech-to-Text

Мощный, но в то же время платный инструмент от разработчиков Google. В его работе используются технологии машинного обучения для распознавания коротких фраз и длительных аудиозаписей.

Cloud Speech-to-Text предоставляет пользователям расшифровку аудиозаписей в текст путем применения моделей нейронной сети через простой к понимаю API. Сервис может использоваться для голосовых команд управления, транскрибации аудио и прочих задач.

Cloud Speech-to-Text

На стартовой странице сервиса можно провести распознавание с файла или микрофона без регистрации. Это позволит оценить качество его работы. Cloud Speech-to-Text умеет работать со 120 языками. Отрезок из аудиокниги на русском языке был транскрибирован практически идеально, исключение составили только несколько слов, которые было сложно разобрать даже человеческому уху.

Сервис можно смело рекомендовать, если перевод голоса в текст требуется постоянно в ходе профессиональной деятельности или по работе. Попробовать полный функционал можно на бесплатной основе, предварительно согласившись с правилами и предоставив данные кредитной карты.

Программа Express Scribe (Экспресс Скрайб)

Это наверное, одна из самых популярных программ для транскрибации

Transkribatsija-8

Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.

transcribation_1

В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.

Express Scribe поддерживает все известные мне (и не известные :) ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.

Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на приобретение Экспресс Скрайб.

Инструменты для транскрибации

Для транскрибации нужно подходящее ПО. И выбор его зависит от того, как устроен процесс расшифровки. 

Инструменты транскрибатора

Если вы планируете доверить все автоматике и изредка вносить правки, то понадобится что-нибудь на базе ИИ с возможностью фиксировать человеческую речь через микрофон или считывать ее из аудиофайлов. 

Для самостоятельной транскрибации хватит и текстового редактора, но лучше установить вспомогательную утилиту, которая слегка снизит нагрузку на мозг и ускорит процедуру дешифровки контента.

Для автоматической транскрибации

Google Docs

Самый доступный метод, не отличающийся качеством распознавания речи, но наиболее простой в использовании. Достаточно нажать клавиши Ctrl + Shift + S в открытом редакторе и начать диктовать то, что хочется преобразовать в текст. В системах iOS и macOS для этого есть отдельные клавиши (иконка в виде микрофона на iOS и клавиша Fn на macOS).

Speechpad

Бесплатный дешифровщик, умеющий считывать человеческую речь с микрофона напрямую. Это не полноценное приложение для ПК, а расширение для Google Chrome, но есть и мобильная версия в App Store и Google Play. 

RealSpeaker

Инструмент, преобразующий в текст уже записанную речь. Он работает на базе ИИ и не может в реальном времени фиксировать слова, сказанные в микрофон. А еще он платный и просит 8 рублей за одну минуту расшифрованного аудиоконтента. 

Voco

Универсальный расшифровщик. Тоже платный, но зато умеющий работать как с речью, в реальном времени зачитываемой в микрофон, так и с файлами с предзаписанными монологами и диалогами. Voco не нуждается в интернете, его «мозги» сохраняются непосредственно в системе и там же занимаются обработкой аудио. Отличительной чертой является обучаемый алгоритм, способный адаптироваться под особенности конкретного аудио- или видеоконтента. 

YouTube

Если нет денег на вышеперечисленное ПО или нет возможности его установить, то на помощь придет YouTube с его нейросетью. Надо: 

  • загрузить видеофайл с речью на хостинг, 

  • дождаться его обработки, 

  • потом открыть программу «Творческая студия», 

  • в ней найти пункт «Субтитры»,

  • выбрать язык для транскрибации и нажать на кнопку «Скачать» (скачается файл с субтитрами).

Для ручной транскрибации

Express Scribe Transcription Software

Дополнение к Microsoft Word, объединяющее текстовый редактор с видеопроигрывателем. Лишает пользователя необходимости «прыгать» между окнами и постоянно терять фокус. Приложение платное. 

LossPlay

Проигрыватель, визуально напоминающий Winamp, с функцией вставки временных меток и глобальными горячими клавишами для управления воспроизведением контента. Например, можно, не покидая Word, остановить воспроизведение аудио или перемотать его на несколько секунд назад. 

Расшифровщик на рабочем месте

oTranscribe

Аналог LossPlay от зарубежных разработчиков и распространяющийся по open-source лицензии. То есть бесплатно и с открытым исходным кодом. Тоже вставляет временные метки автоматически, поддерживает горячие клавиши для перемотки и экспорт в популярные форматы в духе markdown (.md) или rich-text (.docx).

Программа Lossplay

Вот еще одна программа для профессиональной расшифровки аудиофайлов. Программа ЛоссПлей. Это плеер от “нашего” разработчика. Поэтому удобен для русскоязычного транскрибатора.

LossPlay1

mainpl2

Программа идеально подходит для новичка, который занимается расшифровкой аудио. В программе есть удобные быстрые клавиши.Этот плеер для транскрибации легко интегрируется с Word.  Можно вставлять тайм-коды. Поддерживается огромное количество форматов аудиофайлов. Регулировка скорости воспроизведения. И многое-многое другое. Есть видеоуроки!

В каких сферах применяется транскрибация?

Как я уже отметил выше, есть целая когорта направлений, нуждающихся в транскрибаторах.

  • Сфера образования. Лекторы не часто утруждают себя созданием текстового варианта своих «уроков», поэтому превращение их устной речи в текст ложится на плечи расшифровщиков. Это необходимо, чтобы обеспечить более надежное хранение озвученных данных, меньшую нагрузку на носители, где хранятся лекции, и возможность искать данные по сохраненному контенту.

  • Новостные ресурсы, микроблоги. Информационные площадки иногда используют расшифрованный из видео текст для публикации новостной заметки на сайте (это помогает в плане SEO-развития ресурса).

  • Видеоблогинг. Я уже упоминал субтитры ранее. Вот здесь они нужны как нигде более. Правда, на условном YouTube (и для YouTube) их созданием занимается либо робот, либо волонтеры. Но встречаются и заказчики, готовые заплатить за такую работу. 

  • Рекламисты (да и специалисты из других сфер) используют транскрибацию для анализа разговоров с клиентами, чтобы в последующем скорректировать скрипты общения и дополнить арсенал высказываний сотрудников техподдержки. 

Сайт и программа Speechpad (Спичпэд)

Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.

transcribation_2

Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!

Вообще, функционал  сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:

  • Голосовой набор текста с микрофона. Кстати, этот сервис один из лидеров по правильному распознаванию речи (на мой взгляд). Ввод текста идет синхронно “говорению”. Можно по ходу сразу же править текст и вставлять знаки препинания.
  • Транскрибация с аудиофайла или прямо с ролика Ютуб. Достаточно указать путь к аудиофайлу или видеоролику, включить транскрибатор, и начнется перевод. Правда, у меня почему-то не всегда получается это с первого раза. Может, потому что стоит Линукс.
  • Есть озвучивание субтитров. Да и простого текста. Используется голос Гугл переводчика. Немного коряво, но в принципе “слушательно”
  • Можно делать проверку произношения. Это пригодится тем, кто изучает иностранный язык

Transcribation 8

Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.

Онлайн-сервис dictation.io

Этот сервис для перевода аудио в текст не может подключать аудиофайлы или видеофайлы. Тут для транскрибации нужно проиграть аудиофайл на другом устройстве, и записать на микрофон в dictation.io.

Transcribation 9

Чем же хорош это сервис для перевода аудио в текст? Своей лаконичностью. Ничего лишнего! И, кстати, качество распознавания речи вполне себе на уровне! Удобно сохранять распознанный текст на компьютер. Сервис полностью бесплатный. Жалко только, что нельзя транскрибировать аудиофайлы

Способ 1. Google Docs

В Гугл документах есть функция «Голосовой ввод». Загрузить свой файл не получится, поэтому слушаем запись и диктуем текст, повторяя за спикером. Знаки препинания добавляем голосом, используя команды: точка, запятая, вопросительный знак и.т.д. 

Достоинства сервиса: 

  • самостоятельная расшифровка
  • набор текста 
  • автоматическое сохранение 
  • одновременный доступ к тексту с разных устройств, что очень удобно для коллективной работы. 

Недостатки: 

  • большое количество ошибок, которые впоследствии исправляются вручную 
  • прерывание записи
  • невозможность использования других вкладок и документов во время записи. 

Транскрибация выполняется следующим образом: 

Шаг 1. Открываем Google документ.

Шаг 2. Во вкладке «Инструменты» находим «Голосовой ввод». 

Шаг 3. Нажимаем на «Голосовой ввод», появляется кнопка записи.

Шаг 4. Нажимаем на эту кнопку. 

Шаг 5. Начинаем диктовать сообщение. 

Шаг 6. Редактируем текст, исправляем ошибки.

Сайт и программа RealSpeaker

Нужно знать, что сейчас оффлайн версии, то есть, программы для транскрибации ReaLSpeaker уже нет. Если Вы хотите пользоваться именно программой, то ищите старую версию.

RealSpeaker2

Сейчас же можно работать только в режиме онлайн-сервиса.

RealSpeaker1

Некоторым транскрибаторам эта программа (и сайт) очень нравится. Некоторым не очень. Я предлагаю Вам ответить на этот вопрос самостоятельно. Потестируйте немного ее, и узнаете.

В плюсы Реалспикера можно отнести то, что она работает с загруженными аудиофайлами. Есть много языков, которые RealSpeaker понимает. Из минусов – программа и сервис платные. Правда цена не очень высокая, но все-таки…

Программа Transcriber-pro

Еще одна офф-лайн профессиональная программа для расшифровки аудио и видео записей. С помощью Transcriber – pro Вы легко переведете аудио в текст!

Transcriber-pro_3

Эта программа для транскрибации достаточно удобна. Есть горячие клавиши. Можно загружать аудио и видеофайлы и их заниматься переводом аудио в текст. Одна из “фишек” Транскрибера – Про – это командная работа над проектом. Единственное, эта программа не умеет распознавать речь. Это узкоспециализированный инструмент, предназначенный только для транскрибации!

Онлайн сервис Dictation.io

Сервис dictation.io бесплатно переводит в текст звук, надиктованный в микрофон, или речь из файлов видео и аудио форматов.

Пользоваться сервисом очень просто:

  1. Выберите язык голосового ввода.
  2. Нажмите на кнопку в виде микрофона.
  3. Начните говорить в микрофон.
  4. В поле будет введен текст из вашего сообщения, или из воспроизведения речи из интернета (открытого в другой вкладке браузера) или из проигрываемого файла в мультимедиа плеере на компьютере.

dictation.io

Результат можно скопировать, скачать на компьютер в виде текстового файла, отправить на e-mail, воспроизвести в плеере (понадобится голосовой движок, установленный в Windows), отправить на печать.

Программа RSPlayer

Многие хвалят эту программу для профессиональной транскрибации.

Transcribation 10

Однако, сейчас официальный сайт этой программы не работает. Может в ближайшем будущем эта программа возродится вновь, но пока я сделать обзор на нее не могу. Если где-то найдете старую рабочую версию РСплеера, проверьте на вирусы. Рекомендую :)

Приложение Windows – VOCO

Эта программа распознавания речи профессионального уровня.

Voco

Основной функционал Windows-приложения перевода аудио в текст VOCO:

  • Голосовой набор текста с микрофона
  • Расстановка знаков препинания устными командами
  • Распознавание знаков препинания в аудиофайлах. Это круто!
  • Само-собой есть распознавание речи из аудиозаписей.
  • Есть сопряжение с Word
  • Можно подключать словари
  • Ну и есть свой, достаточно большой словарный запас

Короче, программа просто находка для профессионального транскрибатора! Но программа платная! Правда, есть демо-версия, в которой Вы можете ознакомиться с основным функционалом бесплатно. Правда, нужно подать заявку скачивание демо-версии Voco.

Программа Virtual Audio Cable

Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.

Transcribation 11

Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.

К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.

Гугл Документы

На последнем месте в списке стоят гугл документы. Но не на последнем месте по значимости. В гугл документах тоже есть голосовой ввод!

Transcribation 12

Кстати, этот голосовой ввод работает на удивление очень хорошо. Вы даже можете голосом расставлять знаки препинания. К сожалению, сюда нельзя подключить аудиофайлы для прямой транскрибации. Только “динамик-к-микрофону”. Качество перевода аудио в текст при этом может пострадать. Зато Гугл Документы совершенно бесплатны!

Какие способы существуют и какой лучше выбрать

Программные средства транскрибирования онлайн

Virtual Audio Cable

Я перерыл интернет и везде в основном советуют воспользоваться программой Virtual Audio Cable (инструкция как ей пользоваться ниже)

А что же предлагает нам данная программа и почему ее советуют? Ну вот представьте, что для того, чтобы голос был распознан, вам нужно сначала его воспроизвести, а потом в реальном времени передать в специальные транскрибаторы, которые и преобразуют звук в текст. Так вот если вы начнете включать звук через колонки и пытаться его передавать через микрофон, то будут огромные потери в качестве, так как у вас в комнате присутствуют шумы, вам нужно включать колонки на большую громкость. Микрофон может быть не самым лучшим. В итоге вы получите низкое качество из-за всех этих искажений. Качество будет идеальным, если вы сможете передать напрямую аудио или видео прямо в компьютере в транскрибатор. Как раз для этой цели и нужна программа Virtual Audio Cable.

Смысл ее работы в том, что она создает виртуальный кабель, с помощью которого, напрямую передает данные. Что нам и нужно!

Я попробовал сделать так как говорится в самом ролике и у меня получилось скачать программу, установить ее и сделать необходимые настройки. При включении всех настроек я понял, что у меня идет жуткое эхо и я целый час пытался разобраться почему у меня выдается дополнительный аудио канал.

В общем я потратил полдня на изучение информации и пришлось даже переустанавливать драйвера, так как они слетели из-за всех этих манипуляций. И теперь, я хочу поделиться, чтобы вам не пришлось тратить такое количество времени и чтобы у вас все получилось легко и просто.

Как сделать эмуляцию виртуального кабеля без программок

Сразу здесь выложу инструкцию как это сделать. Вам даже не потребуется устанавливать Virtual Audio Cable, так как можно обойтись простыми манипуляциями в настройках громкости. Сам я попробовал и мне понравилось, поэтому остановился на этом способе, так как он самый простой.


Нужно в настройках звука во вкладке запись включить стерео микшер и сделать его устройством записи по умолчанию. Таким образом звук сразу будет передаваться в компьютер и все так же останется воспроизведение через колонки. То есть вы сможете спокойненько слушать ваш файл и работать с ним. В видео много рассказывается о работе с сервисом «Блокнот для речевого ввода», о котором речь пойдет далее. Смотрите и обучайтесь.

Speechpad «Блокнот для речевого ввода» – сервис для надиктовки (транскрибирования текста)

Очень сильно хвалят вот этот сайт speechpad.ru так как он хорошо поддерживается, в нем есть все необходимые настройки.

В принципе разобраться с ним сможет любой за 10 минут, тем более, что там есть много инструкций. Хочу сказать свое мнение – мне он не подошел, так как когда идет транскрибация видео ролика, то существует буфер. Он длится примерно 20-30 секунд и видеоролик как бы перезагружается по истечение этого времени. И все было бы прекрасно, если бы перезагружаясь, ролик начинался с того места, на котором закончился, но он загружается на 1-2 секунды раньше и происходит повторение слов. Возможно это и не плохо, так как при перезагрузке может оборваться часть фразы, а потом она повторится и пойдет логично дальше, но для редактирования это ужасно неудобно. Нужно удалять повторы слов каждые 20 секунд и это отнимает много времени. Еще мне не понравилось качество. Конечно, в 95% сервис понимает речь, но вот эти 5% ошибок исправлять ой как не хочется. Порой даже не понимаешь что за слова он вставляет и откуда он их берет. Еще один минус в том, что если не успел сохранить текст или страница случайно перезагрузилась, то можно потерять весь результат, а если текст длинный, то придется начинать сначала и это ооочень раздражает.

В целом очень хороший сервис, многие пользуются и многие остаются довольны, особенно если речь четкая, так вообще никаких проблем не будет. Сервис бесплатный и внутри есть много инструментов, думаю, что вам понравится. Я попробовал этот сервис и продолжил искать дальше, более удобный инструмент.

Realspeaker – программа для транскрибирования и расшифровки

Нашел еще такую программу realspeaker почитал что о ней пишут, и подумал, что это скорее для тех, кто профессионально надиктовывает тексты. Программа для перевода звука в текст пригодится, если вы работаете транскрибатором и зарабатываете на этом.

Что она умеет:    

  • Голос в текст может обработать любой длины;
  • Транскрибирует аудио и видео в текст;
  • Большой объем данных и глубокое обучение;
  • Облачные вычисления и API по запросу;
  • Ввод данных в любой редактор или сайт;
  • Мульти-платформенность и мультиязычность;
  • Расшифровка с учетом акцентов и диалектов;
  • Простая и доступная система оплаты.

Из всего этого перечня следует, что если вы зарабатываете на текстах, то она вам возможно поможет. Ну а для меня она не подходит, так как платная и я пошел искать дальше.

Google Translate – просто переводчик и не только

Этого монстра знают если не все, то почти все! Находится он по адресу translate.google.ru. Все очень просто, заходите на сайт, нажимаете на микрофон и запись и мгновенная транскрибация пошла. Далее можно просто копировать и вставлять куда нужно. Вот такой вот переводчик на английский или переводчик звука в текст.

Как известно Гугл – очень хорош. Это компания, которая постоянно совершенствует свои технологии в создании интернет-поиска, облачных вычислений и дополнительные сервисы. Совсем недавно они анонсировали сервис по переводу голоса в текст, а сегодня он уже является самым популярным. Почему? Потому что все телефоны – андроиды начали использовать голосовые команды и вообще это очень удобно. А гугл изначально уже встроен во телефоны.


И вот еще почему, потому, что гугл делает свои продукты на высоком уровне. Что все это значит? Да то, что при нажатии на одну кнопку вы получаете максимально продуманный и качественный сервис без лишнего мусора. Гугл вложил огромные деньги в свои распознаватели голоса и вывел свой продукт на мировой рынок, и теперь на всех языках (в том числе русский язык) можно транскрибировать свой голос и переводить в любой другой язык.

В общем Google Translate наиболее качественно захватывает речь из звука и этим уже можно пользоваться, расставив знаки препинания. Пользуйтесь на здоровье, к хорошему быстро привыкаешь.

Из минусов могу отметить, что на данный момент можно записывать текстовый документ только 5000 символов длиной. Если вам необходимо надиктовать или распознать несколько предложений, то вам этот инструмент подойдет из-за своей простоты. Но если у вас более длинные тексты и вы хотите иметь возможность с Гугловской точностью транскрибировать текст любой длины то вам больше подойдет следующий инструмент.

Google Docs – самый универсальный инструмент перевода звука в текст онлайн

Почему этот инструмент лучше? Это же просто онлайн документ. Или не просто?

Вся фишка в том что он:

  • позволяет сохранять текст моментально и он никуда не исчезнет;
  • может записывать бесконечно, хоть на ночь поставьте аудиокнигу, на утро проснетесь и все будет ок;
  • использует голосовой модуль google, а он хорош (про это уже говорилось выше);
  • позволяет прямо там отредактировать и сохранить;
  • работает онлайн на любых устройствах.

В связи со всем вышеперечисленным, на мой взгляд это самый адекватный и удобный инструмент, который можно использовать для транскрибации звука в текст.

Как им пользоваться?

  1. Заходите в docs.google.com
  2. перед вами открывается список документов
  3. создаете новый документ
  4. жмете инструменты -> голосовой ввод или Ctrl+Shift+S
  5. нажимаете на микрофон

Всё! Транскрибация аудио в текст пошла! Из всех инструментов мне этот понравился больше всего. Никаких отвлекающих штуковин, там просто и понятно.

Чтобы сделать перевод в текст аудио файла или видео с youtube, просто сначала запустите файл, а потом перейдите в окошко документа и нажмите запись. Ждите и смотрите, как на ваших глазах происходит чудо. Потом останется отредактировать и оформить и текст готов!

Чтобы добавить в текст знаки препинания, используйте эти команды:

  • “точка”;
  • “запятая”;
  • “восклицательный знак”;
  • “вопросительный знак”;
  • “новая строка”;
  • “новый абзац”.

Примечание. Ввод знаков препинания поддерживается на английском, испанском, итальянском, немецком, русском и французском языках.

Как и чем пользоваться если нужно надиктовывать голосом?

Рассмотренные выше варианты программных средств абсолютно так же подойдут для голосового ввода. Единственное отличие будет в том, что нужно будет вместо микшера использовать запись через микрофон.

  • Можно просто надиктовывать свои мысли, чтобы не терять времени на писанину и потом быстренько отформатировать;
  • Можно надеть наушники и слушая, воспроизводить так как вам больше нравится в микрофон;
  • Можно пользоваться специальными приложениями на телефоне.

Нужно надиктовать быстро, а под рукой только мобильный телефон?

Если у вас iPhone

Очень удобно, когда нет под рукой компьютера и вам в голову пришли мысли, которые кровь из носа нужно записать, иначе пройдет 2 минуты и вы забудете, что хотели сказать. К сожалению это бывает очень часто и как хорошо, что мы теперь можем носить сотик вездеи с легкостью перевести голос в текст. Пришла мысль – запиши аудио. Это быстро и удобно.

Источники

  • https://avbessonov.ru/perevod-audio-v-tekst-12-programm-dlya-transkribacii/
  • https://vellisa.ru/voice-to-text-on-service-or-program
  • https://mobila.guru/faqsingle/7-sposobov-perevesti-audio-v-tekst/
  • https://timeweb.com/ru/community/articles/chto-takoe-transkribaciya-i-kak-na-ney-zarabatyvat
  • https://web-copywriting.ru/frilans/transkribatsiya-5-prostyh-i-proverennyh-sposobov-perevoda-rechi-v-tekst/
  • https://mentors.team/hi-tech/komputer/transkribirovanie-audio-v-text-onlain.html

Понравилась статья? Поделиться с друзьями:
Bazliter.Ru
Adblock
detector