Голосовой ввод. Голосовой ввод текста: какой программой нужно воспользоваться? Как преобразовать аудио в текст


Всем, кто часто использует компьютер, знакома проблема с набором длинных текстовых сообщений. Особенно часто приходится набирать тексты студентам, блогерам, журналистам и другой пишущей братии. Чтобы написать одну полноценную статью требуется пять-шесть часов напряженного труда, а для узкопрофессиональных текстов это время значительно увеличивается. Для тех, кто не любит набирать много букв на клавиатуре, придуманы специальные программы, позволяющие преобразовывать звуковые сообщения в текстовые файлы. Подобные возможности можно найти в специальных приложениях, разработанных для различных устройств. «Голосовой блокнот» — общее название для прог, превращающих звуки в буквы, и позволяющих значительно сократить время работы над текстом. Его использование значительно облегчит труд автора: большая часть работы будет сводиться к поиску и обработке материала будущего текста, а не к его набору. Давайте ознакомимся с возможностями программы для распознавания голосовых сообщений и протестируем ее на адекватность и полезность.

Знакомимся с голосовым блокнотом

Итак, чем же может нам помочь аудио блокнот? Разработчики утверждают, что он может выполнять такие функции, как:

  • создание голосовых заметок;
  • сохранение звуковых сообщений в локальном месте собственного устройства или же на облаке Гугл;
  • поддержка списка заменяемых слов;
  • расстановка знаков препинания.

Пользователь может использовать различные инструменты для расширения функций блокнота. К примеру, можно настроить ввод заглавных букв, упростить распознавание текста, делать откат ввода по специальной команде и многое другое. Общий смысл заключается в том, чтобы не только пользоваться аудио тетрадью, но и настроить его под собственный стиль речи. В этом случае конечное редактирование текста сведется к минимуму.

Перед установкой

Голосовой блокнот является бесплатным онлайн-сервисом, который предоставляется бесплатно в магазине Google. Данное приложение является расширением Chrome, поэтому работать оно будет лишь в этом браузере. Перед установкой ваш собственный Google Chrome необходимо обновить: расширение speechpad работает лишь в последних версиях данного браузера.

Также очень желательно иметь собственный аккаунт Гугл. Завести его очень просто, для этого потребуется лишь действующий почтовый ящик. Лучше всего подойдет почта gmail, которая также является разработкой Гугл. Но если вы категорически не настроены иметь почтовый ящик с расширением gmail.com, можно использовать другой. Когда все готово, можно приступать к скачиванию программы.

Установка голосового блокнота

Найденная страничка будет иметь такой вид:

После установки (пара секунд) в меню возможностей Гугл появляется вот такая иконка:

Вот это смешной смайлик с открытым ртом и является нашей программкой. После его нажатия открывается информационная страница с описанием возможностей голосового блокнота:

Внизу этой странички имеется поле для работы с блокнотом.

Чтобы начать работу с голосовым блокнотом следует проверить собственный микрофон и нажать вот эту кнопку:

В поле 1 будет транслироваться онлайн запись вашего голосового сообщения. После окончания записи текст будет перенесен в поле 2, где его можно будет отредактировать стандартными средствами Word.

Начало работы

Итак, приступаем. Жмем «Включить запись». При правильно работающем микрофоне она загорается оранжевым цветом:

После отключения записи текст появляется в нижнем поле, и будет иметь такой вид:

Запятые и точки следует проговаривать, их алгоритм программы распознает «на звук» и ставит там, где это необходимо автору. Наше сообщение получило свой знак препинания после того, как было сказано слово «точка».

Если присмотреться, можно увидеть, что фраза написана с ошибкой: так алгоритм распознал речевое сообщение. Исправить ошибку можно собственными средствами блокнота или же после переноса текста на лист Office Word.

Как можно видеть, блокнот передает речевое сообщение достаточно правильно. А чтобы сработаться с программой на «отлично», следует выполнять несколько простых рекомендаций:

  1. Не спешите и старайтесь медленно и четко выговорить каждое слово.
  2. Если в первом поле текст завис – не спешите диктовать дальше. аплгоритм собьется, и предложение нужно будет диктовать заново. Лучше остановиться и дать программе возможность вас догнать.
  3. Откорректируйте работу микрофона так, чтобы он не записывал посторонние звуки – и ваше дыхание в том числе.
  4. Для редактирования текста лучше всего использовать поле 2. делать это следует после успешной записи каждого предложения. Выключать запись не нужно, но и слишком долгие паузы делать не следует: затяжная тишина может выбить запись полностью. После редактирования предложения или абзаца включайте запись для дальнейшей диктовки текста. Второй вариант – начитать текст полностью, а затем редактировать его средствами Word. Конечно, каждый выбирает собственный стиль работы. Попробуйте оба и выберите свой.

Знаки препинания – это отдельная медаль разработчикам.

Если выговаривать их четко и размеренно, то программа не спеша расставит точки, запятые, двоеточия и восклицательные знаки по вашей команде.

Голосовой блокнот на мобильном устройстве

Кроме стандартного использования голосовой набор текста можно использовать в любом мобильном устройстве. Для этого следует активировать свою учетную запись в Гул и установить приложение прямо в браузер Хром. После этого при запуске хром на мобильном устройстве Speechpad будет включаться по первому запросу.

Попробуйте сами это замечательный сервис и поделитесь своими впечатлениями в комментариях!

Сегодняшняя статья является продолжением прошлой статьи о приложениях текста. В сегодняшней статье я познакомлю вас с приложением, которым я пользуюсь и пользуются многие блогеры, программа называется speechpad или голосовой блокнот.

Каждому блогеру приходится очень много времени проводить с текстами, писать статьи, комментарии, отзывы- это занимает достаточно много времени, например чтобы написать статью вручную, потребуется примерно 5- 6 часов в зависимости от объема и качества статьи.

С помощью голосового блокнота эта задача выполняется в течение 20- 30 минут, также эта программа будет полезна тем у кого не высокая скорость печатания или же кому проще высказать мысль чем придумать и записать вручную.
Голосовой блокнот- это onlain-сервис причем, разработка Google Chrome, соответственно это приложение работает только в Google Chrome последних версий, поэтому перед установкой данного приложения, желательно обновить браузер.

Установка

Установить это приложение можно через Google маркет заходим: Настройки ==> Дополнительные инструменты ==> Расширения. Внизу страницы нажимаем- «Еще расширения» и попадаем в Интернет- магазин Chrome. В поисковой строке вводим speechpad и нажимаем Enter. Вас перебрасывает на страницу голосового блокнота. Чтобы долго не блуждать, я подготовил вам ссылочку, по этой ссылке вы сможете запустить это приложение у себя на компьютере в своем браузере. Запустить приложение!

Для начала нужно зарегистрироваться в сервисе здесь все очень просто, вводите данные и самое главное е-mail на который будет выслан пароль. Почтовые ящики на Rambler не приветствуется! Как завести ящик на gmail смотрим здесь. Сервис бесплатный, после регистрации вы можете свободно им пользоваться.

Начало работы

Чтобы начать работать с голосовым блокнотом, нужно в первое посещение, дать разрешение браузеру использовать микрофон вашего компьютера. Для перевода голоса в текст понадобится выносной микрофон, даже если у вас ноутбук и звуковые колонки, если вы собираетесь переводить аудио или аудио из видео формата в текст.

Настройки speechpad несложные, достаточно поставить несколько галочек в чекбоксы, выставить нужный вам язык. После этого можно начинать работать с приложением. Данное приложение распознает знаки препинания и цифры озвученные голосом и даже новое предложение, после точки, начинается с заглавной буквы.

Вообще, в кабинете пользователя есть много информации по работе с приложением: текстовые пояснения и видео уроки.После первого использования, результаты впечатляют всех! Старайтесь говорить четко и внятно, не смазывая и не «глотая» слова. В противном случае, вам придется много править текст.

Cохранение текста

После того как текст набран, редактировать его лучше здесь же, в блокноте для речевого ввода и только затем переносить Word или другой редактор. Периодически, во время записи следует поглядывать в результирующее поле, не всякие объемы текста помещаются в голосовом блокноте.

При необходимости можно отключить запись, скопировать и сохранить проделанную работу и продолжать наговаривать текст. При определенной тренировке, после написания нескольких статей или нескольких текстов, когда вы немного освоитесь с данным предложением, работа с ним вам будет доставлять только удовольствие.

Давайте еще раз повторим плюсы использования данной программы:

  • Экономия времени.
  • Блокнот может расставлять знаки препинания.
  • Есть возможность перевести аудио в текст.
  • Возможность писать текст с видео роликов.
  • Приложение бесплатно

Есть еще много дополнительных и интересных функций, например блогерам будет очень интересно с помощью данного приложения диктовать комментарии на других блогах, работать с английским или другими языками и так далее.

С Уважением, Александр Клюев.

SpeechPad – это интересный сервис (так называемый голосовой блокнот) для преобразования голоса в текст с помощью браузера Google Chrome. Он доступен для всех операционных систем: Windows, Linux и Mac, есть специальное приложение и для Android.

Распознавание обычной разговорной речи и последующая ее конвертация в печатный текст является достаточно интересной технологией, совершенствованием которой занимаются высококлассные технические специалисты во всех странах мира. Возможно, скоро русская речь будет преобразовываться в текст практически безошибочно, что достаточно сильно изменит наш способ коммуникации с компьютером, а также с современными высокотехнологичными гаджетами и приборами.

Возможности

Голосовой блокнот предназначен для ввода информации в специальное «Результирующее поле» на сайте и в текстовые поля Google Chrome. Для этого надо скачать и установить соответствующее расширение в браузер. К тому же можно добавить модуль интеграции с Microsoft Windows, чтобы использовать голосовой ввод в любом приложении.

Вот на что способен этот сервис:

  • распознавать речь через внешний микрофон;
  • понимать не только русский, но и армянский, грузинский, украинский и многие другие языки;
  • выполнять голосовые команды;
  • добавлять знаки пунктуации с помощью мыши;
  • использовать режим управления заглавными буквами;
  • транскрибировать звуковые и видео файлы, которые записаны в формате html5 или загружены на Youtube;
  • создавать субтитры в реальном времени;
  • копировать распознанный текст в буфер обмена;
  • автоматически переводить произнесенный текст на выбранный язык.

Плюсы и минусы

Давайте рассмотрим сильные и слабые стороны этого чрезвычайно полезного для многих людей приложения.

  • быстрое освоение, достаточно буквально пары минут;
  • режим отправки надиктованного текста во многие социальные сети;
  • сервисом удобно пользоваться во время прогулки, или когда руки заняты, используя смартфон.

  • для улучшения качества распознавания желательно купить профессиональный микрофон;
  • вероятность правильной конвертации стандартной речи в районе 80-95%, если применяются специальные термины;
  • необходима корректировка полученного текста, в том числе самостоятельная расстановка знаков препинания.

Да, пока не удается достичь 100% точности преобразования голоса в текстовый документ. Тем не менее прогресс не стоит на месте, и даже сейчас голосовой блокнот очень полезен некоторым людям, так что не стоит от него требовать невозможного. А при хорошей дикции легко достичь правильного распознавания почти всех фраз и законченных предложений.

Как пользоваться

Существует и другой способ использования приложения: достаточно зайти на сайт https://speechpad.ru/ , пролистать страницу вниз, включить запись и получить готовый текст. Здесь также удобно протестировать все возможности голосового блокнота, которых довольно много, и посмотреть обучающие видеоролики.

Скачать

У нас можно скачать последнюю версию SpeechPad с официального сайта.

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели , например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

При работе в интернете часто требуется печатать тексты. Этим занимаются не только блоггеры и копирайтеры, необходимость написания текстов появляется у маркетологов, вебмастеров, оптимизаторов и профессионалов из других областей.


Даже составление ТЗ для копирайтера вынуждает нажимать клавиши на клавиатуре.

Программы для голосового набора текста облегчают эту задачу. Кто-то скажет, что созданы они для ленивых и неопытных и отчасти это будет верно. Дело в том, что софт недостаточно хорошо распознает отдельные слова и приходится четко проговаривать всё, а это снижает скорость набора текста.

Набор текста на компьютере голосом

Не зря же был запущен . Пользователям не нужно нажимать кнопки, они могут просто произнести нужный запрос.

Четко проговорить несколько слов не сложно, поэтому для данной цели это подходит. Что касается написания статей, то придется потренироваться. Также, стоит попробовать несколько программ, чтобы выбрать подходящий вариант.

Заходите на , выбираете язык и жмете на значок с микрофоном:

После этого, запрашивается разрешение на использование микрофона. Он может быть отдельным или встроенным в вебкамеру:

Разрешаете браузеру использовать микрофон и начинаете произносить слова. Они сразу же появляются в основной части страницы, откуда их можно легко скопировать и перенести, например, в Word.

2. Голосовой набор онлайн на . Этот сервис отличается наличием дополнительных кнопок. С их помощью можно быстро очистить поле ввода текста, а также перенести готовый текст на Google Диск, скачать в формате txt или отправить по электронной почте:

В целом, система ничем не отличается. Заходишь на сайт, выбираешь START DICTATION (после выбора языка) и появляется уведомление, где требуется дать разрешение на использование микрофона:

Интерфейс простой, а дизайн приятный. Именно с этим сервисом удается добиться хорошего распознавания, но отзывы двоякие.

3. Набор текста голосом с . Русский язык в этом иностранном сервисе распознается без проблем. Функционала в нем намного больше. Полученный текст проверяется на знаки препинания и ошибки. Очень удобно, что слова, которые программа не смогла распознать точно, подсвечиваются.

При нажатии на них, можно выбрать другие предложенные варианты:

Также здесь есть инструмент для быстрого перевода текса на любой язык или его воспроизведение. Отправлять документ можно разными способами. Единственное неудобство, это после ввода текста голосом, требуется нажимать на стрелку, чтобы перенести его во второе поле.

4. Программа голосового набора . Несмотря на скромный дизайн, этот сервис идеально справляется со своей задачей и предлагает самый продвинутый функционал. На сайте есть видео уроки по использованию системы, а также предлагается скачать плагин для браузера.