Набор текста голосом: проверенные программы и онлайн-сервисы

Развитие технологий распознавания голоса даёт пользователям новые возможности для взаимодействия с различными устройствами. Мы постепенно привыкаем к голосовым помощникам, но с помощью голоса можно не только узнавать погоду или включать музыку, но и набирать большие объёмы текста.

Что такое голосовой ввод текста

Голосовой ввод текста — это функция, основанная на технологии распознавании речи. Программа голосового ввода воспринимает произнесенные слова и преобразует их в письменный текст.

Не стоит путать голосовой ввод с голосовым управлением. Вторая технология упрощает пользователю выполнение каких-либо действий на устройстве — например, включает музыку или запускает приложения без помощи рук. Голосовой же ввод решает более узкую задачу — набор текста с помощью голоса.

Голосовой ввод применим в разных ситуациях:

  • для перевода аудиофайлов в текстовый формат — например, для расшифровки интервью или записи лекции;
  • для сохранения в файл большого объёма устного текста, ведь говорим мы намного быстрее, чем печатаем;
  • для преодоления физических ограничений, при которых нет возможности набирать текст на клавиатуре.

Для использования голосового ввода нужен лишь микрофон. Владельцы ноутбуков могут использовать микрофон, встроенный в аппарат, а владельцы стационарных компьютеров — тот, что есть в веб-камерах, которые подключаются к ПК.

В принципе, для голосового ввода подойдёт любой микрофон, если говорить чётко и не очень быстро. Особой настройки оборудования тоже не требуется. Достаточно убедиться в том, что система воспринимает звук через микрофон.

Проверка и настройка микрофона

Прежде всего подключите микрофон к компьютеру. Если вы хотите использовать встроенное устройство ноутбука или веб-камеры, то ничего подключать не надо. Затем найдите на панели уведомлений значок динамика. Он может быть спрятан под галочкой.

значок динамика в трее

Кликните по значку динамика правой кнопкой и выберите пункт «Записывающие устройства». Это откроет список оборудования, которое можно использовать для записи звука. В этом списке должен быть и ваш микрофон вне зависимости от того, подключен он отдельно или встроен в ноутбук.

выбор устройства записи

Если в списке записывающих устройств пусто, кликните на свободном месте правой кнопкой мышки и отметьте пункты «Показывать отключенные устройства» и «Показывать отсоединенные устройства». После того как микрофон появится в списке, откройте правым кликом его меню и выберите опцию «Включить». Также убедитесь, что он назначен устройством по умолчанию.

включение микрофона

Удостовериться в том, что система воспринимает звук с микрофона, очень просто: скажите в него что-нибудь. Если справа появляются зелёные полосы, значит всё готово к голосовому вводу. Попробуйте говорить тише или громче — вы заметите, как количество зелёных полос меняется в зависимости от громкости голоса.

индикатор громкости голоса

При желании можно попробовать изменить стандартные параметры микрофона, добившись некоторого улучшения качества записи. Для этого:

  1. Кликните правой кнопкой по микрофону.
  2. Откройте его свойства.
  3. Перейдите на вкладку «Уровни».вкладка уровни
  4. Поставьте максимальные значения громкости и усиления.
  5. Откройте вкладку «Улучшения».
  6. Включите подавление шума и эхо.подавление шума и эхо

Количество опций для улучшения зависит от того, какая звуковая карта установлена на вашем компьютере. К сожалению, некоторые из них не имеют вообще никаких параметров для настройки, кроме управления громкостью и усилением. Но для голосового ввода это не критично — главное, чтобы система в принципе воспринимала звук через микрофон.

Программы для голосового ввода

Если вы планируете пользоваться голосовым вводом постоянно, то самое удобное решение — установить одну из программ, которая предоставляет такую возможность.

Dictate для MS Office

В 2017 году разработчики Microsoft выпустили дополнение Dictate. Оно доступно для бесплатной установки на Windows 8.1/10 в пакетах MS Office 2013 и старше. После инсталляции Dictate в Word, PowerPoint и Outlook появляется дополнительный раздел, позволяющий включить микрофон и использовать распознавание речи для начитки текста.

Спустя некоторое время Microsoft прекратила поддержку дополнения, интегрировав функцию распознавания речи в Office 365 и Windows 10. Если вы используете эту версию пакета приложений, то можете без труда наговорить любой текст через микрофон.

Как это сделать:

  1. Откройте Word.
  2. Нажмите сочетание клавиш Win+H.
  3. Кликните по значку микрофона и диктуйте текст.

Распознавание работает только в том случае, если в «Параметрах» включена соответствующая функция:

включение распознавания голоса в word

Несмотря на заявленную поддержку русского языка, качество его распознавания оставляет желать лучшего. Программа правильно записывает простые фразы, но на сложных предложениях часто спотыкается. Поэтому не стоит даже надеяться на то, что вы будете говорить безостановочно — для получения приемлемого результата необходимо делать паузы и чётко проговаривать все окончания. Распознавание аудиофайлов здесь не поддерживается — для этого нужны другие программы.

Расширение Dictate больше нельзя скачать с официальной страницы Microsoft, но оно осталось на других сайтах. Однако загрузка из сторонних источников может быть опасной из-за вирусной угрозы. Если у вас нет подписки на Office 365, то рекомендуем использовать другие программы для голосового набора текста.

MSpeech

MSpeech —  простая программа для обработки речи и превращения голосового потока в текст, способная распознавать более 50 языков, среди которых русский.

После установки и запуска она сворачивается в системный трей. Чтобы вызвать её оттуда, кликните правой кнопкой мышки по иконке программы и выберите опцию «Показать».

управление MSpeech

Для управления записью здесь используются две кнопки — «Начать» и «Остановить».

Самые важные функции программы скрыты в её настройках. Нажмите на одноимённую кнопку, чтобы перейти в этот раздел. Здесь вы можете:

  1. Включить автозапуск приложения вместе с системой.
  2. Выбрать основной и дополнительный языки распознавания.
  3. Задать собственные команды для запуска других программ. Например, по ключевому слову «интернет» будет открываться Mozilla Firefox.
  4. Назначить горячие клавиши для управления записью.
  5. Включить передачу текста в другие программы: редакторы, офисные приложения, браузеры и т.д.

настройки MSpeech

Для работы MSpeech требуется подключение к Интернету, так как программа использует Google Voice API.

Speechpad

Speechpad — это сервис, который можно использовать в браузере или интегрировать с операционными системами Windows и Linux для добавления голосового ввода в другие программы — например, «Блокнот» или офисные приложения.

Если вы хотите пользоваться голосовым вводом в Google Chrome, в том числе набирать сообщения и заполнять другие формы, сделайте следующее:

  1. Установите в Chrome расширение Speechpad.
  2. После инсталляции кликните по значку дополнения на верхней панели, чтобы открыть его настройки.
  3. Выберите язык голосового ввода.
  4. Нажмите «Save» и перезапустите браузер.код и язык ввода в Speechpad
  5. Откройте любой сайт с текстовой формой. Это может быть поисковая строка Яндекса или диалог в соцсети.
  6. Кликните по полю правой кнопкой и выберите опцию «Speechpad».

Если голосовой ввод поддерживается, то форма окрасится в розовый цвет. Также вам нужно дать разрешение на использование микрофона, после чего вы можете диктовать текст.

голосовой ввод текста вконтакте

Чтобы расширить действие сервиса на другие приложения Windows, необходимо установить дополнительный модуль интеграции.

  1. Скачайте модуль и распакуйте архив.
  2. Запустите файл install_host.bat.запуск install_host.bat
  3. Зарегистрируйтесь в голосовом блокноте.регистрация в голосовом блокноте
  4. Авторизуйтесь в кабинете пользователя и нажимаем на кнопку «Включить тестовый период».
  5. Откройте сайт голосового блокнота.
  6. Отметьте пункт «Интеграция с OS».
  7. Нажмите «Включить запись».
  8. Запустите любое приложение с текстовым редактором (например, Word) и диктуйте текст.включение интеграции с операционной системой

Интеграция с системой — платная услуга. Проверить её работу можно без покупки лицензии, но для постоянного использования требуется подписка: месяц — 100 рублей, 3 месяца — 250 рублей, 1 год — 800 рублей.

Voco

Voco — платное Windows-приложение для распознавания речи и преобразования её в текстовый формат. Оно даже поддерживает расстановку знаков препинания с помощью специальных команд.

голосовой набор текста в Voco

Для проверки орфографии эта программа использует встроенные словари. Кроме того, вы можете научить её новым выражениям, открыв доступ к вашим письмам и документам.

повышение точности распознавания

Стоимость лицензии:

  • Basic — 1718 рублей. Бесплатные обновления в течение 1 года. Продление подписки на апдейты — 559 рублей ежегодно.
  • Professional — 14 136 рублей. Продление подписки на обновления — 4937 рублей ежегодно.
  • Enterprise — от 50 749 рублей. Продление подписки на обновления — 17 786 рублей ежегодно.

Для домашнего использования оптимально подходит Voco.Basic. Однако в ней нет распознавания аудиозаписей и тематических словарей. Эти возможности доступны только в старших версиях.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без  установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.вход в аккаунт google
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».открытие документов гугл
  6. В поле «Создать документ» нажмите «Пустой файл».создание пустого файла

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

нажмите кнопку и говорите

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

ввод текста в Speechpad

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

VoiceNote

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

TalkTyper

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Voice Notepad

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

CompConfig.ru
Добавить комментарий

  1. Олег

    Не всегда с собой ноут. Или ваш ПК без микрофона.
    Я пользуюсь смартфоном… Андроид-приложение Голосовой блокнот.
    Но замечу, что на смарт можно установить Хром, и использовать всё то, что с ним работает из числа описанного в статье.

    Ответить
  2. Инесса

    Очень полезные статьи! добавила ваш сайт в избранное. Я начинающий пользователь.

    Ответить
  3. Инесса

    1. Скажите,а почему когда захожу в Voice Notepad микрофон работает а проговариваемые слова появляются и тут же исчезают.
    2. у Speechpad вставляемые из письма регистрационного логин и пароль не определяют как пользователя.
    3. только Voice Notepad сразу запустился » О СЧАСТЬЕ»!
    и TalkTyper!
    и Google Docs!

    Спасибо за ваш сайт а то я 8 часов на поиски потратила и вот только благодаря вашему сайту нашла то что сразу установилось и начало работать

    Ответить
  4. Ольга Медведева

    >> почему когда захожу в Voice Notepad микрофон работает а проговариваемые слова появляются и тут же исчезают

    Возможно, вы используете не последнюю версию Google Chrome или на работу сервиса влияют расширения, установленные в браузер.

    Ответить
  5. Павел

    Скажите, есть ли подобная программа, специализированная для ввода цифр?
    Допустим, нужно оцифровать старые таблицы цифровых данных или чей-то полевой журнал. И голосовой ввод кажется самым эффективным. То есть кроме чисел ничего (или почти ничего) вводить не нужно.

    Ответить
    1. Дмитрий

      Я не встречал таких. Но разве для серьезного дела нельзя ли озвучивать только цифры. Или Вы хотите озвучивать цифры и одновременно вести светскую беседу с кем-нибудь? ))

      Ответить
      1. Павел

        Спасибо за комментарий.
        Нет, речь не про светскую беседу.
        В прежние времена ввод полевых журналов делали вдвоём под диктовку.
        Кое-что надо вводить и сейчас. Есть и печатные страницы, которые не хочется доверять OCR.
        Думалось, что появилась программа, которая сама с голоса заполнит таблицу:следит за количеством знаков, корректно отделяет целую часть от дробной, понимает, когда начинать новую строку…
        Надеюсь, объяснил.

        Ответить