→ Речевой синтезатор. Что такое синтезаторы речи? Лучшие синтезаторы речи

Речевой синтезатор. Что такое синтезаторы речи? Лучшие синтезаторы речи

Современные технологии позволяют вам генерировать речь прямо из печатного текста. Только представьте, что вы можете набрать текст, который потом будет произнесен выбранным вами голосом, с выбранной вами интонацией и скоростью. И это не фантастика, это реальность.

Что такое синтезатор речи?

Синтезаторы речи Text to Speech (TTS) - специальные программы, позволяющие формировать речевой сигнал (речь, голос) по печатному тексту. Первое упоминание о синтезе речи относится к X веку. В конце XVIII века ученый Христиан Кратценштейн, создал модель речевого тракта человека, способную произносить пять гласных звуков (а, э, и, о, у).

Первые синтезаторы речи на базе вычислительной техники появились в конце 1950-х годов. Они звучали довольно примитивно, и разобрать такую речь можно было с большим трудом. Работы над улучшением качества синтезированной речи продолжаются. Уже сегодня речь, генерируемую современными системами синтеза реча, порой не отличить от реальной человеческой речи.

Зачем нужен синтезатор речи?

Синтезатор речи может вам пригодиться во многих случаях, например:
  • Во время путешествия - просто наберите любую фразу, и программа ее произнесет на нужном вам языке.
  • Чтобы читать электронные книги, тексты, документы - вы занимаетесь своим делом, а программа читает вам вслух.
  • Для изучения иностранных языков - отличная возможность бесплатно тренировать произношение и разговорные навыки.

Синтезатор речи A1 SpeechTRON

A1 SpeechTRON - синтезатор английской речи из текста. Может использоваться для чтения заметок, текстовых документов, электронных книг, и других текстовых материалов (форматы: текст, RTF, DOC). Речевой синтезатор (TTS) можно также использовать при изучении английского языка. Программа полностью поддерживает Microsoft TTS SAPI 4.0, имеет полностью настраиваемый интерфейс, высокое качество звука, настройки скорости чтения, запись в файл. Имеется поддержка пользовательских и дополнительных словарей.

Синтезатор речи ReadPlease

ReadPlease - синтезатор английской речи из текста. Может использоваться для чтения текстов, буфера обмена, текстовых документов, электронных книг, и других текстовых материалов (форматы: текст, RTF, DOC). Речевой синтезатор (TTS) можно также использовать при изучении английского языка. Программа после запуска размещается в трее и управляется горячими клавишами. Может пристыковываться к различным окнам или рабочему столу. В платной версии имеется поддержка дополнительных языков, стандарта AT&T Natural Voices, дополнительных возможностей. Программа существует в двух версиях: бесплатная и платная. Имеется поддержка пользовательских и дополнительных словарей.

Синтезатор речи ReadingBar

ReadingBar - синтезатор речи из любой web-страницы. Это панель для браузера Internet Explorer, которая после установки встраивается в браузер и позволяет читать любые web-страницы. Вы можете записать голос в wav или mp3 файл. Кроме произношения текста, ReadBar позволяет также подсвечивать слова, переводить их на 4 языка, выводить толкование слов из словаря. Будьте внимательны, ReadingBar не будет работать на операционной системе Vista и в браузере Internet Explorer 7.

Синтезатор речи FlameReader

FlameReader - многофункциональный синтезатор речи, который позволяет генерировать речь из любого текста или файла. Достаточно выделить текст в любой программе или в любом документе, и FlameReader сразу же произнесет его. Программа имеет множество возможностей: запись голоса в файл (wav и mp3), чтение e-mail, документов, web-страниц, озвучивание PowerPoint-презентаций, перевод текстов. Вы всегда можете настроить FlameReader удобным для вас образом, выбрав голосовой движок, скорость воспроизведения, и прочие параметры. FlameReader добавляет панель навигации в пакет программ Microsoft Office, упрощая работу с ней. В комплекте с программой поставляется удобный редактор звуковых файлов.

Синтезатор речи Alive Text to Speech

Alive Text to Speech - многофункциональный синтезатор речи, позволяющий не только произносить слова, тексты и файлы, но и записывать (конвертировать) их в звуковые файлы (MP3, WAV, OGG, VOX). В комплект входит панель для браузера Internet Explorer, позволяющая озвучивать любые web-страницы и конвертировать их в звуковые файлы.

Синтезатор речи YeoSoft Text to MP3 Speaker

YeoSoft Text to MP3 Speaker - многофункциональный синтезатор речи, позволяющий озвучивать тексты и создавать аудио-книги в различных звуковых форматах. Это эффективный инструмент для изучения иностранных языков. Поддержка технологий SAPI 4 и 5, файлов DOC и PDF, 10 языков, работы с несколькими файлами одновременно. Возможность добавления xml-тегов в текст для задания управления произношением. Настройки голоса: громкость, скорость, выбор голосового движка.

Синтезатор речи TextAloud

TextAloud - программа для генерации речи из текста и файлов. Генерируемую речь можно как слушать при помощи компьютера, так и записать в виде mp3 или wma файла. Синтезатор поддерживает следующие типы файлов: DOC, PDF, и HTML. В комплект с программой входит также Toolbar для Internet Explorer, Firefox, и Outlook.

Синтезатор речи Verbose

TextSound - конвертер текста в звуковые файлы (wav и mp3). Эта небольшая программа поможет вам быстро сконвертировать текст в речь и сохранить ее в виде звуковых файлов. Программа позволяет обрабатывать сразу несколько файлов и создавать список заданий.

Синтезаторы речи онлайн – это полезная находка, о которой раньше можно было только мечтать. Они позволяют озвучивать любой заданный вами текст, регулируя голос, тембр, темп и др. Изначально утилита была рассчитана на людей с плохим зрением, которые не имеют возможность читать текст с монитора. Сейчас же она часто используется как вспомогательный инструмент в изучении иностранных языков, позволяя воспринимать речь на слух и привыкать к правильной расстановке ударений и интонаций. Также для удобства с помощью синтезатора можно слушать книги, параллельно занимаясь бытовыми делами.

В интернете легко найти массу таких приложений, доступных для скачивания на ПК. Однако, чтобы лишний раз не заполнять память компьютера и не ставить под угрозу безопасность его работы, лучше использовать онлайн-сервисы. Мы расскажем о трех самых удобных и многофункциональных.

Acapela – самый известный синтезатор речи онлайн

Сайт Acapela предоставляет огромный выбор языков и голосов для озвучивания текста. Особенно это актуально для английского – его можно услышать в двадцати разных вариантах: женским голосом, мужским, детским, старческим, радостным и т.д.

Удобно, что все параметры настраиваются сразу на главной странице

К сожалению, с русскими текстами дела обстоят похуже – их озвучивают только одним голосом – некой Алены. Но тем не менее, результат получается вполне достойным.

Настройки здесь очень простые – достаточно только выбрать язык и голос, ввести нужный текст, затем согласиться с условиями использования ресурса и нажать кнопку «Listen!».


Интерфейс оформлен на английском, но и без перевода вполне понятно, что и как нажимать

Лимит на аудиовоспроизведение – 300 символов. В этом главный минус большинства синтезаторов речи онлайн, поэтому если вам нужна озвучка объемного файла, такой вариант явно не подойдет. Чтобы пользоваться озвучиванием без ограничений, предлагают купить полную версию программы. Она доступна для всех операционных систем на ПК и телефоне.

Google Переводчик: быстро, легко, доступно

Говоря о воспроизведении текстовых файлов, нельзя не упомянуть знаменитый Google Translate . Как понятно из названия, этот сервис предназначен для перевода текстов. Помимо этого, здесь можно также прослушивать файлы – делается это буквально в один клик.


Все оформлено на русском языке, поэтому разобраться в интерфейсе очень легко

Чтобы прослушать файл, необходимо вставить свой текст в соответствующее окно и нажать на значок мегафона в левом нижнем углу. Удобно, что сделать это можно как с оригиналом, так и с переводом. Отметим, что лимит здесь гораздо больше, чем в Акапеле – 5000 знаков. Никаких расширений и платных версий не предусмотрено.

Поскольку эта программа создана для других целей, функционал здесь оставляет желать лучшего. Тембр, скорость прочтения и другие важные параметры никак не регулируются. Озвучка получается неестественной, с отчетливыми «металлическими» нотками. Интонации, паузы, смысловые ударения – все это выполнено непрофессионально, поэтому в каждом предложении чувствуется, как слова неровно «склеены» между собой.

Это приложение удобно использовать, например, если вы хотите понять, как воспринимается на слух написанный вами текст. Для этого не особо важны интонации и тембр, ведь интересны сами формулировки, наличие тавтологий и неблагозвучных высказываний.


Из преимуществ можно отметить разве что огромный выбор языков, что, собственно, вполне логично для онлайн переводчика

Сервис Fromt exttospeech для воспроизведения голосом вашего текста

Последнее приложение, о котором мы хотим рассказать – это Fromtexttospeech . Начнем с того, что ограничения по количеству символов здесь самые лояльные – до 50 000. Это серьезное конкурентное преимущество, но давайте разберемся, обладает ли Fromtexttospeech еще какими-либо явными достоинствами.

Алгоритм работы программы примерно такой же, как и у Acapela:

  • настраиваем параметры синтезатора речи онлайн: язык, тембр и скорость;
  • нажимаем «Create Audio File»;
  • скачиваем или просто прослушиваем готовый файл.

Итак, пробуем. Копируем несколько предложений своей статьи и вставляем на fromtexttospeech.com. Чуть ниже рабочей панели высвечивается количество знаков, которые мы еще можем дописать.


Очень удобно, что есть возможность выбирать скорость начитки: медленная, средняя, быстрая и очень быстрая

Больше здесь настраивать нечего, так что переходим к самой процедуре конвертации в аудио. Этот процесс занимает несколько минут (в зависимости от размера файла), после чего в отдельном окне можно будет оценить результат работы.


Возможность сохранить получившийся аудиофайл на компьютер – очень удобная функция, которая отличает этот сервис от многих других

Подводя итоги, стоит сказать, что все рассмотренные нами сервисы очень индивидуальны и имеют свои особенности. Если вас интересует профессиональное озвучивание, то Акапела отлично подойдет для этих целей. На официальном сайте программы вы сможете протестировать ее работу, оценить звучание и функционал, чтобы принять решение о покупке полноценной версии. Если же вопрос качества для вас не слишком важен, выбирайте старый добрый Гугл Переводчик или Fromtexttospeech, которые позволяют бесплатно преобразовывать большие текстовые файлы в аудио.

Послушать, как звучат фрагменты одного текста в исполнении различных голосовых движков, можно в нашем видео.

Речевые синтезаторы, установленные на компьютеры или мобильные устройства, уже не кажутся такими необычными программами, как раньше. Благодаря современным технологиям обычный настольный ПК может воспроизводить человеческий голос.

Каким образом работают синтезаторы речи? Где они применяются? Какой самый лучший речевой синтезатор? Ответы на эти и другие вопросы изложены в данной статье.

Общее понятие

Синтезаторы речи являются специальными программами, состоящими из некоторого количества модулей, которые предоставляют возможность перевести набранные тексты в озвученные человеческим голосом предложения. Не стоит думать, что вся база слов и фраз записана реальными людьми в профессиональных студиях. Выполнить подобную задачу физически невозможно. Библиотеку с таким большим количеством фраз нельзя установить ни на один современный компьютер, не говоря уже о мобильных телефонах. Для этого разработчики создали технологию Text-to-Speech.

Сфера применения

Синтезаторы речи используются при изучении иностранных языков, прослушивании текстов на страницах книг, создании вокальных партий, выдаче поисковых запросов в форме озвученных фраз и т. п.

Какие разновидности программ существуют? В зависимости от сферы применения утилиты можно разделить на 2 вида: обычные, преобразующие набранный текст в речь, и специальные вокальные модули, используемые в музыкальных приложениях.

Преимущества и недостатки

На данный момент компьютер синтезирует человеческую речь только приблизительно. В простейших программах можно наблюдать проблемы со звуком и правильной постановкой ударений в различных словах. Синтезаторы речи, установленные на мобильные устройства, расходуют много энергии. Нередко можно отметить несанкционированную загрузку дополнительных модулей.

К преимуществам следует отнести удобство восприятия. Многим пользователям гораздо проще усваивать звуковую информацию, нежели какую-либо другую.

Лучшие речевые синтезаторы с русскими голосами

Программа RHVoice была создана Ольгой Яковлевой. Стандартный вариант приложения включает 3 голоса. Настройки очень просты. Программу можно использовать и как самостоятельное приложение, совместимое с SAPI5, и как дополнительный экранный модуль.

Речевой синтезатор Acapela отличается от аналогов идеальным озвучиванием текста. Приложение поддерживает более 30 языков мира. В бесплатной версии доступен лишь 1 женский голос.

Программа Vocalizer часто применяется в call-центрах. Пользователь может настроить постановку ударения, громкость и скорость чтения. При необходимости загружаются дополнительные словари. В приложении есть 1 женский голос. Речевой движок автоматически встраивается в программы для чтения книг в электронном формате.

Утилита eSpeak поддерживает свыше 50 языков. Недостатком программы можно считать сохранение звуковых файлов лишь в формате WAV, который требует много места на жестком диске.

Приложение Festival является мощнейшей утилитой синтеза речи, поддерживающей даже финский язык и хинди.

Установка программы

Как использовать приложения такого типа? Для начала нужно установить программу. В компьютерных ОС применяется стандартный инсталлятор, в котором пользователю остается выбрать лишь поддерживаемый утилитой языковой модуль. Установщик для мобильных устройств можно скачать с официального сайта, Google Play, а также App Store. Инсталляция приложения происходит в автоматическом режиме.

Первый запуск программы

На данном этапе пользователю достаточно установить язык по умолчанию. Иногда требуется отметить качество звучания. Стандартный вариант подразумевает частоту дискретизации 4410 Гц, глубину 16 бит и битрейт 128 кбит/с. В мобильных ОС показатели могут быть ниже. В качестве основы используется определенный голос.

Фильтры и эквалайзеры помогают достичь необходимого звучания. Пользователю доступны три варианта перевода текста. Он может набрать на клавиатуре предложения, включить озвучивание уже имеющегося файла или установить в браузере расширение, которое преобразует содержимое на веб-страницах в речь. Достаточно отметить необходимый вариант действий, тембр голоса и язык, на котором будет произноситься текст. Для включения процесса воспроизведения требуется кликнуть по кнопке «Старт».

Работа со сложными программами

В музыкальных приложениях настройки гораздо сложнее. В речевом модуле программы FL Studio пользователь может выбрать несколько видов голосов, а также указать тональность и скорость воспроизведения. Постановка ударений перед слогами осуществляется с помощью символа «_». С помощью подобного речевого синтезатора можно создать лишь роботизированный голос.

Программа Vocaloid относится к приложениям профессионального типа. Помимо обычных параметров, пользователь может выбирать артикуляцию и глиссандо. В утилите есть база с вокалом профессионалов. При желании можно подгонять под ноты целые предложения. Одна только библиотека с вокалом занимает более 4 Гб в сжатом виде.

"Синтезатор речи Google": что это за программа

В мае 2014 года компания предоставила пользователям возможность опробовать новый бесплатный продукт. Что такое "Синтезатор речи Google" на «Андроиде»? Это программа, озвучивающая текст на экране мобильного устройства или планшета. Теперь нет необходимости устанавливать сторонние утилиты, которые требуют наличия лицензии. "Синтезатор речи Google" используется при чтении электронных книг, прослушивании правильного произношения слов, запуске приложения TalkBack.

Новая версия программы "Синтезатор речи Google 3.1" получила функцию поддержки английского, итальянского, испанского, корейского, немецкого, нидерландского, польского, португальского, русского и французского языков. Где найти голосовые пакеты? Они загружаются из самого приложения.

Преимущества и недостатки продукта от Google

Особенностями русскоговорящего женского голоса является четкое, громкое звучание и плавная интонация. Скорость воспроизведения можно регулировать в настройках программы. Пользователи, использующие TalkBack и русскую языковую локализацию ОС Android, должны проявлять осторожность при переключении на речевой синтезатор, если ранее в приложении по умолчанию был установлен другой голос. Могут возникнуть проблемы, связанные с сохранением контроля над мобильным устройством на слух. Практически все голоса, кроме русского, неспособны обрабатывать предложения на кириллице.

Среди минусов можно отметить задержку реакции на чтение текстов, состоящих из фраз на разных языках. Русский голос отличается металлическими нотками тембра. Можно услышать дребезжащий звук на низких частотах. К преимуществам можно отнести стабильность работы приложения и приемлемое качество чтения англоязычных слов.

"Синтезатор речи Google": как пользоваться программой

Для того чтобы утилита заработала как надо, требуется обновить ее до последней версии. Чтобы активировать процесс озвучивания текста, нужно открыть настройки. В разделе «язык и ввод» необходимо поставить флажок на пункте «синтез речи». Тут же следует отметить строку «система по умолчанию». Не стоит забывать о том, что голосовые пакеты в самой программе также нуждаются в обновлении.

Проблемы при работе с утилитой

При необходимости пользователь может отключить приложение. В самых простых утилитах кнопка остановки находится в самой программе. Деактивация расширения, установленного в браузере, производится путем отключения дополнения или полного удаления плагина. При работе с программой на мобильном телефоне также могут возникнуть проблемы. Дело в том, что синтезатор речи автоматически включает загрузку ненужных пользователю языковых модулей.

Данный процесс занимает много времени и существенно расходует трафик. Как отключить "Синтезатор речи Google" на мобильном устройстве и избавиться от этой проблемы? Для начала нужно открыть настройки приложения. Потом необходимо выбрать раздел «язык и голосовой ввод». Далее нужно отметить последнюю строку.

Выбрав голосовой поиск, следует кликнуть по крестику у пункта «распознавание речи офлайн». Затем рекомендуется удалить кэш приложений. Далее требуется перезагрузить мобильный телефон. Чтобы полностью отключить утилиту, необходимо открыть в настройках раздел «приложения», выбрать в списке синтезатор речи и кликнуть по кнопке «остановить».

Удаление программы

Бывает так, что пользователь вообще не использует "Синтезатор речи Google". Можно ли удалить утилиту с мобильного устройства? Для этого нужно открыть Google Play. Затем следует выбрать в перечне установленных программ синтезатор речи и кликнуть по кнопке «удалить».

Итоги

Обычным пользователям и людям с ограниченными возможностями подойдут приложения с простым интерфейсом. Это может быть как RHVoice, так и "Синтезатор речи Google". Русский голос озвучит отображаемый на экране текст. Большего рядовому пользователю не требуется.

Музыкантам рекомендуется отдавать предпочтение профессиональной программе Vocaloid. В приложении есть дополнительные голосовые библиотеки и множество различных опций. Программа позволит получить естественное звучание голоса. Ведь музыкантам так важно, чтобы компьютерный синтез не ощущался на слух.

Распозновать речь мы научились хоть и, пока, только английскую, не будем стоять на месте, едем дальше, точнее в противоположную сторону — займемся преобразованием текста в голосовую речь.

Наиболее популярные и свободные синтезаторы речи, которые мне известны и с которыми я имел практический опыт: Festival , eSpeak , OpenMary .
Рассмотрим все 3 по порядку.

Festival

ОС: Linux
Русский язык:
да (мужской голос)
Сайт: http://www.cstr.ed.ac.uk/projects/festival/

Довольно продвинутый синтезатор, поставляется со следующими языковыми пакетами: английский (в английском и американском произношении), валлийский и испанский. Также существуют и другие пакеты, такие, как кастильский испанский, чешский, финский, хинди, итальянский, маратхи, польский, русский и телугу. Festival входит в поставку нескольких дистрибутивов Linux-а. Синтезатор довольно хорошо понимает русский язык, если поиграться с написанием слов, знаками препинания можно добиться вполне вменяемой речи.

Установка

В сети уже много материалов про установку фетиваля и прикрутке русского языка, поэтому особо расписывать не буду скажу лишь, что потребуется установить сам фестиваль (ставится из репозитория — festival) и русский языковой пакет, который также устанавливается из репозитория (festvox-ru), затем следует немного подправить конфиг. Хорошая статья по этому поводу есть .

Использование

В консоли:

Echo "Привет" | festival --tts --language russian

eSpeak

ОС: Linux, Windows, Mac OS X, RISC OS
Русский язык:
да (мужской голос)
Сайт:

Простой, компактный, программный синтезатор речи. Если верить информации, eSpeak используется в мобильных операционных системах Android, начиная с версии 1.6, и Maemo. Версии под Windows и Linux регулярно обновляются вместе с исходным кодом, с остальными платформами дела обстоят хуже. Поддерживается множество языков, в том числе русский, английский, французский, испанский и т.д. Если брать в сравнение русскую речь — eSpeak уступает Festival, английский, франзузский, немецкий — на уровне.

Установка

В некоторых дистрибутивах линукс еСпик уже установлен, если нет — ставится он также просто из консоли (espeak), либо качаем нужную версию с , например, в случае с Windows.

Использование

В консоли:

Espeak "Привет мир!" -vru -s 100

Где:
-v язык (ru, en, de)
-s скорость (80-450)

OpenMary

ОС: Linux, Windows, Mac OS X
Русский язык:
да (мужской голос)
Сайт:
http://mary.opendfki.de

Молодой и, пока еще, не очень популярный синтезатор, но в то же время очень функциональный и продвинутый. Написан на Java, что позволяет ему быть платформонезависимым. Работает по принципу клиент-сервер. Обладает продвинутыми речевыми надстройками, с помощью которых можно указывать интонацию, тембр, скорость для каждого слова. Поставляется с клиентом, написанным на той же яве, с графическим интерфейсом.

Установка

Установка достаточно легкая и не требует определенных усилий, качаем ява-установщик (не забываем, что требуется Java). Запускаем установщик и следуем инструкциям. В определеный этап установки предложат выбрать языковые пакеты, которыми мы будем пользоваться, для себя я выбрал русский и английский.

Использование

Переходим в директорию установки, заходим в папку bin и запускаем сервер — maryserver. Как только сервер будет запущен, запускаем клиент — maryclient.

Если все было сделано правильно, после нажатия кнопки «Play» должно быть слышно произношения написанного текста. В папке example, директорией выше, есть примеры реализации клиентов под разные языки.

Вывод

Festival: для средних домашних и корпоративных проектов (информирование о погоде, чтение писем, «язык» для ботов и т.п.).
eSpeak: для реализации малых задач (сообщение текущего времени, информирование о пробках, количестве писем в почтовом ящике, свободном месте на жестком диске и т.п.).
OpenMary: для крупных проектов (системы «умного дома», озвучка программ, чтение большого текста).

Сегодня синтезаторы речи, применяемые в стационарных компьютерных системах или мобильных устройствах, чем-то необычным уже не кажутся. Технологии шагнули далеко вперед и позволили воспроизвести человеческий голос. Как все это работает, где применяется, каков лучший речевой синтезатор и с какими потенциальными проблемами может столкнуться пользователь, смотрите ниже.

Что представляют собой речевые синтезаторы и где они применяются?

Синтезаторы речи представляют собой специальные программы, состоящие из нескольких модулей, которые позволяют переводить набранный на клавиатуре текст в обычную человеческую речь в виде звукового сопровождения.

Было бы наивно полагать, что сопутствующие библиотеки содержат абсолютно все слова или возможные фразы, записанные в студиях реальными людьми. Это просто физически невозможно. К тому же библиотеки фраз имели бы такой размер, что установить их даже на современные винчестеры большого объема, не говоря уже о мобильных девайсах, просто не представлялось бы возможным.

Для этого была разработана технология, получившая название Text-to-Speech (перевод текста в речь).

Наиболее широкое распространение синтезаторы речи получили в нескольких областях, к которым можно отнести самостоятельное изучение иностранных языков (программы нередко имеют поддержку в 50 языков и более), кода нужно услышать правильное произношение слова, прослушивание текстов книг вместо чтения, создание речевых и вокальных партий в музыке, использование их людьми с ограниченными возможностями, выдача поисковых запросов в виде озвученных слов и фраз и т. д.

Разновидности программ

В зависимости от области применения, все программы можно разделить на два основных типа: стандартные, непосредственно преобразующие текст в речь, и речевые или вокальные модули, применяемые в музыкальных приложениях.

Для более полного понимания картины рассмотрим оба класса, но больший упор будет сделан все-таки на синтезаторы речи в их непосредственном назначении.

Плюсы и минусы простейших речевых приложений

Что же касается преимуществ и недостатков программ такого типа, сначала рассмотрим все-таки недостатки.

Прежде всего нужно четко понимать, что компьютер - он и есть компьютер, который на данном этапе развития человеческую речь может синтезировать весьма приблизительно. В простейших программах зачастую наблюдаются проблемы с постановкой ударений в словах, пониженное качество звука, а в мобильных устройствах - повышенное энергопотребление, а иногда и несанкционированная загрузка речевых модулей.

Но и преимуществ хватает, ведь очень многие звуковую информацию воспринимают гораздо лучше, нежели визуальную. Удобство восприятия налицо.

Как пользоваться синтезатором речи?

Теперь несколько слов об основных принципах использования программ такого типа. Установить синтезатор речи любого типа можно без особых проблем. В стационарных системах используется стандартный инсталлятор, где основной задачей станет выбор поддерживаемых языковых модулей. Для мобильных девайсов установочный файл можно скачать из официального магазина или хранилища вроде Google Play или AppStore, после чего приложение инсталлируется в автоматическом режиме.

Как правило, при первом запуске никаких настроек, кроме установки языка по умолчанию, производить не нужно. Правда, иногда программа может предложить выбрать качество звучания (в стандартном варианте, применяемом повсеместно, частота дискретизации 4410 Гц, глубина 16 бит и битрейт 128 кбит/с). В мобильных устройствах эти показатели ниже. Тем не менее за основу берется определенный голос. С использованием стандартного шаблона произношения путем применения фильтров и эквалайзеров достигается звучание именно такого тембра.

В использовании можно выбрать несколько вариантов перевода вручную, озвучивание уже имеющего текста из файла, интеграция в другие приложения (например, веб-браузеры) с активацией выдачи поисковых результатов или прочтения текстового содержимого на страницах онлайн. Достаточно выбрать нужный вариант действий, язык и голос, которым все это будет произноситься. Многие программы имеют несколько разновидностей голосов: как мужских, так и женских. Для активации процесса воспроизведения обычно используется кнопка старта.

Если говорить о том, как отключить синтезатор речи, тут может быть несколько вариантов. В самом простом случае используется кнопка остановки воспроизведения в самой программе. В случае интеграции в браузер деактивация производится в настройках расширений или полным удалением плагина. А вот с мобильными устройствами, несмотря на непосредственное отключение, могут быть проблемы, о которых будет сказано отдельно.

В музыкальных программах настройки и ввод текста намного сложнее. Например, в приложении FL Studio есть свой речевой модуль, в котором можно выбрать несколько изменить настройки тональности, скорости воспроизведения и т. д. Для постановки ударений перед слогом используется символ «_». Но и такой синтезатор годится только для создания роботизированных голосов.

Но вот пакет Vocaloid от Yamaha относится к программам профессионального типа. Технология Text-to-Speech здесь реализована в наиболее полном объеме. В настройках, помимо стандартных параметров, можно выставить артикуляцию, глиссандо, использовать библиотеки с вокалом профессиональных исполнителей, составлять слова и фразы, подгоняя их под ноты, и еще кучу всего. Неудивительно, что пакет только с одним вокалом занимает порядка 4 Гб и более в установочном дистрибутиве, а после распаковки - вдвое-втрое больше.

Синтезаторы речи с русскими голосами: краткий обзор самых популярных

Но вернемся к самым простым приложениям и рассмотрим самые популярные из них.

RHVoice - по мнению большинства экспертов, лучший синтезатор речи, являющийся российской разработкой авторства В стандартном варианте доступно три голоса (Александр, Ирина, Елена). Настройки просты. А само приложение может использоваться и как самостоятельная программа, совместимая с SAPI5, и как экранный модуль.

Acapela - достаточно интересное приложение, главной особенностью которого является почти идеальная озвучка текста более чем на 30 языках мира. В обычной версии, правда, доступен только один голос (Алена).

Vocalizer - мощное приложение с женским голосом Milena. Очень часто эта программа применяется в call-центрах. Имеется множество настроек постановки ударения, громкости, скорости чтения и установки дополнительных словарей. Главное отличие состоит в том, что речевой движок может встраиваться в программы вроде Cool Reader, Moon+ Reader Pro или Full Screen Caller ID.

Festival - мощнейшая утилита синтеза и распознавания речи, созданная для систем Linux и Mac OS X. Приложение поставляется с открытым исходным кодом и, помимо стандартных языковых пакетов, имеет поддержку даже финского языка и хинди.

eSpeak - речевое приложение, поддерживающее более 50 языков. Главным недостатком считается сохранение файлов с синтезированной речью исключительно в формате WAV, который занимает уж очень много места. Зато программа является кроссплатформенной и может использоваться даже в мобильных системах.

Проблемы с синтезатором речи в Google Android

При установке «родного» синтезатора речи от Google, пользователи постоянно жалуются на то, что он самопроизвольно включает загрузку дополнительных языковых модулей, что может не только занимать достаточно длительный промежуток времени, но еще и расходует трафик.

Избавиться от этого в Android-системах можно очень просто. Для этого используем меню настроек, далее переходим в раздел языка и голосового ввода, выбираем голосовой поиск и на параметре распознавания речи оффлайн нажимаем на крестик (отключение). Дополнительно рекомендуется почистить кэш приложений и перезагрузить устройство. Иногда может потребоваться в самом приложении отключить показ уведомлений.

Что в итоге?

Поводя некий итог, можно сказать, что в большинстве случаев рядовым пользователям подойдут самые простые программы. Во всех рейтингах лидирует RHVoice. Но для музыкантов, которые хотят добиться естественного звучания голоса, чтобы разница между живым вокалом и компьютерным синтезом не ощущалась на слух, лучше отдать предпочтение программам типа Vocaloid, тем более что для них выпускается множество дополнительных голосовых библиотек, а настройки имеют столько возможностей, что примитивные приложения, как говорится, и рядом не стояли.

 

 

Это интересно: