RitmInMe Описание программы Оператор цифровой трансформации - Dilibrium / Дилибриум
Facebook    Twitter    Google+    LiveJournal    Мой Мир
ВКонтакте     Одноклассники

Font Size

Приложение 3         

 

 

Приложение 4. Чтение стихов
с помощью
компьютерных голосов

Пиит

Стихи лучше один раз услышать,
чем сто раз увидеть.

Перфразировка

Программа "Ритм во мне"

  •  Проверка ритмичности стихов;
  •  определение стихотворного
     размера;
  •  встроенные рифмовники:
     русский на 137 600 слов
    (2 950 800 словоформ),
    украинский: 135 800 слов
    (1 948 700 словоформ);
  •  разметка рифмовки;
  •  проверка правописания;
  •  словари (русский, украинский);
  •  пользовательские словари;
  •  количество слогов в строке;
  •  сервис для работы
     со стихами из интернета.

dinamikТолько с помощью поэтического слуха можно определить, ритмически верно написан стих, или нет. И, желательно, с проверкой путём чтения вслух. Ниже (для особо ленивых, а так же тех, кто в состоянии выносить перлы роботячьего произношения) описывается, как возложить чтение стихов на робота. Начиная с v6.0 в программу введена функция "Читать" (F7), позволяющая воспроизводить введённый в окно редактора текст машинным голосом (полностью или выделенный фрагмент).

Реализована эта функция в программе двумя путями:

p4-1

Чтение стихов через онлайн-сервисы

При выборе варианта "из интернета" открывается окно работы с онлайн-сервисами для чтения текстов голосом. Их сейчас достаточно, и некоторые занесены в список ссылок этой программы. В строке списка указан лимит на количество бесплатных символов, читаемых сервисом, и его адрес.

p4-2

Сервисы построены по схожему принципу: есть поле для ввода текста и набор голосов для его воспроизведения. Посетителю предоставляется некоторый лимит на пробный период, после чего предлагается или покинуть ресурс, или заплатить.

Для Вашего информирования о предполагаемом объёме использования конкретного ресурса указывается, сколько символов подготовлено для чтения. Их вставляют в поле ввода (Ctrl-V) и запускают воспроизведение звука или сохранение его в файл.

Воспроизведение запускается по кнопке

Если на компьютере установлен браузер Edge, то возможно проделывать это во встроенном браузере программы (не загружая браузер в отдельное окно), иначе работа возможна только в системном браузере (переключатель отсутствует).

Фрагмент произведения слева имеет чисто иллюстративную функцию, а вот количество символов в буфере обмена может оказаться для Вас существенным.

Разница между встроенным и системным браузером измеряется двумя кликами мышки: встроенный браузер сам чистит окно ввода и вставляет в него из буфера обмена текст произведения с расставленными для чтения роботом ударениями (в системном браузере это приходится делать самому пользователю). А дальше – одинаково: нужно выбрать голос, настроить его параметры и запустить воспроизведение. Конечно, этому можно и встроенный браузер научить, но привязываться к различной структуре сайтов интернетовских читалок влом.

Достоинством таких сервисов является возможность явного указания позиции ударения в слове (после вставки текста из буфера Вы можете видеть соответствующие значки), что позволяет решить проблему с омографами – словами, при одинаковом написании имеющими разное ударение (за́мок/замо́к), а так же с авторскими ударениями. Достаточно широкий набор голосов разного качества и стоимости позволяет посетителю оптимизировать свои траты.

К недостаткам отнесём платность, некоторую ненадёжность (онлайн-сервис в любой момент может оказаться недоступен) и тормознутость (в меру качества интернета и количества рекламы на сайте).

Чтение стихов локальными средствами компьютера

При выборе варианта "установленных на компьютере" открывается окно встроенного воспроизведения стихов:

p4-3

На начальном этапе фрагмент произведения, расположенный слева, имеет чисто иллюстративную функцию, поскольку предполагается предварительная настройка перед воспроизведением. Справа расположен список голосов (с расшифровкой выбранного голоса над ним). Если отключен режим "Читать только поэтические строки", то слева от списка голосов появляется колонка с отметкой выбора голоса для чтения строк прозы – вдруг, кроме поэтических строк, в произведении есть имена персонажей, названия глав, комментарии какие...

Под списком – две кнопки: собственно воспроизведение (динамик) и сохранения записи в файл (дискета). Далее – два регулятора, позволяющих управлять громкостью и скоростью воспроизведения, под ними – информация о заданной громкости и скорости, кнопка сброса режима в начальное состояние, а под ней – кнопка режима отслеживания текста (о ней ниже).

dinamikПосле клика на кнопку воспроизведения часть оформления экрана становится невидимой, зато появляется "проигрыватель", кнопки которого позволяют управлять процессом чтения:

p4-3

Пауза/продолжение и прекращение чтения

p4-3-pause p4-3-continueПосле клика на кнопку паузы чтение текста прекращается и кнопка изменяет вид и подсказку с "Пауза" на "Чтение". После повторного клика на неё воспроизведение текста продолжается. Во время паузы можно (и даже лучше – будет меньше неточностей и погрешностей звучания) изменять настройки: выбор голосов, громкость, скорость воспроизведения, навигацию по тексту, повтор фрагментов.

p4-3-stopПосле клика на кнопку "Стоп" прекращение чтения происходит то же, что и по окончанию текста: "проигрыватель" исчезает, часть оформления экрана восстанавливает видимость, а фрагмент произведения, расположенный слева, теряет функцию навигации. Остановить чтение можно и просто закрыв форму чтения кнопкой "×".

Навигация по тексту произведения

Под навигацией понимается перемещение по тексту, осуществляемое с помощью кнопок или других средств управления.

p4-3-ltrtС помощью этой пары кнопок происходит переход на предыдущую или последующую строку. Если по кнопке кликнули во время чтения, то звучание текущей строки прерывается.

p4-3-stltrtС помощью этой пары кнопок происходит переход на предыдущую или последующую строфу текста. Понимание строфы в данном случае упрощённое: в строфы объединяются группы поэтических строк, обрамлённые пустыми строками или строками прозы. Чтение продолжится с начала строфы, ставшей текущей.

Под кнопками "проигрывателя" располагается прогресс-бар чтения, основной функцией которого является показ доли прочитанного текста. Однако при наведении на него курсор меняет форму и над прогресс-баром появляется строка текста, которая может стать текущей, если кликнуть мышкой.

p4-3-bar

Во время чтения фрагмент произведения, расположенный слева, приобретает функцию навигации (правда, лишь в пределах показанного текста). Если на него поместить курсор, то он меняет форму и строка под курсором может стать текущей, если кликнуть мышкой. Для наглядности эта строка индицируется над прогресс-баром.

Примечание. Пути и скорость курсора по экрану неисповедимы, и, при стечении некоторых обстоятельств, программа может не заметить, что курсор уже́ над текстом, и не поменять его форму на указующий перст. Если Вам хочется выполнить навигацию именно таким образом, следует вернуться курсором в область экрана проигрывателя и перебраться через его границу (она от этого синеет) медленнее.

"Проигрыватель" воспроизводит текст произведения голосом, но хочется позицию чтения отслеживать и взглядом. Для этого и предназначен фрагмент произведения, расположенный слева. Здесь в Вашем распоряжении несколько вариантов трассировки.

p4-3-traseПереключение выполняется по кнопке, расположенной в внизу/по центру правой части экрана. Первый вариант ("кирпичик") соответствует синхронному отслеживанию чтения стиха по словам. Остальные – отслеживание читаемой строки (по мере снижения засветки): второй ("ряд кирпичиков") – подсвечена вся текущая строка, третий ("указатель на путевом камне") – текущая строка отмечена кружочком, четвертый (пусто) – трассировки нет (правда, текст проматывается при достижении границы экрана, и тогда текущая строка становится нижней).

Примечание. Это разнообразие трассировки работает, если курсор находится в правой половине экрана. Если же он зависает указующим перстом над текстом, то подсвечивается текущая строка. Смена режима трассировки окончательно вступает в силу после завершения чтения текущей строки.

Повтор фрагментов

Подозреваю, что иногда у человека возникает желание несколько раз прослушать одну строку. Или строфу. Или всё произведение. Для этого предназначена следующая кнопка в её четырёх ипостасях:

p4-3-repПервый вид кнопки соответствует обычному состоянию – ничего не повторяется. Кнопка с единичкой соответствует повтору одной строки, с четвёркой – строфы, с листом – всего стиха. После клика на пустую кнопку предлагаются на выбор эти состояния, после клика на непустую происходит отмена повтора. После отмена повтора строки или строфы воспроизведение начинается со следующей строки или строфы (соответственно), отмена повтора всего стиха аналогична клику на кнопку "Стоп".

Смена языка

Выбор голоса чтения поэзии осуществляется кликом в списке голосов, голоса чтения прозы – отметкой перед соответствующей строкой этого списка. Смена голоса выполняется со следующей строки (поэтому, если была установлена пауза, текущая строка не будет дочитана до конца). Отменить или разрешить чтение строк прозы можно только в то время, когда чтение не выполняется.

Громкость и скорость

Эти регуляторы занимают (для удобства пользования) значительную часть экрана:

p4-3-vol

Для изменения регулируемого параметра можно
    • перетянуть точку-указатель к требуемому положению;
    • кликнуть по нужному положению на лимбе или по точке за ним;
    • воспользоваться кнопочками "+" и "-" для пошагового изменения.

Результат будет один и тот же: точка-указатель установится в требуемое положение, а под регулятором будет отображено соответствующее ей значение. Примечание: загнать точку-указатель в мёртвую зону не удастся.

Между регуляторами расположена кнопка "Сброс", клик по которой восстанавливает начальные значения для чтения стихов локальными средствами компьютера.
 

p4-3-saveСохранять звуковую запись произведения в файл имеет смысл только после предварительного прослушивания с подбором голоса, громкости и скорости чтения. После клика на эту кнопку следует запрос на сохранение звукового (WAV) файла. После определения имени некоторое время идёт формирование файла (видна только мигающая дискетка), файл записывается и вид окна восстанавливается.
 

Достоинством чтения стихов локальными средствами компьютера является бесплатность и надёжность – достаточно иметь возможность запустить программу на исправном компьютере.

К недостаткам отнесём то, что поставляемые с Windows голоса не позволяют в явном виде управлять ударениями, и потому оно полностью во власти создателей голосовых движков. Да и набор голосов не столь уж обширен. В режиме "demo" возможности ограничены 4-ю строками (строф нет).

Правда, использование голосов от сторонних разработчиков из набора RHVoice от Ольги Яковлевой проблему с ударениями решает. Но захотите ли Вы устанавливать голоса из списка https://rhvoice.org/ru-voices/ – другой вопрос. Соответственно, проблему с "demo" решает регистрация Вашей лицензии (с аналогичной оговоркой).

Дополнительные голоса

Во-первых, это несъедобно,
а во-вторых, почему так мало?

Посетитель в ресторане

Голосовые движки входят в языковые пакеты для Windows:
https://support.microsoft.com/ru-ru/windows/языковые-пакеты-для-windows-a5094319-a92d-18de-5b53-1cfc697cfca8#WindowsVersion=Windows_10

Пакеты для используемых Вами языков усиленно рекомендуется установить. Проверить, установлен ли пакет, можно по списку языков, расположенном под пунктом "ПУСК – Параметры – Время & язык – Язык & регион – Добавить язык": для обделённых вниманием языков будет значиться "Доступен языковый пакет". Выбрав такой язык и активировав через "Параметры", следует загрузить "Языковый пакет" и "Голосовые функции" ("Рукописный ввод" – на Ваше усмотрение). Там есть и пункт "Добавить дополнительные голоса озвучивания", но наличие в нём голосов для выбранного Вами языка отнюдь не обязательно.

Во всяком случае, в начальном состоянии для Windows 10/11 имеем, как минимум, голоса́ Microsoft Zira – English (US) и Microsoft Irina (RU).

Расширение списка доступных голосов от MS

Но и после этого Windows напрашивается на рукоприкладство: если выбрать ПУСК – Параметры – Специальные возможности – Экранный диктор – Голос, то получим список доступных голосов, из которого в списке программы RitmInMe, скорее всего, наличествуют только некоторые.

Описанная на https://bauinvest.su/razblokirujte-vse-golosa-tts-v-windows-10-vo-vsej/ процедура правки реестра не слишком трудоёмка, но и приятной её не назовёшь. Так, в начале я запустил (ПУСК – Выполнить) RegEdit и с его помощью экспортировал в файл pavel.reg ветку реестра
Компьютер\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_ruRU_PavelM

Мне пришлось в этом текстовом файле повторить текст (кроме первой строчки) и в первом блоке поменять (два раза) "Speech_OneCore" на "Speech", а во втором ещё и добавить перед "Microsoft" "WOW6432Node\".

В результате отредактированный файл создаёт в реестре две ветки:
Компьютер\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\MSTTS_V110_ruRU_PavelM
и
Компьютер\HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft\Speech\Voices\Tokens\MSTTS_V110_ruRU_PavelM
с копией исходной информации.

Увы, reg-файл для активации уже имеющегося в системе голоса лучше изготавливать именно путём экспорта с последующим редактированием – один святой Коннектий знает, что и в какой момент где поменяют в Майкрософте.

После запуска файла файл pavel.reg и перезагрузки голос Microsoft Pavel (RU) появился в списке программы RitmInMe, хотя особой радости у меня его произношение не вызвало.

Установка голосов сторонних разработчиков

Несколько более порадовали голоса от сторонних разработчиков – например, в перечне RHVoice от Ольги Яковлевой их изрядное количество. Перейдите по одной из ссылок на сайте, загрузите и установите голос. Никакого дополнительного программного обеспечения не требуется: всё включено в голосовой установщик. Правда, при использовании голосов RHVoice у меня не получается получить отсутствие звука при нуле на регуляторе громкости (голоса от Microsoft нуль исправно отрабатывают), но, думаю, это можно пережить.

Загружать голоса лучше от разработчика (страницы https://rhvoice.org/ru-voices/ и https://rhvoice.su/voices/ ), но на всякий случай есть (с разрешения разработчика) и копия голосов для русского языка на сайте RitmInMe по состоянию на 17.12.2022:

рекомендуемые
Aleksandr-v4.2.2012.18 Anna-v4.1.2012.18 Elena-v4.3.2012.18 Irina-v4.1.2012.18
дополнительные
Arina-v4.0.2012.18 Artemiy-v4.0.2012.18 Evgeniy-v4.0.2012.18 Mikhail-v4.0.2012.18
Pavel-v4.0.2012.18 Tatiana-v4.0.2012.18 Timofey-v4.0.2012.18 Umka-v4.0.2012.18
Victoria-v4.0.2012.18 Vitaliy-ng-v4.0.2012.18 Vitaliy-v4.0.2012.18

Естественно, при виде exe-файлов (а голоса поставляются именно в таком виде) возникает вопрос о безопасности такого шага. Проверить предлагаемые файлы на вирусы можно на сервисе https://www.virustotal.com/gui/home/upload перед загрузкой на свой компьютер, передав в качестве URL ссылку на соответствующий файл.

Недоработки

Не знаю, насколько эта функция будет востребована, поэтому выкладываю не вылизанный окончательно вариант (бета-версию). Из замеченных недоработок при воспроизведении голосами, установленными в Windows, отмечу:

1). Неустойчивость отображения авторских ударений и цветных линий в тексте.

2). Необходимость не слишком быстро перескакивать на окно текста с целью последующей навигации. Как временный "костыль", добавлена граница, становящаяся более различимой при активации навигации кликами по тексту, и изменение формы курсора. Соответственно, если граница с курсором не активировались, то следует вернуться на правую половину экрана и повторить движение, но более медленно. Это касается и слишком хитрых, обошедших эту КСП сверху.

3). В окошке текста возможны только клики по видимым строкам – навигация по тексту с помощью клавиатуры и прокрутки мышкой не работает.

Свои пожелания прошу слать на Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра. .

Горячие клавиши

Кроме кликов мышкой, иногда оказывается удобным управлять чем-либо и с клавиатуры. Из окна редактирования чтение текста запускается по клавише F7, которая доминирует и далее, но в разном окружении.

Чтение стихов через онлайн-сервисы

Клавиша Назначение
F1 Помощь по вкладке чтения стихов через онлайн-сервисы.
F7 Запуск чтения. Альтернативы – пробел, Enter.
Esc Возврат в окно редактирования.
E Настройка – читать во встроенном браузере.
S Настройка – читать в системном браузере.
Tab Переход во вкладку чтения стихов локальными средствами компьютера.

Чтение стихов локальными средствами компьютера

Клавиша F1 (помощь по вкладке чтения стихов локальными средствами компьютера) доступна всегда, поскольку при этом страница на сайте программы открывается в системном браузере. Другие же клавиши задействованы в зависимости от обстоятельств.

Чтение не запущено
Клавиша Назначение
F7 Запуск чтения. Альтернативы – пробел, Enter, Ctrl-P.
Ctrl-S Сохранение звукового (WAV) файла.
Esc Возврат в окно редактирования.
Tab Переход во вкладку чтения стихов через онлайн-сервисы.
Настройки чтения

(работают во время чтения, но могут быть установлены до него)

Клавиша Назначение
↑ | ↓ Стрелка вверх/вниз меняет выбранный в списке голос.
Аналогично действуют первые буквы имён чтецов (названий голосов).
F2 Отслеживание читаемого текста по маркировке текущего слова.
F3 – " – – " – – " – – " – – " – – " – – " – – " – – " –   текущей строки.
F4 – " – – " – – " – – " – – " – – " – – " – указателю текущей строки.
F5 Отслеживания нет.
F8 Уменьшить громкость.
F9 Увеличить громкость.
- Уменьшить скорость.
+ Увеличить скорость.
Чтение запущено
Клавиша Назначение
F7 Пауза. Альтернативы – пробел, Enter.
Esc Стоп + закрыть "проигрыватель". Альтернатива – End.
Tab Стоп + переход во вкладку чтения стихов через онлайн-сервисы.
Чтение переведено в паузу
Клавиша Назначение
F7 Отмена паузы. Альтернативы – пробел, Enter.
Esc Закрыть "проигрыватель". Альтернатива – End
Tab Переход во вкладку чтения стихов через онлайн-сервисы.
Чтение запущено или переведено в паузу
Клавиша Назначение
← | → Перемещение на строку назад/вперёд.
PgUp | PgDn – " –                  на строфу назад/вперёд.
Home – " –                  в начало текста.
1 Повтор текущей строки.
4 – " –      текущей строфы.
Ctrl-A – " –      всего текста.
0 – " –      отменён.

 


Приложение 3