Программные продукты

Распознавание речи с программой "Перпетуум М"

Здесь рассказывается о программе, имеющей давнюю историю. Текущая версия 4.01 (2015 года) уже заметно подустарела, но и назвать ориентировочные сроки выпуска следующей версии пока нет возможности. Речь не идёт о закрытии проекта. Напротив, идея маленькой интернет-независимой программы с минимальными системными требованиями и возможностью работать даже без словаря заслуживает лучшей реализации и по-прежнему актуальна. Но следующая версия - пока вопрос времени.

Версия 4.01 тестировалась на Windows XP и Windows 7, поэтому в более новых версиях ОС может вести себя непредсказуемо. Ниже на странице имеются ссылки на скачивание как самой программы, так и скриптов к ней. Но для начала посмотрим, что собой представляет данный продукт.

Упрощённая структура программы 'Перпетуум М'

На рисунке показана упрощённая структура программы "Перпетуум М". Пожалуй, наибольший интерес здесь представляют два модуля: модель звуковосприятия и алгоритм сборки текста. Исходный код первого из них не был написан традиционным способом. Он был в буквальном смысле выращен. Далее уже компилировался обычным способом наравне с другими, рукописными. Написать вручную нечто подобное просто невозможно. Даже если не касаться внушительного размера этого исходника, алгоритм его просто не поддаётся какому-либо анализу и пониманию. Нет, грубо и в общем я, конечно, понимаю, что там и зачем, но вникать в детали я бы не стал - это бесполезно. Здесь что-то вроде кубика Рубика - механизм очень простой, но взаимодействие деталей в нём столь запутано, что уже после нескольких вращений трудно понять, что и откуда взялось. Эта игрушка (кубик), кстати говоря, великолепная иллюстрация связи между хаосом и закономерностью.

Эволюционные алгоритмы существуют давно, но на мой взгляд, практика их применения развита слабо. Возможно, это связано с тем, что разработчики предпочитают готовые решения с гарантированным результатом, но в данном случае рутинный подход неэффективен. Ни один учебник не содержит полного описания всех возможных эволюционных методов. В каждом конкретном случае полезно отталкиваться от основной сути эволюционного процесса и условий решаемой задачи.

Чтобы получить модель звуковосприятия в виде действующего алгоритма, потребовалась акустическая модель. Для этого была создана база образцов (куда ж без этого?), описывающая акустическую модель русского языка. Но в состав готового программного продукта акустическая модель с её образцами не входит. То, что было дальше, чем-то похоже на превращение гусеницы в бабочку. Акустическая модель была использована как среда, в которой развивался эволюционный процесс. Любой подобный процесс имеет цель (чаще неявную), диктуемую условиями среды. В данном случае акустическая модель, как искусственная среда, также содержала в себе неявное описание цели. Результатом данного процесса стала информационная структура, содержащая алгоритм анализа признаков (извлекаемых из звуковой информации) на наличие в них образов звуков речи, которые в совокупности и составляют модель звуковосприятия.

Получился очень компактный и эффективный с точки зрения затрат вычислительных ресурсов алгоритм. Анализ с его помощью требует ничтожно малых затрат процессорного времени. Кроме того, увеличение исходной базы образцов с целью более полного и точного описания акустической модели никак не влияет ни на размеры получаемой структуры, ни на её быстродействие, но при этом улучшает качество работы. Сразу после выращивания алгоритм готов к использованию.

Конечно, представленная версия программы не идеальна. Но сама по себе технология в принципе не имеет ограничений по качеству.

После обнаружения звуков речи решается следующая задача: сложить из букв такую комбинацию, которая при прочтении по возможности точнее соответствовала бы этим звукам. Важное замечание: словарь на этом этапе не используется! (При необходимости он идёт "прицепом".) Такая задача возложена на алгоритм сборки текста. Он написан обычным способом, но и здесь имеется своя "фишка". В данном случае тоже задействованы эволюционные процессы, но они протекают во время работы готовой программы, а не на этапе её создания. То есть текст формируется, как продукт творческой деятельности. Это пример машинного творчества.

1. Описание продукта

На этой странице можно скачать и испытать в работе программу "Перпетуум М" (версия 4.01), а также сценарии к ней. Информация о приобретении программы и несколько советов по ее использованию находятся в конце страницы.

Программа "Перпетуум М" имеет встроенный язык программирования, благодаря которому она способна удивительным образом перевоплощаться. Этот язык позволяет создавать игры, тесты, обучающие и развивающие программы, системы управления различными объектами. Во всех этих случаях возможно использование речевого ввода и вывода информации.

Чтобы создать, например, игру или тест, пишется сценарий на языке скриптов для программы "Перпетуум М". Сценарий представляет собой обычный текстовый файл, в котором по определенным правилам сформулирован алгоритм действий. Эти правила сравнительно просты, поэтому научиться писать скрипты для "Перпетуум М" гораздо легче, чем выучить один из "крутых" языков программирования. Причем возможности языка скриптов вовсе не "игрушечные". С его помощью можно осуществлять большие, серьёзные и ответственные проекты, которые зачастую внешне и по качеству не уступают продуктам, написанным на традиционных языках.

Количество подключаемых к программе сценариев не ограничено. Как и основная программа ("Перпетуум М"), каждый такой сценарий тоже является объектом авторского права. Независимые разработчики могут создавать свои сценарии и заниматься их коммерческим распространением. Но на этой странице размещаются сценарии, которыми можно пользоваться бесплатно (при условии соблюдения требований Лицензионного соглашения на программу "Перпетуум М").

В программе имеется возможность передавать информацию в любые другие приложения путем имитации нажатий клавиш на клавиатуре (вводить текст, управлять другим приложением). Создателям систем "умный дом", а также школьным кружкам автоматики и робототехники или просто увлеченным людям предлагается очень простой способ соединения компьютера с исполнительными устройствами и датчиками. Почитать руководство по использованию программы "Перпетуум М".

2. Программа "Перпетуум М", бесплатные сценарии к ней, примеры и дополнительная информация

Скачать программу Перпетуум М

Галочка Скачать программу "Перпетуум М" 4.01   RAR-архив   Размер 6 Мбайт.


 

Здесь находится программа "Перпетуум М" 4.01. Установки она не требует. Нужно лишь распаковать архив в любую папку на жёстком диске. После этого можно запускать файл perpetuum.exe
 

Галочка Игра "Юный математик, подготовка к школе"   RAR-архив   Размер 8 Мбайт

Скриншот игры

Прошло десять лет после выхода простенькой обучающей игры для дошкольников, в которой были задачи только на сложение. И вот, в мае 2015 года, выпущена новая игра. В ней реализованы математические задачи на все основные темы в соответствии со школьными требованиями для первого класса. В новой игре 4 вида картинок. Некоторые из них имеют по 7 цветов. Программа "выдумывает" задачи во время работы путем случайного комбинирования множества различных параметров, поэтому повторы одной и той же задачи случаются нечасто. В течение всей игры общение с компьютером происходит только в устной форме - клавиатура и мышь не используются. Детишкам нравится разговаривать со "спрятанным в компьютере человечком": он не ругает за ошибки и хвалит за правильные ответы. Этот "человечек" готов терпеливо объяснять одно и то же бесконечное число раз.

Скачать установочный ахив программы можно щелчком по картинке. В этом архиве уже есть основная программа ("Перпетуум М"), поэтому дополнительно скачивать ее не нужно. Установка программы сводится лишь к тому, чтобы создать новую папку на жестком диске и распаковать в нее содержимое архива. Далее можно запускать файл perpetuum.exe (Читать полную версию статьи...)


Старенькая игра 2005 года "Учимся считать до десяти! Жуки"   RAR-архив   Размер 714 Кб

В данном архиве находится старый сценарий, созданный в 2005 году: обучающая игра для дошкольников и первоклашек "Учимся считать до десяти! Жуки". Программа в игровой, ненавязчивой форме знакомит ребёнка с цифрами и учит его сложению чисел до десяти. Взаимодействие с компьютером происходит без мыши и клавиатуры - только с помощью речи. Для занятий с детьми теперь лучше использовать новую, более совершенную игру "Юный математик, подготовка к школе", ссылка на скачивание которой дана выше. А этот старенький сценарий оставлен на сайте в качестве примера для желающих научиться создавать свои сценарии.
    Скачайте этот архив, установите сценарий в соответствии с инструкцией, находящейся в этом же архиве, и запустите программу perpetuum.exe В меню сценариев появится еще одна строка.
    За годы, прошедшие со времени создания этой игры, немало детишек научилось считать с её помощью. Некоторые из них уже повзрослели.
 

Галочка Методика применения программы "Перпетуум М" для управления приложениями   (HTM-документ   27 Кб)

На примере настройки голосового управления редактором изображений Photoshop 8.0 данная методика подробно и поэтапно описывает все необходимые шаги, позволяющие в итоге более удобно и эффективно управлять приложением. Действуя аналогично, можно настроить голосовое управление большинством приложений. Замените наиболее частые и сложные манипуляции мышью и клавиатурой произнесением слов или фраз, обозначающих соответствующие функции. При значительном объёме обрабатываемой информации речевое управление позволяет существенно сократить затраты времени, снизить утомляемость человека и сохранить зрение.
 

Галочка Медицинская диагностическая экспертная система "Доктор Нейлор"   RAR-архив   Размер 1.3 Мб   (2007 год)

У каждого из нас время от времени бывают проблемы со здоровьем. И как хочется в такие минуты, чтобы рядом оказался друг, который что-то понимает в медицине! Пусть даже он не сможет устранить недуг, но хотя бы поможет прояснить ситуацию, поставит приблизительный диагноз. "Доктор Нейлор" - это, хоть и маленькая, но, тем не менее, самая настоящая экспертная система. Скачайте и установите этот сценарий. Подключите микрофон, убедитесь, что он нормально работает. Включите колонки или подсоедините наушники. Запустите программу perpetuum.exe В появившемся меню выберите пункт "Доктор Нейлор". Все, теперь на какое-то время забудьте, что перед вами машина. Можете даже глаза закрыть. Поговорите с доктором, ответьте на его вопросы. Выяснив всю необходимую ему информацию, доктор расскажет вам, что он думает о вашей хвори, и даже предложит вывести результаты в Excel. Разумеется, по одним только вопросам-ответам поставить диагноз не возьмется и доктор-человек, но в той степени, в какой это все-таки возможно, доктор-машина делает это неплохо. Убедитесь сами.
База знаний экспертной системы взята из книги "Как построить свою экспертную систему" К. Нейлор, Москва Энергоатомиздат 1991 г. ISBN 5-283-02502-0
 

Галочка Программатор для микроконтроллеров   (htm-страница)

Разнообразие областей применения программы "Перпетуум М" не перестает удивлять. Во время работы над версией 4.01 пришлось создавать различные тесты для испытания новых функций программы. В качестве одного из тестов, позволяющих проверить функции для работы с портом был создан сценарий программатора микроконтроллера ATtiny44. Программатор получился настолько удобным, что возникла идея развить это направление. Так появился скрипт - программатор микроконтроллеров для "Перпетуум М".
      Чем он лучше других программаторов? Во-первых, там все, как на ладони - сценарий программатора является в сущности открытым исходником, который можно просматривать и изменять по своему усмотрению. Во-вторых, не нужна аппаратная часть программатора: достаточно приобрести за пару-тройку долларов конвертер USB-RS232TTL. Это лучшее решение для любителей, которые, судя по публикациям в интернете, вынуждены собирать достаточно сложные схемы, нередко ставящие их перед проблемой курицы и яйца: чтобы изготовить программатор, нужно запрограммировать для него микроконтроллер, а для этого нужен программатор... В случае с "Перпетуум М" все это решается гораздо проще. Впридачу ко всему, при желании программатор можно легко дополнить речевыми функциями, что полезно для людей со слабым зрением.
 

Галочка Примеры и полезные заготовки

В этом разделе собраны сценарии, предназначенные прежде всего для изучения языка, на котором они создаются. Здесь встречаются интересные примеры, решения и приемы программирования. Некоторые из этих сценариев можно использовать как заготовки для создания собственных программ.


 

Пример "Инсталлятор+Архив"   RAR-архив   Размер 29,7 Кб

В этом сценарии речевые функции не используются. Он полезен, прежде всего, для тех, кто пожелает глубоко разобраться в специфике языка сценариев, оценить его возможности, освоить работу с визуальными компонентами. На самом деле здесь даже два сценария. После распаковки архива InstAndArch.rar доступным станет только один из них - инсталлятор. Если вы им воспользуетесь и выполните предусмотренные сценарием действия, то будет установлен и настроен второй сценарий - "Удобный архив". С помощью второго сценария можно легко сохранять копии ценных данных, требующих частого резервирования. Копии сохраняются в так называемых ящиках. Для каждого непустого ящика отображается дата и время последней записи данных. Записанные данные можно также извлечь из любого ящика и вернуть их в папку, из которой они были ранее скопированы. Пользоваться этим сценарием гораздо удобнее, чем выполнять те же действия напрямую с файлами в проводнике.


 

Пример взаимодействия программы "Перпетуум М" с MS Excel   RAR-архив   Размер 232 Кб

В этом архиве находится пример ещё одного возможного применения программы "Перпетуум М". Он показывает, как можно вводить в таблицу числа голосом, а также запрашивать значения ячеек. Это еще и прекрасная заготовка для построения программы, обучающей работе в Excel! Скачайте и установите сценарий, запустите программу perpetuum.exe, выберите в меню "Пример взаимодействия с MS Excel" и пообщайтесь с программой. Получается эффективно и эффектно!


 

Пример взаимодействия с MS Word.   RAR-архив   Размер 1 Кб

Этот сценарий предназначен для демонстрации возможности взаимодействия программы "Перпетуум М" с редактором MS Word по технологии OLE. Актуальность использования технологии OLE снизилась в связи с появлением функции имитации клавиатуры в третьей версии программы. Направить текст в любое приложение стало возможным и без OLE. Тем не менее, сценарий может быть интересен программистам.
    Примечание: с некоторыми версиями MS Word этот сценарий может не работать. Word в таком случае открывается, но не создает автоматически новый документ. Если же создать документ вручную и закрыть сообщение об ошибке сценария, то дальше всё работает.


 

Пример вызова приложений из сценария "Перпетуум М"   RAR-архив   Размер 597 байт

Два простеньких сценария (в каждом по одной строчке), показывающих работу функции, с помощью которой можно открывать документы и запускать приложения. Один из них открывает текстовый редактор "Блокнот", другой - почтовую программу. Напишите в окне почтовой программы несколько строк со своими впечатлениями о программе "Перпетуум М" и нажмите "Отправить". Речевые функции здесь не используются.

3. Приобретение программы

Программа распространяется условно-бесплатно. Это означает, что ее можно бесплатно скачать и использовать в течение ознакомительного периода, который составляет 15 дней. За это время нужно будет принять решение о её дальнейшем использовании. В случае отказа от дальнейшего использования достаточно будет удалить программу - больше ничего не потребуется. Чтобы продолжить использование программы, необходимо будет оплатить лицензию и получить лицензионный ключ. Для этого напишите о своём решении письмо на электронный ящик jkit в почтовой системе mail.ru

Оплатив один раз регистрацию основной программы, вы получаете в подарок дополнительные программы - размещенные на этой странице сценарии. И в дальнейшем, по мере выхода новых бесплатных сценариев, вы сможете их скачивать с сайта и свободно ими пользоваться. Также вы можете сами создавать свои сценарии или изменять готовые. Сценарий для "Перпетуум М" - это тоже программа, которую можно просматривать и изменять в обычном текстовом редакторе. Описание языка сценариев находится в архиве с основной программой.

4. Несколько советов по использованию программы

Для работы с программой желательно использовать внешний микрофон. Он должен быть качественным, исправным и совместимым с используемым компьютером. Новая версия программы гораздо стабильнее работает в условиях шума, но если все-таки возникнут сложности, рекомендуется воспользоваться следующими советами.

  • Зайдите через "панель управления" Windows в регулятор громкости источников записи (микшер записи) и убедитесь, что в системе отключены все источники записываемого сигнала кроме используемого микрофона. Лишний источник (даже физически не подсоединённый, но включенный в микшере) может сильно шуметь.
  • Проверьте качество сигнала на слух с помощью встроенной в программу функции согласно руководству по использованию. Сильные шумы и искажения, способные нарушить работу программы, обычно легко обнаруживаются таким способом.
  • Прочитайте руководство по использованию. Его можно найти в самой программе, щёлкнув мышкой по надписи "Как пользоваться".
  • Более подробно о возможных неполадках читайте здесь.