Перейти к содержанию

Простой Алгоритм Распознавания Речи (1 Слова)


P&V

Рекомендуемые сообщения

Друзья, никто не пытался сделать что-то похожее на голосовой набор в телефоне, но только на родном и близком сердцу микроконтроллере?

Человек нажимает кнопку и говорит слово - записывает образец. Отпускает кнопку, запись закончена.

Алгоритм:

На протяжение записи образца, каждые 5 мс контроллер делает отметку и вносит в память (амплитуда и частота). На слово, например, "Вперед" потратится в среднем 1,5 с. Значит, в памяти окажется 300 точек, содержащих амплитуду и частоту.

В конечном итоге, контроллер знает длину слова (по нажатию и отпуску кнопки) и 300 точек с амплитудой и частотой.

Значит, Требуется контроллер с АЦП, приличным объёмом памяти, высокой скоростью работы (наверное, хотя бы больше 4 МГц, например 20 МГц).

Далее, человек нажимает кнопку и говорит это же слово (естественно, стараясь соблюдать первоначальную интонацию), отпускает кнопку. Контроллер делает тоже самое, что и в первом случае.

Теперь он имеет 2 образца.

Он должен их сравнить. Здесь -то и потребуется высокая скорость и хитроумный алгоритм сравнения.

1 этап - сравнение длин фраз. С допущением несостыковки звучания по времени +/- 100 мс, например. Если это условие выполнится, переход на 2 этап.

2 этап - сравнение частот в каждом отрезке 2-х фраз между собой (тоже с каким-то допуском). На самом деле, здесь можно говорить не о частоте, а о количестве пришедших импульсов за каждый отрезок в 5 мс.

3 этап - сравнение амплитуд, зафиксированных АЦП на каждом из отрезков в 5 мс (речь идёт об усреднённом для каждого отрезка значении амплитуды, естесственно) . Здесь лучше сравнивать разность амплитуд на каждом отрезке в 5 мс 2-х образцов. Поскольку общий уровень громкости сигнала мог изменится с момента внесения образца. Значит, разность амплитуд должна быть примерно оддинакова на протяжение всех отрезков.

Ну кто что думает? Никто не делал что-то подобное? Это вообще реально с точки зрения возможностей контроллеров, например PIC 16 серии?

Изменено пользователем P&V
Ссылка на комментарий
Поделиться на другие сайты

Реклама: ООО ТД Промэлектроника, ИНН: 6659197470, Тел: 8 (800) 1000-321

Я думаю врядли простой контроллер справится с этим.

как вариант можно использовать микруху специально

созданную для распознавания речи, например HM2007

: 64КБ памяти

: 40 слов длиной 1.92 сек

: максимальное время ответа 300мс

: ручной и процессорный режим управления

: прямое подключение микрофона

1 километр = 1024 метр

Ссылка на комментарий
Поделиться на другие сайты

20% скидка на весь каталог электронных компонентов в ТМ Электроникс!

Акция "Лето ближе - цены ниже", успей сделать выгодные покупки!

Плюс весь апрель действует скидка 10% по промокоду APREL24 + 15% кэшбэк и бесплатная доставка!

Перейти на страницу акции

Реклама: ООО ТМ ЭЛЕКТРОНИКС, ИНН: 7806548420, info@tmelectronics.ru, +7(812)4094849

А вы для начала попробуёте взять микрофон и попробовать несколько дней наигрывать одно и тоже слово :) Плюс проделать это со всеми в семье :) И потом просто их попробуйте сровнить :) Ненайдёте ни одного похожего а по вашему алгоритму будет роспозновать только слова записаныые на ленту :) Для роспознавания (точнее отличении от других) нужно использовать DSP как минимум... Или очень быстрый процесор... Я бы для начала порекомендовал или использовать уже готовые решения которые вам дали выше или начать изучать теорию...

Ссылка на комментарий
Поделиться на другие сайты

Выбираем схему BMS для корректной работы литий-железофосфатных (LiFePO4) аккумуляторов

 Обязательным условием долгой и стабильной работы Li-FePO4-аккумуляторов, в том числе и производства EVE Energy, является применение специализированных BMS-микросхем. Литий-железофосфатные АКБ отличаются такими характеристиками, как высокая многократность циклов заряда-разряда, безопасность, возможность быстрой зарядки, устойчивость к буферному режиму работы и приемлемая стоимость. Но для этих АКБ, также как и для других, очень важен контроль процесса заряда и разряда, а специализированных микросхем для этого вида аккумуляторов не так много. Инженеры КОМПЭЛ подготовили список имеющихся микросхем и возможных решений от разных производителей. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Друзья, никто, боже упаси, не собирается претендовать на лавры первого радиолюбителя, решившего проблему распознавания речи и вывести Россию вперед на мировом рынке подобных разработок. Это, по меньшей мере, просто смешно (нашей стране уже ничто не поможет :), она очень давно отстала от всех подряд высоких технологий, полезных населению страны. Естественно, я не говорю о наших военных самолётах, чудо ракетах, это простым людям до лампочки, мы с етого ничё не имеем.)

Просто, вдруг, кто-то прикололся и сделал что-то подобное.

За микруху спасибо. Интересно, скока стоит.

Уясе, оно более 100 баков стоит. Впрочем, наверное, того стоит.

Ссылка на комментарий
Поделиться на другие сайты

самое простое это выделить определенные буквы в слове и распознавать их поставив полосовой фильтр....

была гдето информация если надо поишю...

Выход есть всегда...

Ссылка на комментарий
Поделиться на другие сайты

книгу нашел

Юрий Михайлович Отряшенков

Юный кибернетик

москва 1978 год

там написаны основы

в ближайщее время попробую отсканировать страницы нужные

210-219

выложу ссылки тут

Выход есть всегда...

Ссылка на комментарий
Поделиться на другие сайты

А спросить гугля религия непозволяет? http://www.google.cz/search?hl=en&neww...thm&spell=1

или http://www.google.cz/search?hl=en&neww...amp;btnG=Search

Изменено пользователем wowa
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Ответить в этой теме...

×   Вставлено с форматированием.   Восстановить форматирование

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Загрузка...
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Сообщения

    • Что то в жизни должно стоять 
    • В кАлонки гениус на место тда2003 нормально встает.
    • 2,4кОм уже заказал, новая сложность))) неполярные электролиты, впервые с ними сталкиваюсь, стоят они как космолет, можно конечно сделать из полярных но получится громоздко
    • Конечно нет. Более того, вышеупомянутой 140уд1 достаточно для 90% всех БП, но новые детали позволяют применять разные схемотехнические решения ранее недоступные - например, отсутствие отрицательного источника питания или цепей балансировки ибо их смещение по входам может оказаться пренебрежимо мало, а крайне малый ток полевикового входа не требует сильного согласования импедансов для выравнивания смещений, создаваемых входными токами. Но в чем тогда интерес в разработке схемы, если это будет всё тот же болгарский БП из 70х, причем на тех же самых деталях и по абсолютно такой же схеме Понятно, что особо улучшать схемотехнику линейных БП некуда. Но со старыми деталями, требующими дополнительные пару вольт питания из-за узкого диапазона синфазных сигналов или имеющих почти микроамперы входного тока приходится схемотехнически возиться как с каким-то пажылым дедушкой - там ему костыль в виде отрицательного питания, тут надо импедансы равные по входам, не то смещение будет (у 140уд1, например, даже нет выводов балансировки, т.е. смещение надо вводить отдельной  цепью по входу), а здесь надо выход повторителем усилить, ибо не может раскачать базу силового транзистора... и т.д. Повозиться из интереса можно, но не знаю какое веселье в который раз изобретать один и тот же болгарский велосипед.   Это даже скорее не БП, а гибрид из БП и  вольтамперметра для всяческих издевательств над детальками. Как пример. И вот ещё. Причем эти "много оу" не просто какие-то там буферы-измерялки, а именно в петле ООС стоят, что прибавляет головной боли схемотехнику. Я пытался повторить их "переключалку петель оос", или просто "клампу", как я ее обзываю, в микрокапе хотяб на моделях ОУ типа 741, с использованием в интеграторе TL071, но ничего не вышло, схема стабильно даёт овершуты под 5-10%, что говорит о неоптимально скорректированной под БП АЧХ. Этот рубеж пока что мне не доступен никак, вот  и вожусь со схемой шелестова на четырёх ОУ.  
×
×
  • Создать...