Перейти к содержанию

Простой Алгоритм Распознавания Речи (1 Слова)


P&V

Рекомендуемые сообщения

Друзья, никто не пытался сделать что-то похожее на голосовой набор в телефоне, но только на родном и близком сердцу микроконтроллере?

Человек нажимает кнопку и говорит слово - записывает образец. Отпускает кнопку, запись закончена.

Алгоритм:

На протяжение записи образца, каждые 5 мс контроллер делает отметку и вносит в память (амплитуда и частота). На слово, например, "Вперед" потратится в среднем 1,5 с. Значит, в памяти окажется 300 точек, содержащих амплитуду и частоту.

В конечном итоге, контроллер знает длину слова (по нажатию и отпуску кнопки) и 300 точек с амплитудой и частотой.

Значит, Требуется контроллер с АЦП, приличным объёмом памяти, высокой скоростью работы (наверное, хотя бы больше 4 МГц, например 20 МГц).

Далее, человек нажимает кнопку и говорит это же слово (естественно, стараясь соблюдать первоначальную интонацию), отпускает кнопку. Контроллер делает тоже самое, что и в первом случае.

Теперь он имеет 2 образца.

Он должен их сравнить. Здесь -то и потребуется высокая скорость и хитроумный алгоритм сравнения.

1 этап - сравнение длин фраз. С допущением несостыковки звучания по времени +/- 100 мс, например. Если это условие выполнится, переход на 2 этап.

2 этап - сравнение частот в каждом отрезке 2-х фраз между собой (тоже с каким-то допуском). На самом деле, здесь можно говорить не о частоте, а о количестве пришедших импульсов за каждый отрезок в 5 мс.

3 этап - сравнение амплитуд, зафиксированных АЦП на каждом из отрезков в 5 мс (речь идёт об усреднённом для каждого отрезка значении амплитуды, естесственно) . Здесь лучше сравнивать разность амплитуд на каждом отрезке в 5 мс 2-х образцов. Поскольку общий уровень громкости сигнала мог изменится с момента внесения образца. Значит, разность амплитуд должна быть примерно оддинакова на протяжение всех отрезков.

Ну кто что думает? Никто не делал что-то подобное? Это вообще реально с точки зрения возможностей контроллеров, например PIC 16 серии?

Изменено пользователем P&V
Ссылка на комментарий
Поделиться на другие сайты

Реклама: ООО ТД Промэлектроника, ИНН: 6659197470, Тел: 8 (800) 1000-321

Я думаю врядли простой контроллер справится с этим.

как вариант можно использовать микруху специально

созданную для распознавания речи, например HM2007

: 64КБ памяти

: 40 слов длиной 1.92 сек

: максимальное время ответа 300мс

: ручной и процессорный режим управления

: прямое подключение микрофона

1 километр = 1024 метр

Ссылка на комментарий
Поделиться на другие сайты

20% скидка на весь каталог электронных компонентов в ТМ Электроникс!

Акция "Лето ближе - цены ниже", успей сделать выгодные покупки!

Плюс весь апрель действует скидка 10% по промокоду APREL24 + 15% кэшбэк и бесплатная доставка!

Перейти на страницу акции

Реклама: ООО ТМ ЭЛЕКТРОНИКС, ИНН: 7806548420, info@tmelectronics.ru, +7(812)4094849

А вы для начала попробуёте взять микрофон и попробовать несколько дней наигрывать одно и тоже слово :) Плюс проделать это со всеми в семье :) И потом просто их попробуйте сровнить :) Ненайдёте ни одного похожего а по вашему алгоритму будет роспозновать только слова записаныые на ленту :) Для роспознавания (точнее отличении от других) нужно использовать DSP как минимум... Или очень быстрый процесор... Я бы для начала порекомендовал или использовать уже готовые решения которые вам дали выше или начать изучать теорию...

Ссылка на комментарий
Поделиться на другие сайты

Выбираем схему BMS для корректной работы литий-железофосфатных (LiFePO4) аккумуляторов

 Обязательным условием долгой и стабильной работы Li-FePO4-аккумуляторов, в том числе и производства EVE Energy, является применение специализированных BMS-микросхем. Литий-железофосфатные АКБ отличаются такими характеристиками, как высокая многократность циклов заряда-разряда, безопасность, возможность быстрой зарядки, устойчивость к буферному режиму работы и приемлемая стоимость. Но для этих АКБ, также как и для других, очень важен контроль процесса заряда и разряда, а специализированных микросхем для этого вида аккумуляторов не так много. Инженеры КОМПЭЛ подготовили список имеющихся микросхем и возможных решений от разных производителей. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Друзья, никто, боже упаси, не собирается претендовать на лавры первого радиолюбителя, решившего проблему распознавания речи и вывести Россию вперед на мировом рынке подобных разработок. Это, по меньшей мере, просто смешно (нашей стране уже ничто не поможет :), она очень давно отстала от всех подряд высоких технологий, полезных населению страны. Естественно, я не говорю о наших военных самолётах, чудо ракетах, это простым людям до лампочки, мы с етого ничё не имеем.)

Просто, вдруг, кто-то прикололся и сделал что-то подобное.

За микруху спасибо. Интересно, скока стоит.

Уясе, оно более 100 баков стоит. Впрочем, наверное, того стоит.

Ссылка на комментарий
Поделиться на другие сайты

самое простое это выделить определенные буквы в слове и распознавать их поставив полосовой фильтр....

была гдето информация если надо поишю...

Выход есть всегда...

Ссылка на комментарий
Поделиться на другие сайты

книгу нашел

Юрий Михайлович Отряшенков

Юный кибернетик

москва 1978 год

там написаны основы

в ближайщее время попробую отсканировать страницы нужные

210-219

выложу ссылки тут

Выход есть всегда...

Ссылка на комментарий
Поделиться на другие сайты

А спросить гугля религия непозволяет? http://www.google.cz/search?hl=en&neww...thm&spell=1

или http://www.google.cz/search?hl=en&neww...amp;btnG=Search

Изменено пользователем wowa
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Ответить в этой теме...

×   Вставлено с форматированием.   Восстановить форматирование

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Загрузка...
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Сообщения

    • Доброго времени суток. Столкнулся с проблемой: не получается скачать пакет STM32F4 (пробовал и другие, ошибка та же) при нажатии кнопки install появляется ошибка (первый скриншот). Такое ощущение, что CubeIDE не может подключиться к сети, постоянно появляется окно как на втором скиншоте. Подскажите как можно исправить проблему?
    • Я вас конечно уважаю, но хамить мне не надо. Все УНЧ что я создавал сначала до идеала дорабатывались в симуляторе, и только потом собирались. В 98% случаев они сразу работали корректно. Были исключения, но там проблемы были в разводке платы и деталях а не симуляторе. Тот же мой VAC 2.0 ПОЛНОСТЬЮ совпал по результатам тестов в железе с результатами тестов в симуляторе.  Эта схема это простейший ВК в AB классе к которому подключили ОУ для усиления напряжения. Нет ни единой причины этой схеме работать некорректно или плохо. Единственные 2 варианта почему будет работать плохо/не работать, это либо накосячено при сборке или детали обвязки неисправны, либо сам ОУ палëный. Качество работы этой схемы очень сильно будет зависеть от качества ОУ и симулятор тут не при чëм. И опять же, этой схеме уже больше 30 лет и еë собирали сотни человек! Если собрано на нормальных деталях, эта схема будет работать как надо и выдаст качественный звук. 
    • У многих в голове "битые ячейки". Ясно сказано, что работает видео в помещении, опробовано десятки раз. Весь снятый материал в лесу и в поле пошёл в корзину и также опробовано не один раз. Приобретена новая карта за 1К. Видео ещё хуже, чем с тех "чудо флешек". https://disk.yandex.ru/i/Ww52T3leg99VxA
    • Сорри, вопрос звучит не однозначно. Меня интересовало - нужен ли вынос наружу головок или не нужен, а не их расположение на передней панели относительно друг друга.
    • Когда то я тоже был от неё в ужасе, но быстро прошло. К тому же это одно из лучших технических решений, если не лучшее.
    • Совершенно верно. Смысл сближения +/- шин в том чтобы получить эти контуры максимально симметрично расположенными относительно чувствительных к помехам точек монтажа. Однако при этом сами контуры увеличиваются по площади и меняют плоскость расположения на менее выгодную по помехам по сравнению с "классикой" (полигон земли под шинами). Поэтому, лично я предпочитаю трассировать прямые и возвратные проводники  друг над другом, чтобы минимизировать излучение изначально.
    • Почитайте Часть вопросов отпадет.
×
×
  • Создать...