Перейти к содержанию

Распознавание Речи На Микроконтроллерах


Рекомендуемые сообщения

Доброго всем времени суток!

Честно признаться, не уверен, что создаю тему в нужном разделе, но так как я новичок, а тема касается звука, надеюсь попал верно.

И так. Есть необходимость распознавания речи. Гугл завёл меня вот в какие дали:

  • использование онлайн сервисов типа Гугл или Яндекс
  • Использование оффлайн библиотек кои есть для определённых ОСей
  • Использование Arduino и в скетче для неё использовать uSpeach

Использование онлайн сервисов отпадает сразу же, так как я хочу свой прибор сделать автономным от сетей.

Готовые библиотеки есть для Андроида, АйОСа, винды и есть порт этих же технологий под такие языки как Ruby и Javascript.

Arduino и uSpeach судя по отзывам работают только с латиницей и точность определения 30-40 процентов, а это, простите, совсем не серьёзно.

Отсюда я пришёл к выводу, что для решения моей задачи есть несколько вариантов:

  1. Собрать некое железо, на которое встанет ядро Андроида и писать приложение под него, так как его библиотеки работают очень успешно в этом направлении
  2. Использовать таки Arduino, но дописывать библиотеку самостоятельно, пока она не начнёт работать
  3. Собирать собственную конфигурацию железа и писать всё самому с нуля.

Третий вариант, конечно, самый правильный с той точки зрения, что если всё и будет плохо, то только я в этом и буду виноват, а если всё получится, то только я и буду молодец. Но вот стоит ли результат труда, пока не уверен.

Мне интересен Ваш опыт в данном направлении, возможно, кто-то занимался этим вопросом, возможно я просто что-то плохо догуглил, и на самом деле решение на поверхности. А может оно и не так и нужно много и долго трудиться. Цель наипримитивнейшая: получить сказанную фразу. То есть без всяких ИИ, выполнения дальнейших команд и так далее.

Буду благодарен за любой совет!

Ссылка на комментарий
Поделиться на другие сайты

солар, ну тут вопрос даже не в нужности ненужности... Скорее меня интересует этот вопрос для саморазвития. Сферы применения - вопрос второстепенный. В данном случае.

Надеюсь, не надоест)) По крайней мере, если будет получатся

Ссылка на комментарий
Поделиться на другие сайты

Сравнительное тестирование аккумуляторов EVE Energy и Samsung типоразмера 18650

Инженеры КОМПЭЛ провели сравнительное тестирование аккумуляторов EVE и Samsung популярного для бытовых и индустриальных применений типоразмера 18650. 

Для теста были выбраны аккумуляторы литий-никельмарганцевой системы: по два образца одного наименования каждого производителя – и протестированы на двух значениях тока разряда: 0,5 А и 2,5 А. Испытания проводились в нормальных условиях на электронной нагрузке EBD-USB от ZKEtech, а зарядка осуществлялась от лабораторного источника питания в режиме CC+CV в соответствии с рекомендациями в даташите на определенную модель. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Новый аккумулятор EVE серии PLM для GSM-трекеров, работающих в жёстких условиях (до -40°С)

Компания EVE выпустила новый аккумулятор серии PLM, сочетающий в себе высокую безопасность, длительный срок службы, широкий температурный диапазон и высокую токоотдачу даже при отрицательной температуре. 

Эти аккумуляторы поддерживают заряд при температуре от -40/-20°С (сниженным значением тока), безопасны (не воспламеняются и не взрываются) при механическом повреждении (протыкание и сдавливание), устойчивы к вибрации. Они могут применяться как для автотранспорта (трекеры, маячки, сигнализация), так и для промышленных устройств мониторинга, IoT-устройств. Подробнее параметры и результаты тестов новой серии PLM по ссылке.

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Тс... если просто - то ты должен наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами, но это не сработает с другими голосами...

а так только ОК, Гугл... смартфоны и компы же сами не распознают, а качают инфу на суперкомпы и там уже идет обработка...

я думаю тоже не вариант....

https://habrahabr.ru/post/237589/

за тебя уже все придумали....

Ссылка на комментарий
Поделиться на другие сайты

Литиевые батарейки и аккумуляторы от мирового лидера  EVE в Компэл

Компания Компэл, официальный дистрибьютор EVE Energy, бренда №1 по производству химических источников тока (ХИТ) в мире, предлагает продукцию EVE как со склада, так и под заказ. Компания EVE широко известна в странах Европы, Америки и Юго-Восточной Азии уже более 20 лет. Недавно EVE была объявлена поставщиком новых аккумуляторных элементов круглого формата для электрических моделей «нового класса» компании BMW.

Продукция EVE предназначена для самого широкого спектра применений – от бытового до промышленного. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами

Даже Nokia3310 не опускался до просто сравнения. Хотя я мог неверно понять суть предыдущего автора - всё дело в шаблонах.

ТС, читайте для начала https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%80%D0%B5%D1%87%D0%B8

Я не раздаю удочки. Я продаю рыбу.

Ссылка на комментарий
Поделиться на другие сайты

нокиа3310 как раз-таки сравнивает с одной из 20 фраз.

использовалось там такое:

Дельта-модуляция

почитайте

https://ru.wikipedia...ельта-модуляция

https://ru.wikipedia...ьта-кодирование

http://websound.ru/a...ry/earcompr.htm

http://dic.academic....f/ruwiki/891301

делали в своё время, на немного разогнанном PIC

из трёх фраз успевала найти решение на 2-4 секунды

сейчас, на новых мощных МК, это можно сделать проще, не выигрывая каждый маш.такт в программе

вспомнилось

была версия и на

Импульсно-кодовая модуляция

https://ru.wikipedia...довая_модуляция

программно делали можно сказать огибающую всего потока. Его сжимали с потерей в Х раз, получали некие "подписи" каждой фразы

При сравнении делали запас в 30 процентов для увеличения распознавания.

Изменено пользователем Гость
Ссылка на комментарий
Поделиться на другие сайты

а где собираетесь применить?

тема интересная

Самое первое применение - это не более чем домашняя поделка. Дальше идей море, но не сказал бы, что они коммерчески выгодны, опять таки, всё это скорее для собственного развития. Как самый банальный вариант: умный дом.

Тс... если просто - то ты должен наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами, но это не сработает с другими голосами...

а так только ОК, Гугл... смартфоны и компы же сами не распознают, а качают инфу на суперкомпы и там уже идет обработка...

я думаю тоже не вариант....

Противоречите сами себе, ссылка на статью с хабра как раз таки говорит о том, что распознавание идёт на самом смартфоне, а не на неком облачном суперкомпьютере.

Я в своём первом сообщении описал и существование этих библиотек и там же уточнил, что хочу реализовать нечто подобное абстрагируясь от существующих приборов и сетей. Можно было бы и на планшете всё это решить, но цель в другом изначально.

Александр Д., благодарю за наводки, буду разбираться

Ссылка на комментарий
Поделиться на другие сайты

Вы видео внимательно смотрели?? на 2:10 ясно сказано, что проговаривается на русском название каждого устройства. которое потом контроллер Эра выбирает из произнесенных команд.

можно вместо лампы сказать "задница" и с таким же успехом он сработает.

Накачайте для экспериментов кучу программ для распознавания голоса под РС ... поиграйте... если вас устроит - то сравните мощность своего компа с тем устройством которое вы хотите спаять сами....

Ссылка на комментарий
Поделиться на другие сайты

Я бы делал третий вариант. Собственно распознаванием речи не занимался, но много чего делал программно/железного, почти всегда выбирал Ваш третий вариант. Разочарований пока не было. Минус только один - наибольшая из всех вариантов трудоёмкость. Если это не пугает - удачи!

Нет слова "не могу", есть слово "не хочу"...

Ссылка на комментарий
Поделиться на другие сайты

Вы видео внимательно смотрели??

А вы внимательно статью читали?

Или может быть документацию к этой библиотеке?

forever_student, ну, скорее всего так и будет. Осталось выбрать путь... Так как я всё-таки в конструировании с нуля новичок (раньше всё собирал уже разработанное кем-то другим). По совести нужно выбрать какой-то достаточно мощный МК + дополнительную оперативную память.

С программированием у меня проблем нет, так что, думаю, прошивку написать смогу. Но хорошо бы иметь хоть какие-то наработки. Буду читать статьи, может натолкнёт на мысль.

Из всего вышесказанного я понял, что для моей идеи решения "из коробки" не имеется. Значит буду думать дальше.

Ссылка на комментарий
Поделиться на другие сайты

автору темы

поищите в Сети Диктофон цифровой на AVR

там попадался ваш проект на 70%: усиление и фильтрация сигнала, преобразование в цифру. Вроде и внешняя память была прикручена, параллельная. Как раз вам надо на 5 секунд где-то до 8000*5= 40 000 выборок / байт

http://www.gaw.ru/html.cgi/txt/app/Atmel/memory/at45_to_avr.htm

http://www.roman.by/r-84089.html

http://ffix.ru/2010-11-04-13-47-03/item/7-%D1%86%D0%B8%D1%84%D1%80%D0%BE%D0%B2%D0%BE%D0%B9-%D0%B4%D0%B8%D0%BA%D1%82%D0%BE%D1%84%D0%BE%D0%BD-avr335-%20-%D0%BF%D0%B5%D1%80%D0%B5%D0%B4%D0%B0%D1%87%D0%B0-%D1%80%D0%B5%D1%87%D0%B8-%D0%BF%D0%BE-%D0%BF%D1%80%D0%BE%D0%B2%D0%BE%D0%B4%D0%B0%D0%BC.html

и

http://forum.easyelectronics.ru/viewtopic.php?p=194098

Ссылка на комментарий
Поделиться на другие сайты

next sound, 03 Февраль 2016 - 11:45, написал:

а где собираетесь применить?

тема интересная

Самое первое применение - это не более чем домашняя поделка. Дальше идей море, но не сказал бы, что они коммерчески выгодны, опять таки, всё это скорее для собственного развития. Как самый банальный вариант: умный дом.

меня интересует эта же тема

Ссылка на комментарий
Поделиться на другие сайты

автору темы

поищите в Сети Диктофон цифровой на AVR

там попадался ваш проект на 70%: усиление и фильтрация сигнала, преобразование в цифру. Вроде и внешняя память была прикручена, параллельная. Как раз вам надо на 5 секунд где-то до 8000*5= 40 000 выборок / байт

Благодарю за идею! Это уже совсем неплохо.

next sound, чисто теоретически в сети много материала, как это реализовать средствами адндроид смартфона и ардуино. Но мне хочется именно абстрагироваться от сторонних устройств в принципе.

Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Ответить в этой теме...

×   Вставлено с форматированием.   Восстановить форматирование

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Загрузка...
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...