Jump to content

Распознавание Речи На Микроконтроллерах


napalmrain
 Share

Recommended Posts

Доброго всем времени суток!

Честно признаться, не уверен, что создаю тему в нужном разделе, но так как я новичок, а тема касается звука, надеюсь попал верно.

И так. Есть необходимость распознавания речи. Гугл завёл меня вот в какие дали:

  • использование онлайн сервисов типа Гугл или Яндекс
  • Использование оффлайн библиотек кои есть для определённых ОСей
  • Использование Arduino и в скетче для неё использовать uSpeach

Использование онлайн сервисов отпадает сразу же, так как я хочу свой прибор сделать автономным от сетей.

Готовые библиотеки есть для Андроида, АйОСа, винды и есть порт этих же технологий под такие языки как Ruby и Javascript.

Arduino и uSpeach судя по отзывам работают только с латиницей и точность определения 30-40 процентов, а это, простите, совсем не серьёзно.

Отсюда я пришёл к выводу, что для решения моей задачи есть несколько вариантов:

  1. Собрать некое железо, на которое встанет ядро Андроида и писать приложение под него, так как его библиотеки работают очень успешно в этом направлении
  2. Использовать таки Arduino, но дописывать библиотеку самостоятельно, пока она не начнёт работать
  3. Собирать собственную конфигурацию железа и писать всё самому с нуля.

Третий вариант, конечно, самый правильный с той точки зрения, что если всё и будет плохо, то только я в этом и буду виноват, а если всё получится, то только я и буду молодец. Но вот стоит ли результат труда, пока не уверен.

Мне интересен Ваш опыт в данном направлении, возможно, кто-то занимался этим вопросом, возможно я просто что-то плохо догуглил, и на самом деле решение на поверхности. А может оно и не так и нужно много и долго трудиться. Цель наипримитивнейшая: получить сказанную фразу. То есть без всяких ИИ, выполнения дальнейших команд и так далее.

Буду благодарен за любой совет!

Link to comment
Share on other sites

Реклама: ООО ТД Промэлектроника, ИНН: 6659197470, Тел: 8 (800) 1000-321

солар, ну тут вопрос даже не в нужности ненужности... Скорее меня интересует этот вопрос для саморазвития. Сферы применения - вопрос второстепенный. В данном случае.

Надеюсь, не надоест)) По крайней мере, если будет получатся

Link to comment
Share on other sites

Организация питания на основе надежных литиевых аккумуляторов EVE и микросхем азиатского производства

Качественное и безопасное устройство, работающее от аккумулятора, должно учитывать его физические и химические свойства, профили заряда и разряда, их изменение во времени и под влиянием различных условий, таких как температура и ток нагрузки. Мы расскажем о литий-ионных аккумуляторных батареях EVE и нескольких решениях от различных китайских компаний, рекомендуемых для разработок приложений с использованием этих АКБ. Представленные в статье китайские аналоги помогут заменить продукцию западных брендов с оптимизацией цены без потери качества. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Новый аккумулятор EVE серии PLM для GSM-трекеров, работающих в жёстких условиях (до -40°С)

Компания EVE выпустила новый аккумулятор серии PLM, сочетающий в себе высокую безопасность, длительный срок службы, широкий температурный диапазон и высокую токоотдачу даже при отрицательной температуре. 

Эти аккумуляторы поддерживают заряд при температуре от -40/-20°С (сниженным значением тока), безопасны (не воспламеняются и не взрываются) при механическом повреждении (протыкание и сдавливание), устойчивы к вибрации. Они могут применяться как для автотранспорта (трекеры, маячки, сигнализация), так и для промышленных устройств мониторинга, IoT-устройств. Подробнее параметры и результаты тестов новой серии PLM по ссылке.

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Тс... если просто - то ты должен наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами, но это не сработает с другими голосами...

а так только ОК, Гугл... смартфоны и компы же сами не распознают, а качают инфу на суперкомпы и там уже идет обработка...

я думаю тоже не вариант....

https://habrahabr.ru/post/237589/

за тебя уже все придумали....

Link to comment
Share on other sites

Литиевые аккумуляторы EVE Energy и решения для управления перезаряжаемыми источниками тока (материалы вебинара)

Опубликованы материалы вебинара Компэл, посвященного литиевым аккумуляторам EVE Energy и решениям для управления перезаряжаемыми источниками тока.

На вебинаре мы представили информацию не только по линейкам аккумуляторной продукции EVE, но и по решениям для управления ею, что поможет рассмотреть эти ХИТ в качестве дополнительной альтернативы для уже выпускающихся изделий. Также рассмотрели нюансы работы с производителем и сервисы, предоставляемые Компэл по данной продукции. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами

Даже Nokia3310 не опускался до просто сравнения. Хотя я мог неверно понять суть предыдущего автора - всё дело в шаблонах.

ТС, читайте для начала https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%80%D0%B5%D1%87%D0%B8

Я не раздаю удочки. Я продаю рыбу.

Link to comment
Share on other sites

Литиевые батарейки и аккумуляторы от мирового лидера  EVE в Компэл

Компания Компэл, официальный дистрибьютор EVE Energy, бренда №1 по производству химических источников тока (ХИТ) в мире, предлагает продукцию EVE как со склада, так и под заказ. Компания EVE широко известна в странах Европы, Америки и Юго-Восточной Азии уже более 20 лет. Недавно EVE была объявлена поставщиком новых аккумуляторных элементов круглого формата для электрических моделей «нового класса» компании BMW.

Продукция EVE предназначена для самого широкого спектра применений – от бытового до промышленного. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

нокиа3310 как раз-таки сравнивает с одной из 20 фраз.

использовалось там такое:

Дельта-модуляция

почитайте

https://ru.wikipedia...ельта-модуляция

https://ru.wikipedia...ьта-кодирование

http://websound.ru/a...ry/earcompr.htm

http://dic.academic....f/ruwiki/891301

делали в своё время, на немного разогнанном PIC

из трёх фраз успевала найти решение на 2-4 секунды

сейчас, на новых мощных МК, это можно сделать проще, не выигрывая каждый маш.такт в программе

вспомнилось

была версия и на

Импульсно-кодовая модуляция

https://ru.wikipedia...довая_модуляция

программно делали можно сказать огибающую всего потока. Его сжимали с потерей в Х раз, получали некие "подписи" каждой фразы

При сравнении делали запас в 30 процентов для увеличения распознавания.

Edited by Guest
Link to comment
Share on other sites

а где собираетесь применить?

тема интересная

Самое первое применение - это не более чем домашняя поделка. Дальше идей море, но не сказал бы, что они коммерчески выгодны, опять таки, всё это скорее для собственного развития. Как самый банальный вариант: умный дом.

Тс... если просто - то ты должен наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами, но это не сработает с другими голосами...

а так только ОК, Гугл... смартфоны и компы же сами не распознают, а качают инфу на суперкомпы и там уже идет обработка...

я думаю тоже не вариант....

Противоречите сами себе, ссылка на статью с хабра как раз таки говорит о том, что распознавание идёт на самом смартфоне, а не на неком облачном суперкомпьютере.

Я в своём первом сообщении описал и существование этих библиотек и там же уточнил, что хочу реализовать нечто подобное абстрагируясь от существующих приборов и сетей. Можно было бы и на планшете всё это решить, но цель в другом изначально.

Александр Д., благодарю за наводки, буду разбираться

Link to comment
Share on other sites

Вы видео внимательно смотрели?? на 2:10 ясно сказано, что проговаривается на русском название каждого устройства. которое потом контроллер Эра выбирает из произнесенных команд.

можно вместо лампы сказать "задница" и с таким же успехом он сработает.

Накачайте для экспериментов кучу программ для распознавания голоса под РС ... поиграйте... если вас устроит - то сравните мощность своего компа с тем устройством которое вы хотите спаять сами....

Link to comment
Share on other sites

Я бы делал третий вариант. Собственно распознаванием речи не занимался, но много чего делал программно/железного, почти всегда выбирал Ваш третий вариант. Разочарований пока не было. Минус только один - наибольшая из всех вариантов трудоёмкость. Если это не пугает - удачи!

Нет слова "не могу", есть слово "не хочу"...

Link to comment
Share on other sites

Вы видео внимательно смотрели??

А вы внимательно статью читали?

Или может быть документацию к этой библиотеке?

forever_student, ну, скорее всего так и будет. Осталось выбрать путь... Так как я всё-таки в конструировании с нуля новичок (раньше всё собирал уже разработанное кем-то другим). По совести нужно выбрать какой-то достаточно мощный МК + дополнительную оперативную память.

С программированием у меня проблем нет, так что, думаю, прошивку написать смогу. Но хорошо бы иметь хоть какие-то наработки. Буду читать статьи, может натолкнёт на мысль.

Из всего вышесказанного я понял, что для моей идеи решения "из коробки" не имеется. Значит буду думать дальше.

Link to comment
Share on other sites

автору темы

поищите в Сети Диктофон цифровой на AVR

там попадался ваш проект на 70%: усиление и фильтрация сигнала, преобразование в цифру. Вроде и внешняя память была прикручена, параллельная. Как раз вам надо на 5 секунд где-то до 8000*5= 40 000 выборок / байт

http://www.gaw.ru/html.cgi/txt/app/Atmel/memory/at45_to_avr.htm

http://www.roman.by/r-84089.html

http://ffix.ru/2010-11-04-13-47-03/item/7-%D1%86%D0%B8%D1%84%D1%80%D0%BE%D0%B2%D0%BE%D0%B9-%D0%B4%D0%B8%D0%BA%D1%82%D0%BE%D1%84%D0%BE%D0%BD-avr335-%20-%D0%BF%D0%B5%D1%80%D0%B5%D0%B4%D0%B0%D1%87%D0%B0-%D1%80%D0%B5%D1%87%D0%B8-%D0%BF%D0%BE-%D0%BF%D1%80%D0%BE%D0%B2%D0%BE%D0%B4%D0%B0%D0%BC.html

и

http://forum.easyelectronics.ru/viewtopic.php?p=194098

Link to comment
Share on other sites

next sound, 03 Февраль 2016 - 11:45, написал:

а где собираетесь применить?

тема интересная

Самое первое применение - это не более чем домашняя поделка. Дальше идей море, но не сказал бы, что они коммерчески выгодны, опять таки, всё это скорее для собственного развития. Как самый банальный вариант: умный дом.

меня интересует эта же тема

Link to comment
Share on other sites

автору темы

поищите в Сети Диктофон цифровой на AVR

там попадался ваш проект на 70%: усиление и фильтрация сигнала, преобразование в цифру. Вроде и внешняя память была прикручена, параллельная. Как раз вам надо на 5 секунд где-то до 8000*5= 40 000 выборок / байт

Благодарю за идею! Это уже совсем неплохо.

next sound, чисто теоретически в сети много материала, как это реализовать средствами адндроид смартфона и ардуино. Но мне хочется именно абстрагироваться от сторонних устройств в принципе.

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Loading...
 Share

  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...