Перейти к содержанию

Распознавание Речи На Микроконтроллерах


Рекомендуемые сообщения

Доброго всем времени суток!

Честно признаться, не уверен, что создаю тему в нужном разделе, но так как я новичок, а тема касается звука, надеюсь попал верно.

И так. Есть необходимость распознавания речи. Гугл завёл меня вот в какие дали:

  • использование онлайн сервисов типа Гугл или Яндекс
  • Использование оффлайн библиотек кои есть для определённых ОСей
  • Использование Arduino и в скетче для неё использовать uSpeach

Использование онлайн сервисов отпадает сразу же, так как я хочу свой прибор сделать автономным от сетей.

Готовые библиотеки есть для Андроида, АйОСа, винды и есть порт этих же технологий под такие языки как Ruby и Javascript.

Arduino и uSpeach судя по отзывам работают только с латиницей и точность определения 30-40 процентов, а это, простите, совсем не серьёзно.

Отсюда я пришёл к выводу, что для решения моей задачи есть несколько вариантов:

  1. Собрать некое железо, на которое встанет ядро Андроида и писать приложение под него, так как его библиотеки работают очень успешно в этом направлении
  2. Использовать таки Arduino, но дописывать библиотеку самостоятельно, пока она не начнёт работать
  3. Собирать собственную конфигурацию железа и писать всё самому с нуля.

Третий вариант, конечно, самый правильный с той точки зрения, что если всё и будет плохо, то только я в этом и буду виноват, а если всё получится, то только я и буду молодец. Но вот стоит ли результат труда, пока не уверен.

Мне интересен Ваш опыт в данном направлении, возможно, кто-то занимался этим вопросом, возможно я просто что-то плохо догуглил, и на самом деле решение на поверхности. А может оно и не так и нужно много и долго трудиться. Цель наипримитивнейшая: получить сказанную фразу. То есть без всяких ИИ, выполнения дальнейших команд и так далее.

Буду благодарен за любой совет!

Ссылка на комментарий
Поделиться на другие сайты

Реклама: ООО ТД Промэлектроника, ИНН: 6659197470, Тел: 8 (800) 1000-321

20% скидка на весь каталог электронных компонентов в ТМ Электроникс!

Акция "Лето ближе - цены ниже", успей сделать выгодные покупки!

Плюс весь апрель действует скидка 10% по промокоду APREL24 + 15% кэшбэк и бесплатная доставка!

Перейти на страницу акции

Реклама: ООО ТМ ЭЛЕКТРОНИКС, ИНН: 7806548420, info@tmelectronics.ru, +7(812)4094849

солар, ну тут вопрос даже не в нужности ненужности... Скорее меня интересует этот вопрос для саморазвития. Сферы применения - вопрос второстепенный. В данном случае.

Надеюсь, не надоест)) По крайней мере, если будет получатся

Ссылка на комментарий
Поделиться на другие сайты

Выбираем схему BMS для корректной работы литий-железофосфатных (LiFePO4) аккумуляторов

 Обязательным условием долгой и стабильной работы Li-FePO4-аккумуляторов, в том числе и производства EVE Energy, является применение специализированных BMS-микросхем. Литий-железофосфатные АКБ отличаются такими характеристиками, как высокая многократность циклов заряда-разряда, безопасность, возможность быстрой зарядки, устойчивость к буферному режиму работы и приемлемая стоимость. Но для этих АКБ, также как и для других, очень важен контроль процесса заряда и разряда, а специализированных микросхем для этого вида аккумуляторов не так много. Инженеры КОМПЭЛ подготовили список имеющихся микросхем и возможных решений от разных производителей. Подробнее>>

Реклама: АО КОМПЭЛ, ИНН: 7713005406, ОГРН: 1027700032161

Тс... если просто - то ты должен наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами, но это не сработает с другими голосами...

а так только ОК, Гугл... смартфоны и компы же сами не распознают, а качают инфу на суперкомпы и там уже идет обработка...

я думаю тоже не вариант....

https://habrahabr.ru/post/237589/

за тебя уже все придумали....

Ссылка на комментарий
Поделиться на другие сайты

наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами

Даже Nokia3310 не опускался до просто сравнения. Хотя я мог неверно понять суть предыдущего автора - всё дело в шаблонах.

ТС, читайте для начала https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%80%D0%B5%D1%87%D0%B8

Я не раздаю удочки. Я продаю рыбу.

Ссылка на комментарий
Поделиться на другие сайты

нокиа3310 как раз-таки сравнивает с одной из 20 фраз.

использовалось там такое:

Дельта-модуляция

почитайте

https://ru.wikipedia...ельта-модуляция

https://ru.wikipedia...ьта-кодирование

http://websound.ru/a...ry/earcompr.htm

http://dic.academic....f/ruwiki/891301

делали в своё время, на немного разогнанном PIC

из трёх фраз успевала найти решение на 2-4 секунды

сейчас, на новых мощных МК, это можно сделать проще, не выигрывая каждый маш.такт в программе

вспомнилось

была версия и на

Импульсно-кодовая модуляция

https://ru.wikipedia...довая_модуляция

программно делали можно сказать огибающую всего потока. Его сжимали с потерей в Х раз, получали некие "подписи" каждой фразы

При сравнении делали запас в 30 процентов для увеличения распознавания.

Изменено пользователем Гость
Ссылка на комментарий
Поделиться на другие сайты

а где собираетесь применить?

тема интересная

Самое первое применение - это не более чем домашняя поделка. Дальше идей море, но не сказал бы, что они коммерчески выгодны, опять таки, всё это скорее для собственного развития. Как самый банальный вариант: умный дом.

Тс... если просто - то ты должен наговорить кучу фраз и потом проц будет сравнивать твои фразы с шаблонами, но это не сработает с другими голосами...

а так только ОК, Гугл... смартфоны и компы же сами не распознают, а качают инфу на суперкомпы и там уже идет обработка...

я думаю тоже не вариант....

Противоречите сами себе, ссылка на статью с хабра как раз таки говорит о том, что распознавание идёт на самом смартфоне, а не на неком облачном суперкомпьютере.

Я в своём первом сообщении описал и существование этих библиотек и там же уточнил, что хочу реализовать нечто подобное абстрагируясь от существующих приборов и сетей. Можно было бы и на планшете всё это решить, но цель в другом изначально.

Александр Д., благодарю за наводки, буду разбираться

Ссылка на комментарий
Поделиться на другие сайты

Вы видео внимательно смотрели?? на 2:10 ясно сказано, что проговаривается на русском название каждого устройства. которое потом контроллер Эра выбирает из произнесенных команд.

можно вместо лампы сказать "задница" и с таким же успехом он сработает.

Накачайте для экспериментов кучу программ для распознавания голоса под РС ... поиграйте... если вас устроит - то сравните мощность своего компа с тем устройством которое вы хотите спаять сами....

Ссылка на комментарий
Поделиться на другие сайты

Я бы делал третий вариант. Собственно распознаванием речи не занимался, но много чего делал программно/железного, почти всегда выбирал Ваш третий вариант. Разочарований пока не было. Минус только один - наибольшая из всех вариантов трудоёмкость. Если это не пугает - удачи!

Нет слова "не могу", есть слово "не хочу"...

Ссылка на комментарий
Поделиться на другие сайты

Вы видео внимательно смотрели??

А вы внимательно статью читали?

Или может быть документацию к этой библиотеке?

forever_student, ну, скорее всего так и будет. Осталось выбрать путь... Так как я всё-таки в конструировании с нуля новичок (раньше всё собирал уже разработанное кем-то другим). По совести нужно выбрать какой-то достаточно мощный МК + дополнительную оперативную память.

С программированием у меня проблем нет, так что, думаю, прошивку написать смогу. Но хорошо бы иметь хоть какие-то наработки. Буду читать статьи, может натолкнёт на мысль.

Из всего вышесказанного я понял, что для моей идеи решения "из коробки" не имеется. Значит буду думать дальше.

Ссылка на комментарий
Поделиться на другие сайты

автору темы

поищите в Сети Диктофон цифровой на AVR

там попадался ваш проект на 70%: усиление и фильтрация сигнала, преобразование в цифру. Вроде и внешняя память была прикручена, параллельная. Как раз вам надо на 5 секунд где-то до 8000*5= 40 000 выборок / байт

http://www.gaw.ru/html.cgi/txt/app/Atmel/memory/at45_to_avr.htm

http://www.roman.by/r-84089.html

http://ffix.ru/2010-11-04-13-47-03/item/7-%D1%86%D0%B8%D1%84%D1%80%D0%BE%D0%B2%D0%BE%D0%B9-%D0%B4%D0%B8%D0%BA%D1%82%D0%BE%D1%84%D0%BE%D0%BD-avr335-%20-%D0%BF%D0%B5%D1%80%D0%B5%D0%B4%D0%B0%D1%87%D0%B0-%D1%80%D0%B5%D1%87%D0%B8-%D0%BF%D0%BE-%D0%BF%D1%80%D0%BE%D0%B2%D0%BE%D0%B4%D0%B0%D0%BC.html

и

http://forum.easyelectronics.ru/viewtopic.php?p=194098

Ссылка на комментарий
Поделиться на другие сайты

next sound, 03 Февраль 2016 - 11:45, написал:

а где собираетесь применить?

тема интересная

Самое первое применение - это не более чем домашняя поделка. Дальше идей море, но не сказал бы, что они коммерчески выгодны, опять таки, всё это скорее для собственного развития. Как самый банальный вариант: умный дом.

меня интересует эта же тема

Ссылка на комментарий
Поделиться на другие сайты

автору темы

поищите в Сети Диктофон цифровой на AVR

там попадался ваш проект на 70%: усиление и фильтрация сигнала, преобразование в цифру. Вроде и внешняя память была прикручена, параллельная. Как раз вам надо на 5 секунд где-то до 8000*5= 40 000 выборок / байт

Благодарю за идею! Это уже совсем неплохо.

next sound, чисто теоретически в сети много материала, как это реализовать средствами адндроид смартфона и ардуино. Но мне хочется именно абстрагироваться от сторонних устройств в принципе.

Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Ответить в этой теме...

×   Вставлено с форматированием.   Восстановить форматирование

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Загрузка...
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Сообщения

    • Все предложенные к рассмотрению источники питания работают примерно по одному принципу: сетевое напряжение выпрямляется, фильтруется (получаем чуть больше 300 вольт постоянного), затем преобразуется снова в переменное, но уже на частотах в несколько десятков килогерц, понижается на трансформаторе и снова выпрямляется. За счёт высокой частоты преобразования используется трансформатор на ферритовом, а не на стальном, сердечнике, гораздо меньших габаритов и стоимости. Минусы: значительное усложнение схемы блока и вероятность возникновения различных помех от него. Модули управления (кроме первого) также являются импульными преобразователями, с теми же достоинствами и недостатками. Если нужно по быстрому собрать некое подобие ЛБП, то уж лучше брать модуль вроде этого. Ну и блок питания к нему соответствующий. Но не очень понятно, какой практический опыт можно получить от соединения готовых модулей парой проводов.  
    • У меня больше всего вопросов вызвала необычная схема обеспечения отрицательного питания. Автор этой обстоятельной заметки пишет: For this supply to work correctly, the transformer must have a secondary voltage of at least 18V RMS.  Почему? Что будет не так с отрицательным питанием, если напряжение на трансформаторе будет меньше 18В?   https://tinyurl.com/23mlwxtt - я в простейшей эмуляции ставлю 12В пикового напряжения для трансформатора и на стабилитроне все как положено: -5.6В.
    • Согласен, очень криво объяснил. Это работа трёх вольтовой линии, просто на диод шотки сдвоенный, на один анод приходит сигнал напрямую с трансформатора, а на второй через дроссель. Вольт/деление 5 вольт в клетке, тайминг по моему 10 МС. Третья фотография это сигнал на катодах уровень земли ровно по центру экрана. Но все линии по итогу в порядке 3.3 в, 5, в, 12 в и -12 в. Нагрузить все линии не могу сразу ,так как тут же выгорают транзисторы (имеется нагрузка 250 ватт по 10 ампер на каждую линию за исключением-12в), поэтому нагружаю 3.3 вольтовую линию на 10 ампер,  подключаю переменный резистор 50 ватт на 15 ом на 5 вольтовую линию и постепенно довожу до той той картины с перекосом (это гдето  50 ватт общее). По поводу микросхемы, вверху имеется скрин где между импульсами проскакивает мини импульс, если так можно сказать, он проскакивает и на одной  и на второй ноге (7,8). Микросхема не tl 494, а lw4933/abx942.1/c9421646. Далее они приходят на базы транзисторов 945g  коллекторы этих транзисторов соединены с  выводами трансформатора. Просто схема типовая, легче мне кажется просто привести фото самого блока, для тех кто разбирается будет гораздо информативне.  Диод шотки по 12 вольтовой линии был подгоревший, заменил на донора. Приводить скрины не буду что бы не захламлять тему. В итоге, пока все так же, при достижении определенной нагрузки суммарно где-то 50 ватт, появляется этот "выброс и перекос". По этому имеются мысли на два варианта, это микросхема , этот мини импульс между периодами, на низкой нагрузке особо не влияет, но при достижении определенной приводит с самовозбуждению входной цепи и непроизвольному открытию транзистора нижнего плеча. Либо дело в "горячей части", плавающий дефект в обвязке силовых ключей.  Спасибо за ответ.
    • @Gomerchik а вы контролировали как меняется уровень сигнала на А1 ардуины?
    • Спасибо за совет. Автором данного проекта я не являюсь, мне нужно было воссоздать уличный датчик для метеостанции взамен пропавшего(( Из разного найденного в интернете этот проект работает с моей станцией Орегон (спасибо автору). В понедельник попробую последовать Вашему совету. Но все равно куча непоняток  как блин это работает)) Если дело в неправильной отправки команды, то как на это влияет подключение датчика температуры? Если совсем не подключать таймер, то передача идет один раз (как и прописано в программе), станция принимает и отображает, но минут через сколько-то естественно станция уже ни чего не показывает, но с таймером питание полностью не пропадает с ардуинки, но передача сигнала каким-то образом работает по таймеру.  В моем понимании данная команда подается один раз потому, что таймер должен отключать питание МК после передачи сигнала и каждые 43 сек снова подавать питание (так того требует станция).  Ардуино передает показания температуры отключается полностью и 43 секунды мк не работает.  Сейчас у меня питание пока сделано на подпитке от солнечной батареи, но пару пасмурных дней и аккумулятор съедается до отключения(
    • thickman Так и сделаю. Вытащу из бу БП.  Буду знать, как отличить. Благодарю. Заменил транзисторы на IRFB20N50K. Картина стала, совсем другой.  Похоже трудность не в драйвере, на момент подвозбуда, переходные процессы, в нем, завершены. Увеличил затворные резисторы до 50ом, стало немного лучше.  Не понятно, почему верхний ключ греется несколько сильнее. Возможно, стоит посмотреть ток в коллекторе.  Снабберные емкости временно удалил, изменений не произошло.  Замена ТГР на другой, на кольце MSTN-16A-TH, так же, результата не принесла.   irfb20n50k.pdf
  • Похожий контент

×
×
  • Создать...