Цель: Изучить и описать возможности реальных программ для работы со звуком.
Задание. практическая реализация методов получения различных признаков для распознавания речевого сигнала, создание обучающей выборки по всем наборам признаков для дальнейшего распознавания.
Порядок выполнения работы:
1. Ознакомиться с теоретической частью.
2. Разработать интерфейс программы с возможностью:
· записи звука и графического вывода амплитудно-временного представления сигнала в отдельное окно, выделения в этом окне фрагмента сигнала для получения наборов признаков для его распознавания;
· графического вывода в отдельное окно значений компонент вектора признаков для выделенного фрагмента сигнала;
· создание/редактирование БД, в которую занесены признаки распознавания, полученные по реализациям речевых единиц;
· визуальный анализ эффективности признаков в виде графиков значений признаков, выводимых в отдельное диалоговое окно, из указанного из списка набора для всех реализаций речевых единиц, принадлежащих выбранной паре фонетических классов (пары классов задает пользователь).
3. Реализовать в едином программном комплексе с открытой архитектурой методы получения наборов признаков на основе:
· Фурье и вейвлет-преобразования Добеши 2-го порядка;
· кодирования с линейным предсказанием (порядок предсказания р выбирает пользователь);
· MFCC.
4. Реализовать инструментарий для создания/редактирования БД, в которую занесены признаки распознавания, полученные по реализациям речевых единиц.
5. Создать БД наборов признаков для 10 различных фонем (см. табл. 2.1), которую в дальнейшем использовать для обучения классификатора, наполнить ее данными для этих фонем, представителей фонем каждого класса должно быть не менее 5, частота дискретизации записи звука 22050 Гц.
6. Оформить отчет по лабораторной работе