Нужно реализовать алгоритм Surrounding Context N-Grams .
графическая реализация обязательно.
Что нужно от программы:
1) Нормализация текста:
Нормализация алфавита(Так как разрабатываемая система должна работать с русскоязычными текстами, то в текстах предполагается кириллический алфавит. Поэтому для всех символов в тексте происходит замена на кириллические аналоги. )
Нормализация формата текста. Из текста удаляются все лишние разделители, символы, не являющиеся буквами английского или русского алфавита и цифрами. Все допустимые символы определяются специальным словарем допустимых символов.
Нормализация слов
Удаление стоп слов.
2) Разбиение слова на Шинглы
3) Алгоритм для поиска заимствований
4) Результат (Графическая интерпретация сравниваемых текстов)
Если есть вопросы, то пишите.
Очень срочно
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |