У меня есть задача связанная с питоном и текстовым анализом. На основе полученных проанализировать каждый профиль с использованием tf idf и посмотреть как часто встречаются слова, и на основе и создать список ключевых слов которые связаны с тематикой ИТ.
Опишу в кратце, если вам будет интересно, я вам смогу выслать документ с деталями и сможете ознакомиться с ними.
Целью данной работы является исследовани заинтерисованности абитурентов в учебных программах посредством анализа профиля (ВК).
Для начала надо собрать данные профилей студентов (выпусников 2018,2019,2020 годов) , такие атрибуты: имя, фамилия, последние 50 сообщений со стенки и интересы профиля. Собрать как можно больше профилей (от 100000 по 400000).
После использовать данные ключевые слова и проанализировать каждый профиль и понять у кого данные ключевые слова которые были получение с использованием tf idf встречаются. Тоесть нас интерисуют профили у кого наибольшее количество раз встречаются ключевые слова связанные с ИТ. Чем больше встречаются , тем больше студент заинтерисован в обучении в ит.
Готов к торгам.
Более подробно можете ознакомится в файле.
Если есть вопросы, пишите обьясню более подробно.
| Гарантия на работу | 1 год |
| Средний балл | 4.52 |
| Стоимость | Назначаете сами |
| Эксперт | Выбираете сами |
| Уникальность работы | от 70% |