Задача: классификация текста
Требуется классифицировать твиты по чемпионату мира по футболу 2022 года. Всего есть 3 класса: positive, negative and neutral.
Данные:
Date Created - дата
Number of Likes - кол-во лайков
Source of Tweet - источник твита
Tweet - сам твит
Sentiment - метка класса
Что надо сделать:
1) EDA, data processing ( графики, статистика, обработка данных, какие то выводы по вашим данным)
2) Classic ML approaches (Не менее 3-х)(Logistic regression, SVM etc. )
3) DL approaches (Не менее 2-х) (FC, RNN, CNN 1d, 2d, LSTM). Предобученные брать можно, трансформеры пока брать нельзя.
За первую группу заданий максимум 6 баллов, за результат в лидерборде максимум 4 балла.