Мне нужны наверное новичковые задания чтобы погрузиться в стримминг данных - нужно порядка 5-6 датасетов(прикрепить ссылкой) чтобы просто понять как работать в связке python + flink (через PyFlink), для каких конкретных задач может применяться , а далее уже подружить python + flink + kafka , чтобы данные поступали потоком в кафка вычитывались и обрабатывались во flink (можно еще указать на отличия между PySpark и PyFlink). Python -язык программирования. обязательно описание к задачам.
Требования к работе в виде списка :
1) необходимо разрешить 5 разнотипных задач,связанных со стримингом данных (датасеты взять из свободных источников)
2) реализовать с помощью языка Pythhon и библиотеки PyFlint и кафка клиента (данные изначально попадают в кафка, из датасетов, далее эти данные считываются флинком)
3) необходима инструкция развертывания, кодовая база, датасеты на которых делалось задание, объяснение шагов того что было проделано - для чего и как можно было реализовать возможно иначе
4) мелкое сравнение со Spark (в виде тезисов, не более сами номера можно переписаать под спарк но пока необязательно) На выходе я должен получить код, датасеты, инструкцию развертывания, пояснения по проделанной работе, возможно статьи блоги и тд которые можно допом почитать
ну и по хорошему накидать теории, чтобы это выглядело как полноценная работа, чтобы было меньше вопросов
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |