1. Выбрать и выполнить описательный анализ любой числовой (прим. рейтинг, отзывы) или конвертируемой в число (прим. цена, размер) переменной выборки.
2. Какая категория имеет самую высокую долю (активных) приложений на рынке?
3. Показатели самых успешных и неуспешных приложений в маркете. Характеристика приложения-«хорошиста».
4. Построить диаграмму рассеяния (pair plot) по использованным для анализа параметрам.
Среда анализа
Microsoft Excel.
Очистка данных
1. Удалить ' + ' из 'количество установок', чтобы сделать его числовым
2. Проанализировать и очистить (на усмотрение) пропущенные данные:
1. Количество пропущенных значений в столбцах, определенных как важные для анализа.
2. Определить долю и предположить тип пропущенных данных в выборке.