Урок 26: Визуализация данных с matplotlib и seaborn
Визуализация данных с matplotlib и seaborn в Python
Краткое введение
Визуализация данных — ключевой этап в анализе данных, помогающий понять тенденции, выявить аномалии и делать обоснованные выводы. Matplotlib и Seaborn — две популярные библиотеки Python, предназначенные для создания статических, анимированных и интерактивных визуализаций в Python.
Теоретическая часть
Matplotlib
Matplotlib — это низкоуровневая библиотека для визуализации данных, позволяющая создавать графики и диаграммы с большим контролем над элементами визуализации.
Seaborn
Seaborn — это библиотека высокого уровня, построенная на базе Matplotlib, обеспечивающая более простой интерфейс для создания привлекательных и информативных статистических графиков.
Примеры кода
# Пример создания графика с использованием Matplotlib
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]
plt.plot(x, y)
plt.title('Test Plot')
plt.xlabel('x')
plt.ylabel('y')
plt.show()
# Пример создания графика с использованием Seaborn
import seaborn as sns
tips = sns.load_dataset("tips")
sns.scatterplot(x="total_bill", y="tip", data=tips)
plt.show()
Практические задания
1. Используя набор данных о цветах ирисов, создайте гистограмму, показывающую распределение длин лепестков для разных видов ирисов.
2. С помощью данных о ресторанах и их оценках постройте корреляционную матрицу, чтобы понять взаимосвязи между различными переменными.
Решение задания
# Гистограмма длин лепестков ирисов
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
sns.histplot(data=iris, x="petal_length", hue="species")
plt.show()
# Корреляционная матрица для данных о ресторанах
import seaborn as sns
import matplotlib.pyplot as plt
# Предположим, что у нас есть DataFrame restaurants_data
sns.heatmap(restaurants_data.corr(), annot=True)
plt.show()