полная и полностью реагирующая визуализация данных с Lux
Вы когда-нибудь сталкивались с ситуацией, когда вам приходилось писать несколько строк кода только для построения и визуализации ваших данных? Как насчет того времени, когда вам нужно написать несколько строк кода, чтобы построить несколько графиков (линия, столбец, круговая диаграмма, и c)? Если да, как и я, то у меня для вас отличная новость!
С помощью всего одной строки кода вы можете построить не один, а полный набор графиков и визуализаций для вашего набора данных. Представляем Lux! Он не только предоставляет полный набор визуализации данных, но также рекомендует некоторые графики, которые могут быть вам полезны.
Официальная документация прекрасно описывает Lux:
Lux - это библиотека Python, которая упрощает и ускоряет исследование данных за счет автоматизации процесса визуализации и анализа данных. Просто распечатав фрейм данных в блокноте Jupyter, Lux рекомендует набор визуализаций, выделяющих интересные тенденции и закономерности в наборе данных. Визуализации отображаются с помощью интерактивного виджета, который позволяет пользователям быстро просматривать большие коллекции визуализаций и разбираться в своих данных.
Начало работы с Lux
Первое, что нам нужно сделать, это установить Lux, используя pip
или conda
. Я бы рекомендовал использовать conda
, чтобы избежать конфликтов зависимостей.
conda install -c conda-forge lux-api OR pip install lux-api
Если вы используете ноутбук Jupyter, вы можете активировать Lux следующим образом:
jupyter nbextension install --py luxwidget jupyter nbextension enable --py luxwidget
Или в Jupyterlab:
jupyter labextension install @jupyter-widgets/jupyterlab-manager
jupyter labextension install luxwidget
Использование Lux на ноутбуке
Теперь, когда у нас есть настройка и активация Lux в нашей записной книжке Jupyter, мы можем начать с импорта библиотеки.
import pandas as pd import lux
Затем давайте попробуем загрузить образец фрейма данных.
df = pd.read_csv("https://github.com/lux-org/lux-datasets/blob/master/data/hpi_full.csv?raw=True")
Распечатка фрейма данных df
даст нам следующую информацию
Обратите внимание на кнопку Toggle Pandas/Lux
? Попробуйте щелкнуть по нему один раз, заметили, что появляются новые графики? Это дает нам
- Корреляция между переменными во фрейме данных
- Распределение переменных
- Географический анализ фрейма данных. Обратите внимание, как Lux может идентифицировать столбец
country
и строить пространственное распределение переменных без необходимости указывать координаты? Это так классно!
Еще интересна концепция намерения.
Предположим, вы хотите понять, как неравенство и ожидаемая продолжительность жизни связаны друг с другом. Мы можем указать намерение в Lux следующим образом:
df.intent = ["Inequality","AvrgLifeExpectancy"]
И после печати фрейма данных df
мы получаем
Обратите внимание на то, что в европейских странах низкое неравенство и высокая продолжительность жизни, тогда как противоположное верно для стран Африки к югу от Сахары?
На вкладке Filter
вы можете глубоко погрузиться в любую конкретную подобласть для дальнейшего анализа.
Заключительные замечания
Мне нравится, насколько Lux простой и умный! Это определенно может сэкономить вам массу времени, пытаясь выполнить анализ набора данных. Более того, Люкс достаточно умен, чтобы понять ваше намерение и создать соответствующую визуализацию! Если вам интересно узнать больше о Lux, ознакомьтесь с некоторыми из их образцовых записных книжек.
Как всегда, если вам понравился этот пост, подумайте о подписке на мою рассылку новостей по электронной почте, где я регулярно резюмирую советы по программированию и исследования искусственного интеллекта на простом английском языке и в красивой визуализации.