полная и полностью реагирующая визуализация данных с Lux

Вы когда-нибудь сталкивались с ситуацией, когда вам приходилось писать несколько строк кода только для построения и визуализации ваших данных? Как насчет того времени, когда вам нужно написать несколько строк кода, чтобы построить несколько графиков (линия, столбец, круговая диаграмма, и c)? Если да, как и я, то у меня для вас отличная новость!

С помощью всего одной строки кода вы можете построить не один, а полный набор графиков и визуализаций для вашего набора данных. Представляем Lux! Он не только предоставляет полный набор визуализации данных, но также рекомендует некоторые графики, которые могут быть вам полезны.

Официальная документация прекрасно описывает Lux:

Lux - это библиотека Python, которая упрощает и ускоряет исследование данных за счет автоматизации процесса визуализации и анализа данных. Просто распечатав фрейм данных в блокноте Jupyter, Lux рекомендует набор визуализаций, выделяющих интересные тенденции и закономерности в наборе данных. Визуализации отображаются с помощью интерактивного виджета, который позволяет пользователям быстро просматривать большие коллекции визуализаций и разбираться в своих данных.

Начало работы с Lux

Первое, что нам нужно сделать, это установить Lux, используя pip или conda. Я бы рекомендовал использовать conda, чтобы избежать конфликтов зависимостей.

conda install -c conda-forge lux-api
OR
pip install lux-api

Если вы используете ноутбук Jupyter, вы можете активировать Lux следующим образом:

jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget

Или в Jupyterlab:

jupyter labextension install @jupyter-widgets/jupyterlab-manager
jupyter labextension install luxwidget

Использование Lux на ноутбуке

Теперь, когда у нас есть настройка и активация Lux в нашей записной книжке Jupyter, мы можем начать с импорта библиотеки.

import pandas as pd
import lux

Затем давайте попробуем загрузить образец фрейма данных.

df = pd.read_csv("https://github.com/lux-org/lux-datasets/blob/master/data/hpi_full.csv?raw=True")

Распечатка фрейма данных df даст нам следующую информацию

Обратите внимание на кнопку Toggle Pandas/Lux? Попробуйте щелкнуть по нему один раз, заметили, что появляются новые графики? Это дает нам

  • Корреляция между переменными во фрейме данных

  • Распределение переменных

  • Географический анализ фрейма данных. Обратите внимание, как Lux может идентифицировать столбец country и строить пространственное распределение переменных без необходимости указывать координаты? Это так классно!

Еще интересна концепция намерения.

Предположим, вы хотите понять, как неравенство и ожидаемая продолжительность жизни связаны друг с другом. Мы можем указать намерение в Lux следующим образом:

df.intent = ["Inequality","AvrgLifeExpectancy"]

И после печати фрейма данных df мы получаем

Обратите внимание на то, что в европейских странах низкое неравенство и высокая продолжительность жизни, тогда как противоположное верно для стран Африки к югу от Сахары?

На вкладке Filter вы можете глубоко погрузиться в любую конкретную подобласть для дальнейшего анализа.

Заключительные замечания

Мне нравится, насколько Lux простой и умный! Это определенно может сэкономить вам массу времени, пытаясь выполнить анализ набора данных. Более того, Люкс достаточно умен, чтобы понять ваше намерение и создать соответствующую визуализацию! Если вам интересно узнать больше о Lux, ознакомьтесь с некоторыми из их образцовых записных книжек.

Как всегда, если вам понравился этот пост, подумайте о подписке на мою рассылку новостей по электронной почте, где я регулярно резюмирую советы по программированию и исследования искусственного интеллекта на простом английском языке и в красивой визуализации.