Исследовательский анализ данных с помощью одной строки кода

полная и полностью реагирующая визуализация данных с Lux

Вы когда-нибудь сталкивались с ситуацией, когда вам приходилось писать несколько строк кода только для построения и визуализации ваших данных? Как насчет того времени, когда вам нужно написать несколько строк кода, чтобы построить несколько графиков (линия, столбец, круговая диаграмма, и c)? Если да, как и я, то у меня для вас отличная новость!

С помощью всего одной строки кода вы можете построить не один, а полный набор графиков и визуализаций для вашего набора данных. Представляем Lux! Он не только предоставляет полный набор визуализации данных, но также рекомендует некоторые графики, которые могут быть вам полезны.

Официальная документация прекрасно описывает Lux:

Lux - это библиотека Python, которая упрощает и ускоряет исследование данных за счет автоматизации процесса визуализации и анализа данных. Просто распечатав фрейм данных в блокноте Jupyter, Lux рекомендует набор визуализаций, выделяющих интересные тенденции и закономерности в наборе данных. Визуализации отображаются с помощью интерактивного виджета, который позволяет пользователям быстро просматривать большие коллекции визуализаций и разбираться в своих данных.

Начало работы с Lux

Первое, что нам нужно сделать, это установить Lux, используя pip или conda. Я бы рекомендовал использовать conda, чтобы избежать конфликтов зависимостей.

conda install -c conda-forge lux-api
OR
pip install lux-api

Если вы используете ноутбук Jupyter, вы можете активировать Lux следующим образом:

jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget

Или в Jupyterlab:

jupyter labextension install @jupyter-widgets/jupyterlab-manager
jupyter labextension install luxwidget

Использование Lux на ноутбуке

Теперь, когда у нас есть настройка и активация Lux в нашей записной книжке Jupyter, мы можем начать с импорта библиотеки.

import pandas as pd
import lux

Затем давайте попробуем загрузить образец фрейма данных.

df = pd.read_csv("https://github.com/lux-org/lux-datasets/blob/master/data/hpi_full.csv?raw=True")

Распечатка фрейма данных df даст нам следующую информацию

Обратите внимание на кнопку Toggle Pandas/Lux? Попробуйте щелкнуть по нему один раз, заметили, что появляются новые графики? Это дает нам

Корреляция между переменными во фрейме данных

Распределение переменных

Географический анализ фрейма данных. Обратите внимание, как Lux может идентифицировать столбец country и строить пространственное распределение переменных без необходимости указывать координаты? Это так классно!

Еще интересна концепция намерения.

Предположим, вы хотите понять, как неравенство и ожидаемая продолжительность жизни связаны друг с другом. Мы можем указать намерение в Lux следующим образом:

df.intent = ["Inequality","AvrgLifeExpectancy"]

И после печати фрейма данных df мы получаем

Обратите внимание на то, что в европейских странах низкое неравенство и высокая продолжительность жизни, тогда как противоположное верно для стран Африки к югу от Сахары?

На вкладке Filter вы можете глубоко погрузиться в любую конкретную подобласть для дальнейшего анализа.

Заключительные замечания

Мне нравится, насколько Lux простой и умный! Это определенно может сэкономить вам массу времени, пытаясь выполнить анализ набора данных. Более того, Люкс достаточно умен, чтобы понять ваше намерение и создать соответствующую визуализацию! Если вам интересно узнать больше о Lux, ознакомьтесь с некоторыми из их образцовых записных книжек.

Как всегда, если вам понравился этот пост, подумайте о подписке на мою рассылку новостей по электронной почте, где я регулярно резюмирую советы по программированию и исследования искусственного интеллекта на простом английском языке и в красивой визуализации.

Исследовательский анализ данных с помощью одной строки кода

полная и полностью реагирующая визуализация данных с Lux

Начало работы с Lux

Использование Lux на ноутбуке

Заключительные замечания

Вопросы по теме