Оставете пакета shapash python да свърши работата вместо вас

Не се появявайте неподготвени на следващата си презентация

Разбирането на това, което вашият модел прави е много важно. Колкото повече информация имате, за да оцените вашия модел, толкова по-добре можете да го настроите. Дори ако имате дълбоко разбиране на вътрешната работа на алгоритмите, вашите бизнес партньори нямат. Трябва да можете да представите своите открития атрактивно и интересно.

Има моменти, в които бизнес партньорите имат повече експертни познания по темата, които могат да помогнат за предоставянето на контекст на характеристиките. Ако те наистина разберат какво предавате, те могат да ви помогнат да настроите модела още повече.

Един от най-често срещаните въпроси, които чувам, е „Какви данни влизат в модела?“ което се превежда като „Кои функции са най-важни?“. Трябва да сте готови да отговорите на този въпрос по начин, който те разбират. Shapash предоставя някои интересни резултати, които могат да ви помогнат да информирате аудиторията си.

Защо да опитате шапаш?

Винаги в търсене на интересни пакети, които да използвам в ежедневната си работа, попаднах на shapash. И ако ме познавате, знаете, че не обичам караниците. Пакетът трябва да е лесен за използване или няма шанс за бързо доказателство за концепцията. Само няколко реда код добавят както интерактивна, така и подобна на отчет възможност за обяснение към вашия скрипт на модела.

Мисля, че напълно си заслужава да отделите време да проверите пакета и неговите предложения. Настройката е проста (не забравяйте, че не обичам много неприятностите). Описах подробно стъпките по-долу.

Инсталация

Както винаги, препоръчително е да създадете нова виртуална среда. Включих връзката към инсталационния процес в раздела за препратки по-долу. За този пример използвам Jupyter, така че просто трябваше да инсталирам ipywidgets (и да активирам) и shapash.

Добавете този ясен кодов блок.

След като обучите своя модел (в този пример „регресор“), добавете прост кодов блок, за да компилирате и изпълните SmartExplainer. Има пълен примерен код, приложен по-долу в тази статия.

from shapash.explainer.smart_explainer import SmartExplainer
# shapash Step 1: Declare SmartExplainer Object
xpl = SmartExplainer()
# shapash Step 2: Compile Model, Dataset, Encoders
xpl.compile(    x=Xtest,    
                model=regressor,    
                preprocessing=encoder, #optional
                y_pred=y_pred) 
# shapash Step 3: Display interactive output
app = xpl.run_app()

Изпълнете кода

Трябва да стартирате кода си от поглъщане на данни, инженеринг на функции и обучение на модела чрез оценка на модела. След това, когато изпълните run_app(), ще се покаже връзка към приложението.

Просто щракнете върху тази връзка, за да отворите прозорец на браузъра с вашия резултат. Ще можете да навигирате в различните визуализации.

БОНУС — кодов фрагмент за генериране на HTML отчет

Когато искате да споделите находката с колеги, можете да генерирате HTML отчет за споделяне.

# Step 4: Generate the Shapash Report
xpl.generate_report(
        output_file='medium_spending_scores_report2.html',
        project_info_file='shapash_project_info.yml',
        x_train=Xtrain,
        y_train=ytrain,
        y_test=ytest,
        title_story="Spending Scores Report",
        title_description="""This is just an easy sample.
            It was generated using the Shapash library.""",
        metrics=[
            {
                'path': 'sklearn.metrics.mean_absolute_error',
                'name': 'Mean absolute error',
            }])

Пълен примерен код

Бележник и файлове на Jupyter:



.py версия:

Референции





Заключение

Мисля, че shapash има място в кутията с инструменти за обяснение на модела. Ако не сте в състояние да обясните работата си на нетехнически колеги, резултатите ви може да бъдат пренебрегнати. Никой не иска това да се случи.

Хората, които виждам да напредват в кариерата си в науката за данни на работното място, са тези, чиито презентации блестят и говорят директно на тяхната специфична аудитория. Така че, светете!