Понимание моделей регрессии, часть 1 (искусственный интеллект)

Оценка малых площадей с использованием EBLUP в рамках модели регрессии вложенных ошибок (arXiv)

Аннотация: Оценка характеристик доменов (называемых небольшими территориями) в пределах совокупности на основе выборочных обследований населения является важной проблемой в статистике обследований. В этой статье мы рассматриваем основанную на модели оценку малых площадей в рамках модели регрессии вложенных ошибок. Мы обсуждаем построение смешанных моделей оценок (эмпирические наилучшие линейные несмещенные предикторы, EBLUP) средних значений малых площадей и условных линейных предикторов средних значений малых площадей. В рамках асимптотики увеличения количества малых областей и увеличения количества единиц в каждой области мы устанавливаем результаты асимптотической линейности и центральные предельные теоремы для этих оценок, которые позволяют нам установить асимптотическую эквивалентность между оценками, аппроксимировать их выборочные распределения, получить простые выражения для построить простые оценки их асимптотических среднеквадратических ошибок и обосновать асимптотические интервалы прогнозирования. Мы представляем моделирование на основе моделей, которое показывает, что в довольно небольших конечных выборках наша оценка среднеквадратичной ошибки работает так же хорошо или даже лучше, чем широко используемая оценка \cite{prasad1990estimation}, и намного проще, поэтому ее легче интерпретировать. Мы также проводим расчетное моделирование с использованием реальных данных о потребительских расходах на продукты из свежего молока, чтобы исследовать основанные на расчете свойства оценщиков смешанной модели. Мы объясняем и интерпретируем некоторые неожиданные результаты моделирования с помощью анализа совокупности и дальнейшего моделирования на основе проектирования. Моделирование выдвигает на первый план важные различия между основанными на модели и дизайне свойствами оценщиков смешанной модели при оценке малых площадей.

2.Модели регрессии с взвешенными кластерными коэффициентами в выборке опроса(arXiv)

Автор: Минцзюнь Ган, Синь Ван, Чжунлей Ван, Вэй Чжун

Аннотация. Регрессионные модели изучаются на основе данных опросов и широко используются для построения оценок на основе моделей. Часто отношения различаются по разным предметам или областям. Определение правильной структуры модели с учетом весов выборки имеет важное значение для выводов и оценки параметров генеральной совокупности. В этой работе мы предлагаем модели регрессии с взвешенными кластеризованными коэффициентами для группировки ковариационных эффектов для данных опроса. Новый метод использует взвешенную функцию потерь и попарные штрафы для всех пар наблюдений. Для получения оценок разработан алгоритм, основанный на алгоритме переменного направления множителей. Мы также изучаем теоретические свойства оценщика в условиях выборки опроса. В имитационном исследовании эмпирическая производительность предложенной оценки сравнивается с методом без весов выборки, что позволяет предположить, что веса выборки важны для выявления кластеров в регрессионных моделях.

3.Модель скрытой логистической регрессии с графическими данными(arXiv)

Автор:Haixiang Zhang, Yingjun Deng, Alan J. X. Guo, Qing-Hu Hou, Ou Wu

Аннотация. В последнее время графические (сетевые) данные являются новой областью исследований в области искусственного интеллекта, машинного обучения и статистики. В этой работе нас интересует, влияют ли на метки узлов (отклики людей) особенности их соседей (характеристики друзей). Мы предлагаем новую модель скрытой логистической регрессии для описания сетевой зависимости с помощью бинарных ответов. Ключевое преимущество предложенной нами модели заключается в том, что вводится скрытый бинарный индикатор, указывающий, подвержен ли узел влиянию своего соседа. Предлагается балльный тест для диагностики наличия сетевой зависимости. Кроме того, алгоритм типа EM используется для оценки параметров модели при сетевой зависимости. Для оценки эффективности нашего метода проводятся обширные симуляции. Два общедоступных набора данных используются для иллюстрации эффективности предложенной модели скрытой логистической регрессии.

Понимание моделей регрессии, часть 1 (искусственный интеллект)

Вопросы по теме