Семинары

27.10.2021. ОНЛАЙН-СЕМИНАР "Прикладная статистика и моделирование реальных процессов"


Научные руководители: Благовещенский Юрий Николаевич,
Афанасьев Михаил Юрьевич,
Варшавский Александр Евгеньевич,
Пересецкий Анатолий Абрамович
Ученый секретарь: Макарчук Нина Ивановна

Очередное заседание семинара "Прикладная статистика и моделирование реальных процессов" состоится:

27 октября 2021 года, в среду, начало в 17 часов.

Заседание семинара проводится в формате ZOOM–конференции

Программа заседания:

Кирилюк Игорь (Институт экономики РАН)

Оценка статистической значимости эмпирических закономерностей в панельных данных методами Монте-Карло

Аннотация:

Основная тема доклада — новый метод оценки статистической значимости эмпирических закономерностей в панельных данных. Предлагаемый подход применим как к моделям регрессии, так и задачам кластерного анализа. В цели подхода входит не только статистическая верификация, но и статистически обоснованный выбор модели оптимальной сложности. Метод основан на сравнении качества оптимальной модели, полученной на исходных данных с качеством моделей на искусственно сгенерированных данных. При этом генерация искусственных выборок производится в соответствии с проверяемой нулевой гипотезой. Рассматриваемый подход позволяет избежать априорных предположений о статистических распределениях, позволяет работать с временными рядами, порождаемыми как стационарными, так и нестационарными в смысле наличия «единичных корней» процессами. Для нестационарных временных рядов характерна проблема ложной регрессии, состоящая в достаточно частом случайном возникновении конфигураций данных, соответствующих статистически значимым моделям при использовании стандартных средств верификации. Развитая для работы с нестационарными временными рядами теория коинтеграции применима только для наборов временных рядов достаточно большой длины, более 50 наблюдений. При этом, нестационарность временных рядов при относительно небольшой их длине характерна для многих экономических задач. Объектом практического применения предлагаемых методов являются регионы Российской Федерации. Для них вычисляются различные модели производственных функций и применимость этих моделей к конкретному набору данных сравнивается между собой. Нами используются методы Монте-Карло, которые позволяют преодолеть вышеупомянутые трудности, возникающие при работе с панельными данными. Нулевая гипотеза заключается в том, что целевые переменные статистически не зависят от регрессоров. В соответствии с ней сгенерированы с помощью датчика случайных чисел искусственные выборки данных. В рассматриваемом случае, это ансамбли временных рядов, порождённых для всей панели процессами белого шума, или случайных блужданий, или сгенерированных из эмпирических данных методом бутстрэпа, а также с помощью случайных перестановок значений переменных. Рассчитываются регрессионные зависимости между временными рядами, соответствующими факторам производства и выпуску для эмпирических и симулированных данных, вычисляются коэффициенты детерминации и сравниваются их значения для эмпирических данных с квантилями значений симулированных данных. Если значения R2 для эмпирических данных больше 95%-х квантилей для искусственных выборок, эмпирическая закономерность признается значимой на уровне p=0.05%. Показано и теоретически проанализировано влияние корреляции между регрессорами на применимость метода. Метод применим как для оценки статистической значимости для отдельных регионов, так и для оценки её для панели в целом. Он применён для оценки статистической значимости моделей с заданным числом регрессоров, для оценки необходимости добавления дополнительного регрессора, а также для оценки отдачи от масштаба производства. Дополнительно верифицированы факты непостоянства отдачи от масштаба и различия в её значениях между регионами с помощью метода оптимально достоверных разбиений.

В работах по производственным функциям часто авторы используют группировку регионов по анализируемым признакам. Качество регрессионного анализа зависит от того, насколько выражена кластеризация в пространстве используемых переменных. Поэтому, представляет интерес развитие методов кластерного анализа для панельных данных. Нами проведён кластерный анализ использованных для расчёта производственных функций панелей признаков методом агломеративной иерархической кластеризации, вычислены индексы оценки качества кластеризации, применена методология, подобная той, что применялась в регрессионном анализе, которая в данном случае позволяет оценить вероятность того, что обнаруженная в данных кластерная структура является следствием объективных механизмов кластеризации, а не возникла случайным образом (и, таким образом, не будет воспроизведена на других наборах эмпирических данных).

Литература.
  1. Кирилюк И.Л., Малков С.Ю., Малков А.С. Особенности долгосрочной экономической динамики мировой системы: анализ статистических данных // Прикладная эконометрика. 2009. № 4. С. 34-45.
  2. Kirilyuk I.L., Kuznetsova A.V., Sen'ko O.V., Morozov A.M. Method for detecting significant patterns in panel data analysis // Pattern Recognition and Image Analysis (Advances in Mathematical Theory and Applications). 2017. V. 27. № 1. P. 94-104.
  3. Kirilyuk I., Kuznetsova A., Senko O. Data Mining in Institutional Economics Tasks // EPJ Web of Conferences. 173. 03013 (2018).
  4. Кирилюк И.Л. Модели производственных функций для российской экономики // Компьютерные исследования и моделирование. 2013. Т. 5. № 2. С. 293-312.
  5. Kirilyuk I., Senko O. Verification of the Returns to Scale of Production Type for the Russian Federation Regions // EPJ Web of Conferences. 224. 06011 (2019). P. 1-6.
  6. Кирилюк И.Л., Сенько О.В. Выбор моделей оптимальной сложности методами Монте-Карло (на примере моделей производственных функций регионов Российской Федерации) // Информатика и ее применения. 2020. Т. 14. № 2. С. 111-118.
  7. Кирилюк И.Л., Сенько О.В. Оценка качества кластеризации панельных данных с использованием методов Монте-Карло (на примере данных российской региональной экономики) // Компьютерные исследования и моделирование. 2020. Т. 12. № 6. С. 1501-1513.
  8. Кирилюк И.Л., Кузнецова А.В., Сенько О.В. Исследование взаимосвязи производственных функций и социально-экономических показателей российских регионов методом оптимальных разбиений // Информационные технологии и вычислительные системы. 2021. №1. С. 20-31.


Ссылка для входа в ZOOM конференцию:

Научный семинар "Прикладная статистика и моделирование реальных процессов"
Время: 27 октября 2021 17:00 Москва

Подключиться к конференции Zoom
https://us02web.zoom.us/j/82858031362?pwd=NHd2RU5ZT3NKeGFXTWp5bS81N1R2Zz09

Идентификатор конференции: 828 5803 1362
Код доступа: 729659



Возврат к списку

  • О ЦЭМИ
  • Организационная структура ЦЭМИ
  • Деятельность института
  • Научные исследования
  • Подготовка научных кадров
  • Публикации
  • Диссертационные советы
  • Новости
  • Точка зрения
  • Архив
Последние новости: