Семинары
19.02.2020. Очередное заседание семинара "Прикладная статистика и моделирование реальных процессов"
Афанасьев Михаил Юрьевич,
Варшавский Александр Евгеньевич,
Пересецкий Анатолий Абрамович
Ученый секретарь: Макарчук Нина Ивановна
Очередное заседание семинара "Прикладная статистика и моделирование реальных процессов" состоится:
19 февраля 2020 года, в среду, в 11 часов 00 минут
Программа заседания:
Фурманов Кирилл Константинович (НИУ ВШЭ, Москва)
Соавтор: Е.В. Румянцева (НИУ ВШЭ, Москва)
ИЗМЕРЕНИЕ ТОЧНОСТИ ПРОГНОЗА ВРЕМЕНИ ЖИЗНИ
Аннотация:
Прогноз дожития обычно рассматривается в одном из двух аспектов: как количественная оценка времени жизни (аналогично прогнозам в линейной регрессии) и как прогноз факта дожития до определённого срока или вероятности дожития (аналогично моделям бинарного выбора). И в том и в другом случае измерение точности прогноза затрудняется неполнотой данных, чаще всего — цензурированием справа: время жизни части наблюдаемых объектов в точности не известно, потому что на момент завершения наблюдения их жизнь продолжается. В результате, невозможно непосредственно ни рассчитать стандартные характеристики качества прогноза, такие как MAE, MSE, MAPE, ни построить классификационную таблицу для бинарного прогноза «выжил/не выжил». Слово «жизнь» здесь понимается в широком смысле – как любое состояние, продолжительность которого интересует исследователя. «Временем жизни» может быть длительность болезни до выздоровления или смерти, длительность периода безработицы, время между заключением договора страхования или ипотеки и его расторжением и т.д.
Распространённые меры качества прогноза дожития, учитывающие цензурирование, включают оценки коэффициентов ранговой корреляции фактических и прогнозируемых значений (Newson, 2010), (Uno et al., 2011) и кривых ROC — точнее, семейств кривых для различного времени прогноза (time-dependent ROC curves), (Hung, 2010), (Kamarudin et al., 2017).
В докладе рассматриваются достоинства и недостатки указанных мер и предлагаются альтернативы, опирающиеся на 1) выборочные квантили расхождения прогнозных и фактических продолжительностей жизни, полученные из оценки Каплана-Майера для функции дожития, 2) остатки Кокса-Снелла, рассчитанные по контрольной выборке. Эти альтернативы призваны частично устранить недостатки методов, опирающихся на коэффициенты ранговой корреляции, и позволяют получить интерпретируемые оценки точности.
Предлагаемые методы иллюстрируются примером построения модели для прогноза досрочного погашения договоров ипотечного кредитования.
Заседания семинара проходят с 11 часов, в ЦЭМИ РАН,
Нахимовский пр. 47, этаж 5, аудитория 521
Ученый секретарь семинара - Макарчук Нина Ивановна
Телефон для справок: (499)129-12-33
E-mail: nimak@cemi.rssi.ru