?

Log in

No account? Create an account
nyaload

Журнал Пушыстого

Журнал Пушыстого

Previous Entry Share Next Entry
bootstrap и квантили
nyaload
_winnie
Есть подозрение, что в bootstrap-семплировании для некоторых статистик можно избежать собственно семлирования, честно по формуле посчитав мат-ожидание результата или [2.5%, 97.5%] интервал распределения результата.

Выборка с возвращением в bootstrap - это тоже самое что и семплирование из эмпирического распределения выборки
обозначим эту эмпирическую функцию распределения как
применим -1 к равномерно распределённой на [0, 1] величине U(0,1), получим снова распределение

Чтобы создать одну bootstrap-выборку - можно взять выборку из n штук из U(0, 1) чисел и применить к ним -1
медиана bootstrap-выборки - это применение -1 к i-й порядковой статистике, где i равно n/2.
i-я порядковая статистика U(0, 1) - это вдоль и поперёк изученное бета-распределение
Берем это бета-распределение, берем его [2.5%, 97.5%] интервал распределения (через неполную бета-функцию или приближение нормальным распределением), втыкаем его границы в -1, получаем интервал в котором (97.5% - 2.5%) будет bootstrap-медиана

Таким же образом можно получать остальные квантили, не только медиану.

Велосипед? Или грабли? Или это настолько очевидно, что так всегда и делается?


  • 1
Бутстрап обычно применяют не для вычисления распределения медианы (как в вашем примере), а для вычисления квантилей более сложных распределений (например, коэффициентов в линейной регрессии). Там аналитически ничего хорошего не получится.

  • 1