?

Log in

No account? Create an account
nyaload

Журнал Пушыстого

Журнал Пушыстого

Previous Entry Share Next Entry
Совпадение наполовину
nyaload
_winnie
Дизайнерско-статистическое:

Добавим много раз шарик в случайную корзину из небольшого числа корзин, и запишем в столбик число шариков в корзинах.
Первая половина цифр числа шариков в корзинах будет совпадать (с точностью до замены 0999 на 1000), а вторая будет случайной.

Эксперимент, раскладываем 27777777 шариков в 5 корзин (число выбрано так, чтобы переходы от 0999 к 1000 были реже):
5554974
5552801
5559625
5554928
5555449

Почему именно половина цифр? Потому что количество шариков в двух корзинах отличается на число порядка stddev, stddev - порядка корня из числа шариков, корень из числа - в два раза короче числа.

Почему "дизайнерско"? Потому что нет смысла рисовать те цифры, которые являются случайным шумом.

Также это правило "в одинаковых корзинах сохраняется первая половина цифр" позволит найти подозрительные отклонения "на глаз" без программирования и дополнительных инструментов.
Tags:

  • 1
> Почему "дизайнерско"? Потому что нет смысла рисовать те цифры, которые являются случайным шумом.

Вообще одно из первых правил, которые вдалбливали на лабах в учебном заведении, где я учился - не пишите цифр ниже порядка погрешности измерения.
Нет, учили совсем не дизайнеров. :)

В большинстве случаев хватает двух цифр мантиссы. Третья цифра повышает точность на полпроцента как максимум.

А! Кто здесь?!!!

* Иногда хочется видеть небольшие пики

* Нет, не пол-процента. Или не третья, а четвертая. Если нет третьей цифры, то 10 от 11 отличается на 10% ( я обычно печатаю %.3g, как раз те пол-процента без четвертой цифры ).


Edited at 2015-06-25 03:40 pm (UTC)

Э... да, три цифры :-)
Я категорически неправильно выразил свою мысль о том, что третья цифра мантиссы даёт возможность достичь точности в +/- полпроцента :) При оценках "на глазок" +/- 5% обычно достаточно и позволяет не вести трехзначных вычислений.

Хотя и тут я тоже накосячил. Две цифры.
Просто уже давно всё это было, точные знания накладываются на опыт, эмпирические ощущения и размазываются.

В общем, суть в следующем - есть диапазон измерений. И погрешность оценивается по отношению именно к нему. Потому что 10 от 11 отличается на 10%, а 01 от 02 на 100%, а 98 от 99 - на 1%.

Соответственно, оценивается погрешность к измеряемому диапазону, а он у нас 100.
1/100 и поделить на 2 для округления даёт искомые полпроцента.

Какой диапазон измерения числа штук объектов?

Вряд ли есть более осмысленный ответ чем "от 0 до бесконечности".
Тем не менее, почти всегда осмысленно округлять до первых значащих цифр самого числа, без знания диапазона.


Это я к двум значащим цифрам мантиссы.

> нет смысла рисовать те цифры, которые являются случайным шумом.

К графикам тоже относится, кстати - отображать доверительный интервал полками полезно в случаях, когда без них можно сделать неверные выводы.

  • 1