?

Log in

No account? Create an account
nyaload

Журнал Пушыстого

Журнал Пушыстого

Entries by category: наука

электронные термометры врут
nyaload
_winnie
Купил четыре штуки электронных термометров, все врут. Почитал интернеты, понял: электронные градусники делаются для американцев, а они меряют температуру во рту. А под мышкой градусник во-первых, не успевает нагреться, во-вторых его надо держать по-особому (вертикально и сильно прижимать). Даже градусник Omron с увеличеным датчиком, специально для измерения под мышкой, при писке показывает на 0.2-0.3 градуса меньше.

Что тут можно сделать:

  • обязательно правильно держать градусник (вертикально/под углом вниз, и прижать)

  • не обращать внимание на писк, держать столько же времени под мышкой, сколько и ртутный, пока не перестанет увеличиваться (5-10 минут)

  • прибавлять фиксированное число в момент писка (число индивидуально для человека и способа измерения)

  • купить таки ртутный градусник, но в оболочке которая не пропускает ртуть при разбивании. Я, как программист, верю поговорке "если не протестировано, значит не работает", но покупать 10 градусников для тестов и разбивать 9 не собираюсь :)

  • мерять температуру не под мышкой, а во рту



А ещё таки нашёл наконец градусник, который меня порадовал - инфракрасный. Во-первых, он не врет, показывает столько же сколько ртутный. Во-вторых, меряет температуру за пять секунд!!! Провел по лбу от виска до виска, и готово. Вроде, они тоже умеют врать и иметь странности, так что в качестве блого-поддержки качественных вещей укажу модель - "AND DT-635", стоит порядка 30$/800 рублей.

Read more...Collapse )

Отношение двух случайных целочисленных величин.
nyaload
_winnie
Должен признать, что пики на графиках не являются безоговорочным признаком фальсификаций (здесь обсуждаю только пики, и факт их наличия, а не их размер или преступления с подделкой протоколов).

Если взять отношение двух ЦЕЛОЧИСЛЕННЫХ случайных величин, то на на простых дробях с небольшим знаменателем (напр. 1/2, 1/3, 1/4,1/5,...) образуются пики сами собой.

Так что пики могут взяться не только из-за искусственной подгонки результатов, а просто в силу того, что на 4 делится больше чисел, чем на 39 или 41.

Простой пример, дискретное распределение отношения двух случайных целых чисел i/j, i от 1 до 300, j от 0 до i (код для желающих)
Получается вот такой фрактал:

Заметьте, пики не только на 3/4 = 75%, но и на таких менее "круглых" числах как 1/7, 2/7, 6/7.
Когда мы на такой фрактал накладываем целочисленную решетку, мы получаем на ней пики там где находятся делители размера решётки (50%, 25%, 20%, 5%, 2%).

Попытка промоделировать выборы. Количество проголосовавших на участке берётся из файла с данными голосования (можно взять похожее log-normal, пики будут такие же). Биноминальная случайная величина B(n,p) для процента голосов за партию с p характерным для конкретного региона, выбирается как нормальная с центром в 40% +- sigma=20%.) Биноминальная лучше чем нормальная подходит для описания распределения на конкретном участке на концах интервала 0-100%. Если взять нормальную, то за Яблоко иногда будет отрицательное количество голосов, а за КПРФ иногда больше 100% (код, требует файл с данными об участках).

Через шаг в 1%:


Вот такой вот сюрприз от теории вероятностей и теории чисел, что не всегда можно приближать на гистограммах дискретные случайные величины - непрерывными. А очень часто измеренные случайные величины - именно дискретные (например, время пинга в миллисекундах).
Tags:

Проклятие размерности
nyaload
_winnie
В пространствах с высокой размерностью много непривычных вещей.

Например, если если есть кубик со стороной 2 сантиметра в 300-мерном пространстве, то его объем 2^300, огромное число в котором 90 цифр. Грубо говоря, если в этот 2-сантиметровый кубик напихать все звезды, планеты и атомы из нашей вселенной, то им там будет просторней чем в космосе. Можно на каждую вершину кубика посадить по атому, и они всё равно будут почти свободными после этого, ещё на миллиард вселенных останется.

Или ещё пример. Общем шара вписанного в кубик в 3*10278 раз меньше объёма кубика. Т.е. то что осталось вне шара - это больше чем 0.999999...<278 девяток>....

Осознал очередную странность из пространств с высокой размерностью. Дело в том, что если взять два случайных вектора из многомерного пространства - они скорее всего будут почти ортогональны. Поэтому если между двумя векторами угол 45°, то это сверх-редкая удача и вряд ли простая случайность, это значит что они почти равны, и на это надо обращать внимание. Но в то же время может быть так, что первый вектор "почти равен" второму, второй третьему, а угол между третьим и первым - уже 90° и никакой связи между ними нет.

Не работает простая эвристика "если от A до B очень близко, и от B до C очень близко, то С от A не слишком далеко", где "очень близко" определено как невероятность нахождения рядом.

Матстат.
nyaload
_winnie
Разбираюсь со статистикой. Модераторы ru_learnmaths чо-то спят, поэтому пишу в свой жж.
Прочитал в википедии про "Bayesian inference" и "Frequentist inference", но не очень понял.

Подбросил монету 10 раз. Четыре раза выпал орел. Ищу функцию правдоподобности, те. что при вероятности θ выпадения орла, орел выпадет 4 раза при 10-ти подкидываниях.
Получаю: L(θ|4 орла из 10) = C(10, 4) * θ4 * (1-θ) 10-4 (C(n,k) - биноминальные коэффициенты).
Ищу максимум функции правдоподобности, нахожу максимум в точке θ = 0.4.

1) Значит ли это, что при выпадении орла 4 из 10 ученый должен заключить, что распределение выпадающих сторон монеты - 0.4 для орла и 0.6 для решки? Ведь это вероятней чем 0.5/0.5 при данной выборке.
2) Вероятность выпадения 5000 орлов из 10000 бросков при честной монете - C(10000, 5000) / 0.510000 ≃ 0.008. Значит ли это что правдоподобность нулевой гипотезы "монета честная" меньше 0.05 и должна быть отброшена?
3) Как априори оценить вероятность встречи с динозавром на улице? 50/50, либо встречу, либо не встречу? А как оценить вероятность того, что передо мной - нечестная монета со смещенными вероятностями?

4) Где бы взять хороший практический учебник по статистке? А то при попытке читать определения из википедии или старые университетские лекции с теорией - возникают глупые вопросы как выше, при попытке применить их к тривиальным задачам.
Tags:

Частные производные. ∂xy
nyaload
_winnie
В школе привык писать производные как (f'x'x) или без штрихов ( fxx )
А в университете - везде используются используется запись ( ∂2f/∂x2 ).
Обратил внимание, что если в статье используется первая "школьная" запись - то она более практичная, в приложении можно найти работающий код. А если вторая - то вероятней заумное теоретическое исследование с непонятным результатам "нууу, можно двигаться в эту сторону", изредка с неадекватным бенчмарком.

Только ли у меня такое внутреннее сопротивление записи через дробь - что она неудобна для записи рукой на доске мелом или на бумажке карандашом или ручном наборе LATEX, хуже воспринимается на глаз при чтении при печати?

Что легче прочитать и запомнить в ночь перед сессией? Написать на доске? Набрать в LATEX или HTML без спец-программ? А что лучше использовать для пугания непосвященных демотиватором "учи матан"?


У меня такое ощущение, что запись через дробь - это выписывание каждый раз какой-то очень милой преподавателям абстракции или определения, но которая даётся студентам шаблоном "как есть" без объяснения. Её смысл понимает наверное только преподаватель истории математики. Зачем каждый раз выписывать определение производной через приращения (или что означает эта запись)? В этом шаблоне - как-то слишком много постоянных кривулек по сравнению с настраиваемыми (функция и переменные производной). Java-style какой-то.

Единственное преимущество - разгружается смысл нижнего индекса, который используется под разные цели и смысл зависит от контекста.

Сегодня обнаружил ещё одну запись, которая свободна от этого недостатка (и позволяет писать оператор отдельно): xy или Dxy


upd: http://en.wikipedia.org/wiki/Notation_for_differentiation (запись через дробь df/dx - Лейбниц, штрихи f' - Лагранж, с точкой у физиков - Ньютон, Dxyf - Эйлер, переменные снизу fxy - безымянная нотация из анализа, ∂xy - похожа на нотацию Эйлера, тоже безымянная)