Category: наука

nyaload

функция Томе в реальной жизни

Функция Томе (она же модифицированная функция Дирихле, она же функция Римана (которая не дзета)) определяется так:
f(x) = 0 для иррациональных чисел
f(x) = 1/n, если x равен рациональному числу m/n (m/n - несократимая дробь).



Казалось бы, совершенно искусственная конструкция для теоретиков и мучителей студентов ("функция, непрерывная в иррациональных точках и разрывная в рациональных"). Но оказывается, можно встретить эту (точнее, похожую) функцию, играясь с более-менее физическими объектами.


Пример 1:
Есть посмотреть из начала координат на сад из деревьев высоты 1, посаженных квадратной решёткой, то увидим именно эту функцию ( http://en.wikipedia.org/wiki/Euclid%27s_orchard ):



Пример 2:
Пусть у нас есть много избирательных участков, на каждом целочисленное число избирателей, от 1 и больше (пусть доля участков размера n это pn). Пусть на каждом участке случайным образом выбирается соотношение голосов за кандидата (можно использовать более реалистичное биноминальное-нормальное с одинаковой долей голосов за кандидата, картинка будет похожей, только сгруппированной вокруг этой доли).
Тогда распределение долей голосов за кандидата на участках - похоже на функцию Томе. За кандидата на участке не может проголосовать иррациональная доля голосующих, так как доля на участке - всегда отношение целого числа человек к целому.
В точке m/n - будет 1/(n+1) часть голосов с участков размера n, 1/(2n+1) часть голосов с участков размера 2n, и тд, т.е. функция вероятности дискретного распределения в точке m/n равна pn/(n+1) + p2n/(2n+1) + ....

На практике это означает, что нарисовав гистограмму (с мелкими корзинами) доли голосов на куче участков, среди которых много крошечных - получится "расческа" похожая на "функцию Томе", совсем не гладкая.
nyaload

электронные термометры врут

Купил четыре штуки электронных термометров, все врут. Почитал интернеты, понял: электронные градусники делаются для американцев, а они меряют температуру во рту. А под мышкой градусник во-первых, не успевает нагреться, во-вторых его надо держать по-особому (вертикально и сильно прижимать). Даже градусник Omron с увеличеным датчиком, специально для измерения под мышкой, при писке показывает на 0.2-0.3 градуса меньше.

Что тут можно сделать:

  • обязательно правильно держать градусник (вертикально/под углом вниз, и прижать)

  • не обращать внимание на писк, держать столько же времени под мышкой, сколько и ртутный, пока не перестанет увеличиваться (5-10 минут)

  • прибавлять фиксированное число в момент писка (число индивидуально для человека и способа измерения)

  • купить таки ртутный градусник, но в оболочке которая не пропускает ртуть при разбивании. Я, как программист, верю поговорке "если не протестировано, значит не работает", но покупать 10 градусников для тестов и разбивать 9 не собираюсь :)

  • мерять температуру не под мышкой, а во рту



А ещё таки нашёл наконец градусник, который меня порадовал - инфракрасный. Во-первых, он не врет, показывает столько же сколько ртутный. Во-вторых, меряет температуру за пять секунд!!! Провел по лбу от виска до виска, и готово. Вроде, они тоже умеют врать и иметь странности, так что в качестве блого-поддержки качественных вещей укажу модель - "AND DT-635", стоит порядка 30$/800 рублей.

Collapse )
nyaload

MS Gothic

На японских сайтах часто замечаю один и тот же шрифт, который странно выглядит. Моноширинный, без сглаживания и при этом кривее чем например Courier New без сглаживания. Посмотрел, этот шрифт - MS Gothic.

Если зайти на без-дизайновую страничку какого-нибудь русского ученого - то всё будет написано Times New Roman. Если на страничку японского ученого - то MS Gothic (рандомный университетский home page). Причем шрифт этот используется даже в японской википедии. Я так понял, по историческим причинам, в Windows 3.11 MS Gothic был единственным надёжным шрифтом с иероглифами.

updated: Оказывается браузер автоматом выбирает этот шрифт по-умолчанию, если указана кодировка Shift_JIS.

Скриншот, если в вашем браузере нет шрифта или livejournal затирает шрифт:
Collapse )
  • Current Mood
    surprised surprised
nyaload

Антропный принцип, парадокс Ферми

Аргумент креационистов "ну это же невозможно потрясти мешок с деталями и достать оттуда айфон" мне кажется странным. Даже если не использовать естественные способы появления и развития жизни. Если уж из мешка появилось устройство способное задать вопрос о вероятности своего происхождения, то ничего нет удивительного в том

1) условная вероятность существования этого устройства равна 1, раз уж оно уже появилось. "мыслю -> существую".
2) вероятность что из следующего мешка вытащили второе такое же устройство - почти ноль. В этом тоже ничего удивительного.

Если предположить что у нас есть n=миллиард планет, вероятность появления жизни на каждой p=10^-100, то условная вероятность P(ровно одна планета с разумной жизнью|во вселенной есть хоть одна планета с существом задающим вопрос "откуда я") равна почти 1. Конкретно, n((1-p)^n-1 * (p^1)) / (1 - (1-p)^n)
Не знаю как в уравнении Дрейка оценивают вероятность p, но может быть куча неучтенных причин почему она почти ноль, если не быть оптимистом. Ну там, атомы случайно собираются в нужную молекулу раз в миллиард лет, но не учли что они соскальзывают друг с друга или что молекула не выживает, дав только три поколения. Дали миллиард поколений, и сожрали друг друга. Дали миллиард поколений, и умерли от изменения климата.

Странно удивляться маленькой вероятности тому что я существую, если уж я способен удивится.
Да, если ученый смотрит на константы вселенной - значит они таковы, что ученый уже появился.

Ну, вполне вероятно что скучная у нас вселенная. Появилось человечество первым, и единственным. Зато почти во всех остальных вселенных - вообще никто не появился. Зато в особо везучих вселенных, одной на 10^гугол - на каждой планете по независимой цивилизации, у каждой звезды ровно по 100 планет, и звезды выстроены в портрет Элвиса Пресли. Чисто случайно. Вот им-то уж точно придётся поудивляться :)

updated: ru.wikipedia.org/wiki/Аргумент_Икеды_—_Джеффериса
nyaload

Отношение двух случайных целочисленных величин.

Должен признать, что пики на графиках не являются безоговорочным признаком фальсификаций (здесь обсуждаю только пики, и факт их наличия, а не их размер или преступления с подделкой протоколов).

Если взять отношение двух ЦЕЛОЧИСЛЕННЫХ случайных величин, то на на простых дробях с небольшим знаменателем (напр. 1/2, 1/3, 1/4,1/5,...) образуются пики сами собой.

Так что пики могут взяться не только из-за искусственной подгонки результатов, а просто в силу того, что на 4 делится больше чисел, чем на 39 или 41.

Простой пример, дискретное распределение отношения двух случайных целых чисел i/j, i от 1 до 300, j от 0 до i (код для желающих)
Получается вот такой фрактал:

Заметьте, пики не только на 3/4 = 75%, но и на таких менее "круглых" числах как 1/7, 2/7, 6/7.
Когда мы на такой фрактал накладываем целочисленную решетку, мы получаем на ней пики там где находятся делители размера решётки (50%, 25%, 20%, 5%, 2%).

Попытка промоделировать выборы. Количество проголосовавших на участке берётся из файла с данными голосования (можно взять похожее log-normal, пики будут такие же). Биноминальная случайная величина B(n,p) для процента голосов за партию с p характерным для конкретного региона, выбирается как нормальная с центром в 40% +- sigma=20%.) Биноминальная лучше чем нормальная подходит для описания распределения на конкретном участке на концах интервала 0-100%. Если взять нормальную, то за Яблоко иногда будет отрицательное количество голосов, а за КПРФ иногда больше 100% (код, требует файл с данными об участках).

Через шаг в 1%:


Вот такой вот сюрприз от теории вероятностей и теории чисел, что не всегда можно приближать на гистограммах дискретные случайные величины - непрерывными. А очень часто измеренные случайные величины - именно дискретные (например, время пинга в миллисекундах).
nyaload

Проклятие размерности

В пространствах с высокой размерностью много непривычных вещей.

Например, если если есть кубик со стороной 2 сантиметра в 300-мерном пространстве, то его объем 2^300, огромное число в котором 90 цифр. Грубо говоря, если в этот 2-сантиметровый кубик напихать все звезды, планеты и атомы из нашей вселенной, то им там будет просторней чем в космосе. Можно на каждую вершину кубика посадить по атому, и они всё равно будут почти свободными после этого, ещё на миллиард вселенных останется.

Или ещё пример. Общем шара вписанного в кубик в 3*10278 раз меньше объёма кубика. Т.е. то что осталось вне шара - это больше чем 0.999999...<278 девяток>....

Осознал очередную странность из пространств с высокой размерностью. Дело в том, что если взять два случайных вектора из многомерного пространства - они скорее всего будут почти ортогональны. Поэтому если между двумя векторами угол 45°, то это сверх-редкая удача и вряд ли простая случайность, это значит что они почти равны, и на это надо обращать внимание. Но в то же время может быть так, что первый вектор "почти равен" второму, второй третьему, а угол между третьим и первым - уже 90° и никакой связи между ними нет.

Не работает простая эвристика "если от A до B очень близко, и от B до C очень близко, то С от A не слишком далеко", где "очень близко" определено как невероятность нахождения рядом.
nyaload

Матстат.

Разбираюсь со статистикой. Модераторы ru_learnmaths чо-то спят, поэтому пишу в свой жж.
Прочитал в википедии про "Bayesian inference" и "Frequentist inference", но не очень понял.

Подбросил монету 10 раз. Четыре раза выпал орел. Ищу функцию правдоподобности, те. что при вероятности θ выпадения орла, орел выпадет 4 раза при 10-ти подкидываниях.
Получаю: L(θ|4 орла из 10) = C(10, 4) * θ4 * (1-θ) 10-4 (C(n,k) - биноминальные коэффициенты).
Ищу максимум функции правдоподобности, нахожу максимум в точке θ = 0.4.

1) Значит ли это, что при выпадении орла 4 из 10 ученый должен заключить, что распределение выпадающих сторон монеты - 0.4 для орла и 0.6 для решки? Ведь это вероятней чем 0.5/0.5 при данной выборке.
2) Вероятность выпадения 5000 орлов из 10000 бросков при честной монете - C(10000, 5000) / 0.510000 ≃ 0.008. Значит ли это что правдоподобность нулевой гипотезы "монета честная" меньше 0.05 и должна быть отброшена?
3) Как априори оценить вероятность встречи с динозавром на улице? 50/50, либо встречу, либо не встречу? А как оценить вероятность того, что передо мной - нечестная монета со смещенными вероятностями?

4) Где бы взять хороший практический учебник по статистке? А то при попытке читать определения из википедии или старые университетские лекции с теорией - возникают глупые вопросы как выше, при попытке применить их к тривиальным задачам.
nyaload

Частные производные. ∂xy

В школе привык писать производные как (f'x'x) или без штрихов ( fxx )
А в университете - везде используются используется запись ( ∂2f/∂x2 ).
Обратил внимание, что если в статье используется первая "школьная" запись - то она более практичная, в приложении можно найти работающий код. А если вторая - то вероятней заумное теоретическое исследование с непонятным результатам "нууу, можно двигаться в эту сторону", изредка с неадекватным бенчмарком.

Только ли у меня такое внутреннее сопротивление записи через дробь - что она неудобна для записи рукой на доске мелом или на бумажке карандашом или ручном наборе LATEX, хуже воспринимается на глаз при чтении при печати?

Что легче прочитать и запомнить в ночь перед сессией? Написать на доске? Набрать в LATEX или HTML без спец-программ? А что лучше использовать для пугания непосвященных демотиватором "учи матан"?


У меня такое ощущение, что запись через дробь - это выписывание каждый раз какой-то очень милой преподавателям абстракции или определения, но которая даётся студентам шаблоном "как есть" без объяснения. Её смысл понимает наверное только преподаватель истории математики. Зачем каждый раз выписывать определение производной через приращения (или что означает эта запись)? В этом шаблоне - как-то слишком много постоянных кривулек по сравнению с настраиваемыми (функция и переменные производной). Java-style какой-то.

Единственное преимущество - разгружается смысл нижнего индекса, который используется под разные цели и смысл зависит от контекста.

Сегодня обнаружил ещё одну запись, которая свободна от этого недостатка (и позволяет писать оператор отдельно): xy или Dxy


upd: http://en.wikipedia.org/wiki/Notation_for_differentiation (запись через дробь df/dx - Лейбниц, штрихи f' - Лагранж, с точкой у физиков - Ньютон, Dxyf - Эйлер, переменные снизу fxy - безымянная нотация из анализа, ∂xy - похожа на нотацию Эйлера, тоже безымянная)