September 9th, 2020

smile

"чем больше тестов, тем больше случаев"

Последнее время стал регулярно слышать мысль "чем больше тестов, тем больше случаев" в отношении Ковида. Сперва был застигнут врасплох в смежной теме, потом в других местах видел, а на днях ещё и bbb написал пост про локдауны в Норвегии и Швеции, в котором между делом вставил совершенно странную, мягко говоря, фразу
Данная численность ["заболевших"] в огромной степени является функцией числа проведенных тестов, а не реальных масштабов распространения вируса.
Не знаю, откуда вообще пошла эта мысль, но она практически дословно кочует по интернету, причём лишь среди людей т.н. "правых" взглядов, так что возникает ощущение, что она имеет политическую обусловленность, а не техническую. Интересно, обычно рассудительный bbb по вопросу коронавируса уже не стесняется использовать такие выражения как "жулики-ковидчики" и "эмоциональные срывы, побудившие политиков ввести локдауны". Так что я попытаюсь ещё раз, без политики, описать почему утверждение "чем больше тестов, тем больше случаев" не стоит ипользовать в качестве аргументации.

Прежде всего надо понять, что "количество тестов" (T) и "количество положительных тестов" (С) - две независимых величины. За исключением того, что C не может быть больше чем T, эти два числа никак между собой не связаны. От слова совсем. При увеличении T мы можем как наблюдать рост C, так и нет. Динамика реального числа заражений обуславливается структурой взаимодействия людей в обществе и их иммунитетом, но никак не количеством тестов. Динамика наблюдаемого числа заражений, т.е. выявления реальных случаев, зависит от того, где именно тестируют (например, в "очагах" или "пустырях"), а не от общего количества тестов. Поэтому утверждение "чем больше тестов, тем больше случаев" в общем случае бессмысленно. Так что же тогда оно значит?

Утверждение "чем больше тестов, тем больше случаев" может иметь смысл только в том случае, если за ним стоит какая-то гипотеза о характере тестирования и выявления положительных случаев. Не просто само по себе, не в общем случае, а только при наличии конкретной гипотезы. И гипотеза эта, как я понимаю, состоит в том, что вирус распределён равноверно по всей популяции, так что с каждой новой тысячей человек мы будем выявлять, например, по одному новому случаю. Или по два случая на каждую тысячу тестов. Или по семь случаев на каждые 10 тысяч тестов. Математически это означает, что количество положительных случаев прямо пропорционально количеству тестов, C = А*T, причём коэффициент пропорциональности - постоянная величина, которая показывает плотность распределения заражений в популяции.


Например, если на этом рисунке зараженные люди измеряются площадью красных кружочков, то очевидно, что эта площадь прямо пропорциональна количеству квадратных ячеек (или площади всех кружочков в них). Так, если мы тестируем только жителей одной ячейки, то получим "икс" заражённых. Если мы тестируетм жителей трёх ячеек, то получим "три*икс" заражённых, если тестируем семь ячеек, то получим "семь*икс" заражённых. Чем больше тестов, тем больше случаев.

Эту гипотезу легко проверить - благо данных навалом. Достаточно просто взять динамику заражений, C(t), динамику тестирования, T(t), и поделить одно на другое. Если полученное отношение не зависит от времени, то да, действительно, мы скорее всего имеем ровно ту ситуацию, которую предположили, что вирус распределён равноверно по всей популяции. В противном случае гипотеза не прошла проверку и про неё следует просто забыть. Именно забыть, а не делать из неё догму или "мнение" или "опять эту проклятую неопределённость".

Скандинавия - отличный case study, поскольку тамошние жители имеют схожие культурные особенности и демографическую структуру. Поэтому я построил графики, показывающие искомую динамику, для всех скандинавских стран. Но в данном случае нас интересует не сравнение между странами, а сравнение динамики тестирований и заражений внутри одной страны.

Collapse )

Это опровергает гипотезу о равномерном распределении вируса. Что, в свою очередь, делает бессмысленным исходное утверждение "чем больше тестов, тем больше случаев".

Из этих графиков можно попытаться понять что же происходило с тестами и заражениями.

В Норвегии в течение всего июля количество тестов было примерно одинаково, в то время как количество заражений в первой половине систематично падало. В середине июля количество заражений стало расти при том, что количество тестов оставалось примерно одинаковым. Это можно прямо соотнести с туристами, которые стали возвращаться из всяких Испаний после открытия границ. И только после резкого роста заражений можно видеть, что начали больше тестировать.

Это, кстати, ещё одна причина, по котрой рост числа заражений не может быть следствием роста числа тестов. Наоборот, рост числа заражений является причиной роста числа тестов.

Похожая ситуация была и с Данией. Данные о количестве тестов в Швеции известны только с начала июля, поэтому сложно сказать что-то определённое про динамику. Только для Финляндии можно очень грубо сказать, что количество заражений на 10 тыс тестов примерно постоянно в августе, так что количестов заражений растёт прямо пропорционально количеству тестов. Однако, если посмотреть на абсолютное количество заражений и тестов, то видно, что рост количества заражений предсшествует росту количества тестов. Т.е. также не может являться следствием роста количества тестирований. This entry was originally posted at https://glav.dreamwidth.org/696764.html. Please comment there using OpenID.