Tags: science

smile

научный метод vs machine learning

Задумался о том, что представляют собой условные "алгоритмы фейсбука": по каким критериям условный фейсбук предлагает мне не только рекламу, но и "Suggested for You" посты.

Вряд ли он строит поведенческую модель меня, в том смысле в каком слово "модель" понимается в той же физике: человек описывается некоторым "теоретическим" уравнением, которое в общем случае нерешается, но по реакции некоторого конкретного человека на различные внешние раздражители такое уравнение можно "упростить" и получить приближённые значения "коэффициентов поведения" для этого конкретного человека. Это как-бы невозможно: начиная с того, что само "уравнение человека", в отличие от "уравнения атома", неизвестно, и заканчивая тем, что даже если бы оно было известно, решение подобного уравнения требовало бы недостижимое количество ресурсов.

Я так понимаю, подход условного machine learning противоположный: нам не важно ни общее "уравнение человека", ни поведение конкретно взятого человека. Скорее, мы смотрим на поведение "группы людей", и строим "статистическую модель" их коллективного поведния, - которая принципиально отличается от "физической модели". Такая "статистическая модель" представляет собой "эмпирический" набор регрессий, зачастую просто линейных - куда там до закона обратных квадратов в законе Кулона или кубов в законах Кеплера. А дальше люди "классифицируются" по разным параметрам регрессий, и модельное "поведение человека" определяется тем, в какую "группу" он попал. Такая классификация, наверняка, динамическая, так что модель постоянно "обучается", уточняя значения параметров и категорий.

Я не к тому, что такой "статистический" подход чем-то хуже чем "физический" (очевидно, он работает, и приносит ощутимый доход своим создателям, - значит всяко "лучше"). Но он представляет собой совершенно иной тип мышления, совершенно иной способ решния актуальных задач. "Физический" метод подразумевает по крайней мере два важных принципа: редукционизм и причинно-следственные связи. Любое яввление, каким бы сложным оно ни было, можно "редуцировать" до конкретной комбинации более простых, выявив при этом причину и следствие. "Статистический" метод этого в приниципе не позволяет: он предполагает что явление является некоторым "чёрным ящиком", который в приницпе не позволяет докопаться до "элементарых" явлений. Да, внутри этого чёрного ящика по-прежнему сидит некоторая "модель", которая предполагает некоторую связь наблюдаемых переменных с помощью каких-то параметров, которых может быть "очень много". И в этом смысле это даже похоже на "ряд Тейлора", в котором неизвестная функция приближается многочленом. Но за таким "полиномиальным приближением" в этих двух случаях стоят соверешнно разные парадигмы как мышления, так и нашего представления о функционировании природы.

В своё время "физический" метод, называемый традиционно "научным методом", оказал огромное влияние на культуру и развитие общества. "Статистический" метод, кажется, ещё не идентифицируется широко как "научный метод", - вероятно, потому что используется, в основном, в коммерческих продуктах и считается максимум чем-то "инженерным". Но он всё больше проникает в университеты, тем самым "завоёвывая" статус "научного". Опять-таки, я не к тому, что "это что-то плохое", а к тому, что это может оказать существенное влияние на общество и культуру, подобное тому, какое в своё время оказал "физический метод". Может быть рост популярности "identity politics" - это следствие такой "статистической" классификации людей?

This entry was originally posted at https://glav.dreamwidth.org/713606.html. Please comment there using OpenID.
smile

Язык определяет сознание

Довелось мне поддерживать некоторый код на Python. Которого я, в отличие от C-семейства, не знаю, так что заодно и подучился немного. Код большой и солидный, выполняет нетривиальные задачи. При этом он достаточно структурированный и аккуратно написанный, - настолько, что я бы и сам так писал, если бы писал его с нуля(*).

По другому вопросу обсуждал с автором этого кода, как Excel обрабатывает числа. Конкретный вопрос зашёл за очень маленькую величину, порядка 1E-10, которая считалась разными способами в Excel, и результатом было два разных числа. Я навскидку посмотрел, в какой именно позиции эти числа начинают различаться, - оказалась 17я цифра после запятой (при том что первые 10 - нули). Ну, понятно - значит Excel хранит всего два байта, а остальные цифры - "мусор". Как оказалось, примерно так оно и есть.

Но, как оказалось, подобные знание про floating-point arithmetic было для автора солидного кода на Python откровением. Равно как и понимание, как устроена память компьютера и откуда берётся "мусор" в числах. Мне казалось, что это известно любому computer scientist. Даже я, который не computer scientist, общее представление об этом имею (**). Получается, человек смог написать большой и хорошо структурированный код, который выполняет нетривиальные (на мой скромный вкус) задачи, не зная про устройство памяти и операции с числами с плавающей точкой. Вот это поразительно!

А потом я "обнаружил", что в Python нет указателей. И, в некотором смысле, всё стало на свои места. Ведь, действительно, если ты не работаешь с указателями, то тебе совершенно нет необходимости в понимании "внутреннего" устройства компьютера. При этом, ты по-прежнему можешь иметь "конструкторский" склад ума, который позволяет строить сложные алгоритмы и работать со сложными данными.

Буквально сегодня нашёл такую замечательную формулировку:
If you're coming to Python from a language in the C/Java/etc. family, it may help you to stop thinking about A as a "variable", and start thinking of it as a "name". A, B, and C aren't different variables with equal values; they're different names for the same identical value. Variables have types, identities, addresses, and all kinds of stuff like that. Names don't have any of that.


(*) Собственно, мне даже учить (пока) ничего не пришлось: имеющегося кода хватило для понимания структуры языка. Если бы не ограничение в 80 символов на длину строки, я бы даже счёл этот язык достаточно удобным.
(**) Хоть и все детали битовых операций (равно как и регулярные выражения) для меня по-прежнему остаются магией. This entry was originally posted at https://glav.dreamwidth.org/701857.html. Please comment there using OpenID.
smile

Языковые семьи

Когда-то давно я решил потренироваться в прокрастинации и нарисовать иерархическое дерево всех языков. Достаточно быстро понял, что все 7000 языков нарисовать не очень получится, так что сфокусировался на самых распростарнённых/близких. Даже это в полной мере осуществить не получилось, и я забросил это дело. Сейчас вспомнил про это дело - и решил запостить что есть.

В итоге получилось примерно так: это только превьюшка, под катом - версия в нормальном разрешении


Дерево включает все языковые семьи Евразии, за исключением Юго-Восточной Азии. Каждая языковая семья содержит основные признанные языки, с указанием их численности, статуса и иногда диалектов. Данные брал исключительно в Википедии.

На обозначеной территории можно найти следующие семьи:
- Indo-European
- Uralic
- Vasconic
- Turkic
- Mongolic
- Tungusic
- Japonic
- Koreanic
- Dravidian
- South Caucasian
- North-East Caucasian
- North-West Caucasian

Что интересного

- Самая большая семья, понятное дело, Индо-Европейская. При этом она является лишь одной из огромного списка других семей.

- Среди Индо-Европейских языков, Греческий, Армянский и Албанский находятся на том же уровне иерархии, что и все Германские, Романские и Балто-Славянские языки, т.е. составляют отдельные "ветви" имени себя.

- Кавказские языки, несмотря на малый ареал "обитания", включают аж 3 семьи, распространённые исключительно на Кавказе: Южная (наибольший представитель - Грузинский язык), Северо-Восточная (Чеченский), Северо-Западная (Кабардинский). При этом, среди языков Кавказа есть представители ещё 2х других семей: Индо-Европейской (Осетинский) и Тюркской (Азербайджанский).

- Баскский язык является изолятом, т.е. вообще единственным представителем целой языковой семьи. Баски - небольшой народ на северо-востоке Испании, и вообще непонятно, как они там оказались, и как этот язык выжил.

- Японский и Корейский языки являются "почти" изолятами, составляя подавляющие доли по численности носителей своих языковых семей.

- На северо-востоке Евразии живут немногочисленные носители аж пяти различных языковых семей: Чукотско-Камчатской, Юкагир, Енисейская, Нивкх, Айну. Их хотели объединить с другими азиатскими семьями, но ничего не вышло: настолько они разные.

- Несмотря на устойчивость термина "татаро-монголы", татары и монголы относятся не просто к разным народам, но и их языки относятся к разными языковым семьям. Носители тюркских языков раскиданы от Стамбула до Камчатки. Тюркские, Монгольские и Тунгусские языки тоже хотят объединить в одну макро-семью, Алтайскую, но пока эта гипотеза не очень убедительна.

- Венгерский язык - самый многочисленный из Уральской семьи, ареал обитания остальных носителей которой - приполярье.

- В Индии живут носители двух крупных языковых семей: Индо-Европейской и Дравидийской. Причём, наоборот, Индо-Арийская ветвь Индо-Европейской семьи, а также вся Дравидийская семья "обитают" практически исключительно в Индии.

Collapse )

This entry was originally posted at https://glav.dreamwidth.org/699206.html. Please comment there using OpenID.
smile

научное фехтование

Внезапно пришла в голову мысль по поводу популярности в просвещённых кругах ссылок на научные статьи как способа аргументации той или иной точки зрения. В основном, это касается околомедицинских статей (пресловутый pubmed), но бывают и по другой тематике.

Я так понимаю, этот способ аргументации распространён у айтишников, которые по роду своей деятельности привыкли докапываться до сути проблемы (бага в коде) за несколько часов. И вообще воспринимают мир как набор структурированных задач (с соответствующими иерархиями и однозначными причинно-следственными связями), которые решаемы за конечное число шагов. Такой себе конструктор из кирпичиков-идей и кирпичиков-решений, комбинируя которые в логической последовательности можно получить ответ на любой вопрос. Ничего плохого в таком восприятии мира нет, наоборот - в т.ч. благодаря такому подходу человек полетел на Луну и пользуется айфонами. Такой себе классический редукционизм, основа научного метода.

Проблема в том, что те вопросы, которые являются предметом исследований учёных (в широком смысле, включая медиков и социологов), ещё не "формализованы" до уровня тех самых "кирпичиков", из которых "программисты" что-то строят. Кирпичики появятся лишь на "следующем" этапе, когда учёные их, собственно, создадут, а также покажут, как именно их можно собирать вместе. То, чем орудуют учёные, это бесформенная "глина", и из неё одинаково возможно получить как кирпичики, так и жижу. А сами кирпичики, если и получатся, могут быть как квадратными так и круглыми, из которых непонятно, что можно построить.

Другими словами, если взять какую-то отдельную статью с пабмеда, то с помощью банальной эрудиции можно "доказать" совершенно противоположные утверждения. Примерно как это бывает с противоречивой системой аксиом в математике. Как говорит flying_bear, проверке подвергается не изолированный факт или понятие, а система мира в целом. Это, в свою очередь, означает, что существенной частью произвольной статьи на пабмеде является контекст, в котором эта работа была выполнена. Чем мотивирована, на какие исследования опирается, из каких предположений исходит. Некоторые вещи могут даже не проговариваться явно, т.к. все те, кто "в теме", понимают контекст по ключевым используемым словам и методам. (совсем другой вопрос, что бывают статьи, в которых эти вещи безобразно описаны, и такой контекст сложно понять, - но это уже связано с качеством статьи, а не с содержанием исследования).

Это, с другой стороны, не означает, что учёные занимаются какой-то магией, или что их надо считать какими-то жрецами, которым открыта истина. Просто овладевание необходимым контекстом и инструментами занимает время. Это то, что называется "специализация". На это уходит как минимум пять лет университета и три года аспирантуры, - full time занятости. Это не то, что можно быстренько изучить за несколько часов или дней в интернете. Точно так же, как и в случае с любой другой профессией. Книжки "программирование на джаваскрипт за 7 дней" вызывают усмешку. Ровно такое же ощущение вызывают фехтование научными статьями в жежешечке.

С третьей стороны нужно отметить, что определенные области знания позволяют быстрее чем за пять лет "войти" в смежную тему за счёт "общих курсов", изучавшихся в университете, индивидуальной эрудиции, междисциплинарного опыта. Так, математик, экономист и биолог могут легко понимать статистику, вне зависимости от того, о чём идет речь: выборах или клинических исследованиях. Главное, не увлекаться в такой кросс-платформенности, т.к. в каждой из специализированных областей может существовать исторически обусловленный контекст, не лежащий на поверхности. This entry was originally posted at https://glav.dreamwidth.org/698606.html. Please comment there using OpenID.
smile

"чем больше тестов, тем больше случаев"

Последнее время стал регулярно слышать мысль "чем больше тестов, тем больше случаев" в отношении Ковида. Сперва был застигнут врасплох в смежной теме, потом в других местах видел, а на днях ещё и bbb написал пост про локдауны в Норвегии и Швеции, в котором между делом вставил совершенно странную, мягко говоря, фразу
Данная численность ["заболевших"] в огромной степени является функцией числа проведенных тестов, а не реальных масштабов распространения вируса.
Не знаю, откуда вообще пошла эта мысль, но она практически дословно кочует по интернету, причём лишь среди людей т.н. "правых" взглядов, так что возникает ощущение, что она имеет политическую обусловленность, а не техническую. Интересно, обычно рассудительный bbb по вопросу коронавируса уже не стесняется использовать такие выражения как "жулики-ковидчики" и "эмоциональные срывы, побудившие политиков ввести локдауны". Так что я попытаюсь ещё раз, без политики, описать почему утверждение "чем больше тестов, тем больше случаев" не стоит ипользовать в качестве аргументации.

Прежде всего надо понять, что "количество тестов" (T) и "количество положительных тестов" (С) - две независимых величины. За исключением того, что C не может быть больше чем T, эти два числа никак между собой не связаны. От слова совсем. При увеличении T мы можем как наблюдать рост C, так и нет. Динамика реального числа заражений обуславливается структурой взаимодействия людей в обществе и их иммунитетом, но никак не количеством тестов. Динамика наблюдаемого числа заражений, т.е. выявления реальных случаев, зависит от того, где именно тестируют (например, в "очагах" или "пустырях"), а не от общего количества тестов. Поэтому утверждение "чем больше тестов, тем больше случаев" в общем случае бессмысленно. Так что же тогда оно значит?

Утверждение "чем больше тестов, тем больше случаев" может иметь смысл только в том случае, если за ним стоит какая-то гипотеза о характере тестирования и выявления положительных случаев. Не просто само по себе, не в общем случае, а только при наличии конкретной гипотезы. И гипотеза эта, как я понимаю, состоит в том, что вирус распределён равноверно по всей популяции, так что с каждой новой тысячей человек мы будем выявлять, например, по одному новому случаю. Или по два случая на каждую тысячу тестов. Или по семь случаев на каждые 10 тысяч тестов. Математически это означает, что количество положительных случаев прямо пропорционально количеству тестов, C = А*T, причём коэффициент пропорциональности - постоянная величина, которая показывает плотность распределения заражений в популяции.


Например, если на этом рисунке зараженные люди измеряются площадью красных кружочков, то очевидно, что эта площадь прямо пропорциональна количеству квадратных ячеек (или площади всех кружочков в них). Так, если мы тестируем только жителей одной ячейки, то получим "икс" заражённых. Если мы тестируетм жителей трёх ячеек, то получим "три*икс" заражённых, если тестируем семь ячеек, то получим "семь*икс" заражённых. Чем больше тестов, тем больше случаев.

Эту гипотезу легко проверить - благо данных навалом. Достаточно просто взять динамику заражений, C(t), динамику тестирования, T(t), и поделить одно на другое. Если полученное отношение не зависит от времени, то да, действительно, мы скорее всего имеем ровно ту ситуацию, которую предположили, что вирус распределён равноверно по всей популяции. В противном случае гипотеза не прошла проверку и про неё следует просто забыть. Именно забыть, а не делать из неё догму или "мнение" или "опять эту проклятую неопределённость".

Скандинавия - отличный case study, поскольку тамошние жители имеют схожие культурные особенности и демографическую структуру. Поэтому я построил графики, показывающие искомую динамику, для всех скандинавских стран. Но в данном случае нас интересует не сравнение между странами, а сравнение динамики тестирований и заражений внутри одной страны.

Collapse )

Это опровергает гипотезу о равномерном распределении вируса. Что, в свою очередь, делает бессмысленным исходное утверждение "чем больше тестов, тем больше случаев".

Из этих графиков можно попытаться понять что же происходило с тестами и заражениями.

В Норвегии в течение всего июля количество тестов было примерно одинаково, в то время как количество заражений в первой половине систематично падало. В середине июля количество заражений стало расти при том, что количество тестов оставалось примерно одинаковым. Это можно прямо соотнести с туристами, которые стали возвращаться из всяких Испаний после открытия границ. И только после резкого роста заражений можно видеть, что начали больше тестировать.

Это, кстати, ещё одна причина, по котрой рост числа заражений не может быть следствием роста числа тестов. Наоборот, рост числа заражений является причиной роста числа тестов.

Похожая ситуация была и с Данией. Данные о количестве тестов в Швеции известны только с начала июля, поэтому сложно сказать что-то определённое про динамику. Только для Финляндии можно очень грубо сказать, что количество заражений на 10 тыс тестов примерно постоянно в августе, так что количестов заражений растёт прямо пропорционально количеству тестов. Однако, если посмотреть на абсолютное количество заражений и тестов, то видно, что рост количества заражений предсшествует росту количества тестов. Т.е. также не может являться следствием роста количества тестирований. This entry was originally posted at https://glav.dreamwidth.org/696764.html. Please comment there using OpenID.
smile

про относительность и мимолётность

Комментарий про улыбку
Тема несовпадения коммуникативных традиций вообще чертовски интересная. Впервые, насколько мне известно, раскрыта в рассказе Короленко "Без языка" - там речь идёт о семантике улыбки. Когда оказывается, что для американцев улыбка - это просто жест вежливости, ни к чему не обязывающий, а для крестьянина из Восточной Европы это чуть ли не предложение дружбы на всю жизнь.
напомнил мне картинку про гауссиану распределения реакции для нормальных людей, американцев, и "восточных европейцев".

Исходный пост вроде байка, но тем не менее является наглядной метафорой для реальных различий в восприятии (цит. с сокр.):
(Существует) более или менее стандартный сценарий, по которому люди знакомятся, флиртуют, ухаживают, и наконец оказываются друг с другом в постели. Допустим, что этот сценарий приблизительно разбили на 30 ступеней. Там есть разное, от "посмотрели друг другу в глаза", "дотронулись", "Поцеловались" - и последнее звено этой цепочки - секс.

Оказалось, что поцелуй у американцев находится где-то очень близко к началу в этой цепочке, а у англичан - практически в конце. Ну вроде как - в цепочке из 30 мест, у американцев оно на 3 месте, а у англичан на 28.

Американский мужчина начинает встречаться с английской девушкой, она ему нравится, и он довольно быстро ее целует, не успев практически ничего проделать из этих 30 пунктов. Для него это - нормально и не зазорно. Т.е. чаю вместе выпили и поцеловались.

Девушка, которая привыкла, что от первого чая до первого поцелуя - еще 20 с лишним каких-то признаков симпатии, пребывает в изумлении - как же это так, что ее прямо сразу ставят перед фактом, что уже "пошли в постель". Однако, мужчина ей нравится, и она в смятении - ей уже предложили секс, и в ее сценарии она находится у последней черты (ну ладно, предыдущие 20 с чем-то почему то пропустили, но теперь до последней уже дошли, и надо действовать дальше по понятным сценариям). В этом последнем шаге от постели - что надо делать? Прощаться или соглашаться! И т.к. он ей нравится. она говорит: "Эээх, фиг с ним!" и... раздевается!

А американский мужчина, который вообще-то ожидал, что теперь еще пицца, кино, прогулка в парке, куча свиданий, держание за ручки, и куча еще всего - видит, что девушка раздевается хотя только еще поцеловались (что для него - еще очень ранний этап флирта). Обалдевает... А потом думает - ну ладно, не совсем понятно, чего это она так рвется в бой. Но раз дают - надо же брать!

***

Другая история - про то, зачем нужно заново проектировать ракеты, если они уже были спроектированы, и даже успешно летали раньше. Длинный текст можно резюмировать наглядной фразой:
Технологии не существуют вообще. Технологии существуют здесь и сейчас.
Интересно, то же, похоже, относится и к разработке программного обеспечения: написать новый код зачастую проще, чем поддерживать/рефакторить старый. И то же, отчасти, можно сказать про науку - в той мере, в какой она становится технологичной. Высокотехнологичные эксперименты, и реальные, и даже численные, опираются на большое количество элементов, в которых важны опыт текущих исследователей, "понимание", зачем и как работает этот элемент, а также на банальное существование тех или иных компонентов. С "теорией" же вроде как проще: всё задокументировано в журналах или учебниках, и восстановить ход рассуждений столетней давности достаточно просто.

This entry was originally posted at https://glav.dreamwidth.org/682661.html. Please comment there using OpenID.
smile

фейсбук как иллюстрация научного мира

Не занимался историей этого вопроса, но судя по тому, что популярный наукометричный показатель индекс Хирша появился только в 2005 году, количество цитирований как способ оценки качества научной работы стало использоваться совсем недавно. С одной стороны "качество работы" - это неформализуемое понятие, и любой формальный критерий так или иначе будет не учитывать те или иные аспекты этого "качества". С другой стороны, коль скоро формальный критерий качества "озвучен" и по нему производится "отбор" (например, при приёме на работу), люди будут стремиться оптимизировать именно этот критерий, а не эфемерное "качество".

В "быту" мы можем это наблюдать на примере популярности различных фейсбук и инстаграм аккаунтов, которая измеряется лайками и количеством подписчиков:
Лайки в Фейсбуке часто обусловлены созданием групп поддержки и групп взаимного восхищения. Иногда ерундовый постинг с кошечками набирает несколько тысяч лайков, а умное не стандартное рассуждение - ни одного. Часто люди ставят лайки, даже не прочитав текст по ссылке. Иногда чтобы подлизаться к автору поста. Иногда - рассчитывая на ответное внимание. Все это причины, не связанные с качеством поста. Означает ли это, что такие необоснованные лайки нужно исключить из учета? Думаю, что нет, потому что в этом суть лайков и состоит - они не объективны. Они именно отражают ваше умение создать общество взаимного восхищения, увлечь людей, желающих к вам подлизаться. Это и есть популярность.

Цитирование в научной литературе тоже мера популярности, со всеми присущими популярности проблемами.
Умные Гугл и Фейсбук нашли способ монетизировать популярность, который переводит некий неформализуемый "вес" веб-страницы в деньги. И сразу появились всякие оптимизаторы, которые раскручивают (и даже накручивают) страницы, с целью повышения дохода. Этот доход, в свою очередь, можно направить и на улучшение качества контента (наняв специалистов, например), а также на ещё бОльшую раскрутку, что становится самоподдерживающим процессом. В итоге привлечённые деньги становятся мерой успешности и качества того или иного блоггера.

Занимательно, что нечто похожее можно сказать и про научную среду. По ссылке примеры из личной практики автора, один из которых точно повсеместный:
В любом объявлении о вакансии написано "create strong eхternally funded research program". Это часть job description.
Качественно иная ситуация, по моим ощущениям, в среде окружающих меня программистов или даже в научно-исследовательских отделах промышленных компаний. Несмотря на то, что они работают на компании, единственной целью которых является принесение прибыли. Все такие инженеры являются наёмными работниками, job description которых является выполнять поставленные руководством задачи. А "монетизация" - это уже job description сугубо руководства этих инженеров. Несмотряна то, что менеджеров никто не любит, такое "разделение труда" позволяет каждому заниматься своим делом: инженерам - ковыряться в коде или приборах, а менеджерам - монетизировать контент.

This entry was originally posted at https://glav.dreamwidth.org/678049.html. Please comment there using OpenID.
smile

Очки для дальтоников

Увидел в фейсбуке видео как дальтонику дарят специальные очки - и он начинает распознавать цвета, которые раньше не видел. Погуглил - оказывается такие очки действительно существуют. Вот было бы классно, если бы не только зрение, но и другие чувства/ощущения можно было бы скорректировать с помощью специальных "очков". Чтобы можно было почувствовать то, что чувствуют другие. Вроде бы и говорят, что всё можно объяснить словами, но вот тот же цвет - как его "объяснить"? Пока сам не увидишь, не поймёшь. По сути так же и другими восприятиями: пока сам не прочувствуешь, не переживёшь, - не поймёшь..

This entry was originally posted at https://glav.dreamwidth.org/665907.html. Please comment there using OpenID.
smile

женщины в науке

Увидел в инстаграме микробиолога, которая постит красивые картинки бактерий и микроорганизмов из-под микроскопа, что сегодня международный день женщин в науке. На сайте ООН говорится, что
At present, less than 30 per cent of researchers worldwide are women. According to UNESCO data (2014 - 2016), only around 30 per cent of all female students select STEM-related fields in higher education.
и на соседней странице
A significant gender gap has persisted throughout the years at all levels of science, technology, engineering and mathematics (STEM) disciplines all over the world. Even though women have made tremendous progresses towards increasing their participation in higher education, they are still underrepresented in these fields.
Несмотря на казалось бы clear message, тут намешаны в кучу несколько вещей.

Во-первых, смешиваются понятия Science и STEM. Хоть STEM и включает в себя слово Science буквально, не очень понятно, что он в себя не включает, а также как они соотносятся по сути, а не буквально. В бытовой речи, да и выше по ссылкам "science" означает "research". Но research можно делать не только в физике и химии, но и в литературе и искусстве, т.е. в том, что обычно обозначается Arts & Humanities, которые, по идее, в STEM не включаются. Т.о. возможна ситуация, когда некоторая дисциплина обозначается как Science, но не является частью STEM.

Я погуглил и нашёл некий доклад prepared for Members and Committees of Congress США, в котором обсуждается, что такое STEM:
Whether it is visas for foreign workers, scholarships for STEM majors, or funding for scientific research, the question of what we mean by the term “STEM” is central to the federal policy conversation. Some federal agencies, such as the NSF, use a broader definition of STEM that includes psychology and the social sciences (e.g., political science, economics) as well as the so-called core sciences and engineering (e.g., physics, chemistry, mathematics). Others, including the Department of Homeland Security (DHS), U.S. Immigration and Customs Enforcement (ICE), use a narrower definition that generally excludes social sciences and focuses on mathematics, chemistry, physics, computer and information sciences, and engineering. Some analysts argue that field-specific definitions such as these are too static and that definitions of STEM should focus on “an assemblage of practices and processes that transcend disciplinary lines and from which knowledge and learning of a particular kind emerges
Понятно, что когда меряют всякие индикаторы, эти вещи чётко оговариваются. Но потом, когда результаты идут в народ, все детали теряются и каждый понимает под этими словами то, что хочет. Более того, такая неопределённость позволяет журналистам и политикам говорить лозунгами, не заботясь о реальном содержании транслируемых ими идей.

ЮНЕСКО сделала красивую интерактивную даграмму, которая показывает долю женщин на трёх этапах карьеры: которые учатся в университете, которые учатся в аспирантуре, и которые занимаются research (в университетах или в R&D отделах компаний и оргранизаций). Данные можно увидеть, кликнув на какую-то страну, либо загрузив всю таблицу в текстовом формате. Графиков я не нашёл, так что о тенденциях говорить сложно. Из того, что я покликал, в каждой стране женщин-студенток больше чем женщин-аспиранток, которых, в свою очередь, больше чем женщин-researchers. Причём в западных странах доля студенток больше 50 %. Интересно, что данных по "ключевым" странам, которые задают мировой тренд, США, Канады, Австралии, Китая, Индии - там нет.

Второй важный аспект, который смешивается в кучу, это различие между research и обучением в университете. Университетский диплом сейчас является более-менее показателем развитости и массовости, так что судить о состоянии дел в "образовании и науке" имеет смысл как раз по нему. Наоборот, research - это настолько узкая область деятельности, что доля людей, которая этим занимается ничтожна. А малые выборки, как известно, не обязаны отражать статистику всей популяции.

Если же говорить об образовании, то, по крайней мере в США, underrepresented оказываются мужчины, а не женщины. Gender Distribution of Bachelor's Degrees in the Humanities показывает, что женщины доминируют во всех дисциплинах, кроме инженерных. Более того, общий паритет был достигнут аж в 1980х годах, а в "научных" и "бизнес" дисциплинах - в 1990х


Наверняка, в отсталых и/или развивающихся странах дисбаланс по-прежнему есть. И это как раз повод для актвности всяких международжных организаций типа ООН. Но ведь основной активизм по этому поводу слышен как раз в развитых странах, где паритет уже давно достигнут. Т.е. они ломятся в открытую дверь, занимаясь надуманными проблемами. Более того, в тех развивающихся странах, где гендерный дисбаланс существенен, кажется, что это не самая главная проблема. Главная проблема там - коррупция, которая мешает нормальному экономиическому развитию, которое является важной движущей силой для гендерного равенства.

This entry was originally posted at https://glav.dreamwidth.org/662841.html. Please comment there using OpenID.
smile

climate change

Смотрю сейчас какие-то австралийские дебаты, где общественные деятели обсуждают вопрос climate change. Эти слова тут (также как и в США, как я понимаю) у всех на слуху, разнообразные люди в разнообразных ситуациях постоянно их упоминают. Недавно даже на довыборах в парламент один из кандидатов сделал это одной из главных тем своей кампании, на чём и победил.

Несмотря на интенсивный поток речей, от всех этих разговоров складывается ощущение бессмыслицы. Что говорят? - "Climate change is real", "We need to do something". - При этом никто даже не трудится объяснить, что такое climate change. Любое погодное явление, - сейчас их в Австралии полный набор: от наводнений на севере до пожаров на юге, от засухи на западе до вымирания рыбы на востоке, - любое явление используется в качестве подтверждения climate change и повода сказать, что надо что-то делать.

Но что такое climate change? Что погода меняется? Ну так это тривиальное утверждение: погода меняется всегда. Точно также как Земля всегда движется вокруг Солнца, как всегда текут реки, как всегда возникают приливы и отливы, как всегда дуют ветра. Всегда. В чём смысл ещё одного утверждения о том, что всё постоянно меняется?

Или речь идёт о том, что учащаются пожары? Или вымирают кораллы? Или тают ледники? Но ведь это вполне конкретные явления, которые имеют конкретные причины и конкретные методы решения. Даже если мы не знаем, что конкретно приводит к таянию ледников или учащению пожаров, эти вопросы поддаются исследованию, анализу, проверке, - просто потому что есть объект исследования, есть конкретное явление. А какой объект исследования у climate change?

Ещё говорят, что climate change ведёт к необратимым изменениям окружающей среды, так что наши дети будут жить в совершенно других условиях. Возможно это так, но даже это утверждение кажется ничем не подкреплённым. Причём интересно, что последствия того, что "дети будут жить в других условиях" мы можем наблюдать непосредственно - но в совершенно другом контексте. Наше общество меняется стремительными темпами: интернет появился только 30 лет назад, мобильные телефоны - 20 лет назад, социалньые сети - 10 лет назад. Это всё уже изменило нашу жизнь на несколько порядков, которые несравнимы с "изменениями климата". Современные школьники уже умнее нас и будут жить в мире, где общественное сознание меняется каждые два года, а не каждые два поколения. И мы, и наши дети столкнутся с необходимостью подстраивать себя, свои ценности, свои профессии под новые вызовы общества. Вот где настоящая необратимось, а не в каком-то абстрактном climate change.

Периодически среди этих разговоров возникает характерный вопрос: "верите ли вы в climate change?". Ну как можно в это верить или не верить? Если это вопрос веры, то это ведь чистая религия. Зачем тогда нам надо что-то делать по этому поводу? Или это такая секта, типа Аум Синрикё: уверуйте, отдайте нам свои деньги, и самоубейтесь?

This entry was originally posted at https://glav.dreamwidth.org/662620.html. Please comment there using OpenID.