имя, прозвище, кличка или что-то в этом роде. (_glav_) wrote,
имя, прозвище, кличка или что-то в этом роде.
_glav_

Categories:

научный метод vs machine learning

Задумался о том, что представляют собой условные "алгоритмы фейсбука": по каким критериям условный фейсбук предлагает мне не только рекламу, но и "Suggested for You" посты.

Вряд ли он строит поведенческую модель меня, в том смысле в каком слово "модель" понимается в той же физике: человек описывается некоторым "теоретическим" уравнением, которое в общем случае нерешается, но по реакции некоторого конкретного человека на различные внешние раздражители такое уравнение можно "упростить" и получить приближённые значения "коэффициентов поведения" для этого конкретного человека. Это как-бы невозможно: начиная с того, что само "уравнение человека", в отличие от "уравнения атома", неизвестно, и заканчивая тем, что даже если бы оно было известно, решение подобного уравнения требовало бы недостижимое количество ресурсов.

Я так понимаю, подход условного machine learning противоположный: нам не важно ни общее "уравнение человека", ни поведение конкретно взятого человека. Скорее, мы смотрим на поведение "группы людей", и строим "статистическую модель" их коллективного поведния, - которая принципиально отличается от "физической модели". Такая "статистическая модель" представляет собой "эмпирический" набор регрессий, зачастую просто линейных - куда там до закона обратных квадратов в законе Кулона или кубов в законах Кеплера. А дальше люди "классифицируются" по разным параметрам регрессий, и модельное "поведение человека" определяется тем, в какую "группу" он попал. Такая классификация, наверняка, динамическая, так что модель постоянно "обучается", уточняя значения параметров и категорий.

Я не к тому, что такой "статистический" подход чем-то хуже чем "физический" (очевидно, он работает, и приносит ощутимый доход своим создателям, - значит всяко "лучше"). Но он представляет собой совершенно иной тип мышления, совершенно иной способ решния актуальных задач. "Физический" метод подразумевает по крайней мере два важных принципа: редукционизм и причинно-следственные связи. Любое яввление, каким бы сложным оно ни было, можно "редуцировать" до конкретной комбинации более простых, выявив при этом причину и следствие. "Статистический" метод этого в приниципе не позволяет: он предполагает что явление является некоторым "чёрным ящиком", который в приницпе не позволяет докопаться до "элементарых" явлений. Да, внутри этого чёрного ящика по-прежнему сидит некоторая "модель", которая предполагает некоторую связь наблюдаемых переменных с помощью каких-то параметров, которых может быть "очень много". И в этом смысле это даже похоже на "ряд Тейлора", в котором неизвестная функция приближается многочленом. Но за таким "полиномиальным приближением" в этих двух случаях стоят соверешнно разные парадигмы как мышления, так и нашего представления о функционировании природы.

В своё время "физический" метод, называемый традиционно "научным методом", оказал огромное влияние на культуру и развитие общества. "Статистический" метод, кажется, ещё не идентифицируется широко как "научный метод", - вероятно, потому что используется, в основном, в коммерческих продуктах и считается максимум чем-то "инженерным". Но он всё больше проникает в университеты, тем самым "завоёвывая" статус "научного". Опять-таки, я не к тому, что "это что-то плохое", а к тому, что это может оказать существенное влияние на общество и культуру, подобное тому, какое в своё время оказал "физический метод". Может быть рост популярности "identity politics" - это следствие такой "статистической" классификации людей?

This entry was originally posted at https://glav.dreamwidth.org/713606.html. Please comment there using OpenID.
Tags: philosophy, science
Subscribe

  • lifestyle

    Обратил внимание на некоторую фундаментальную inconsistency в современном медицинском подходе к лечению болезней. С одной стороны, насколько я…

  • Палец и воля

    Когда я листаю пальцем ленту фейсбучека на телефоне, в какой-то момент мне это надоедает, и я нажимаю на кнопку "назад", что переводит ленту в…

  • Есть статистика, - а есть журналисты

    Вот отличный пример [Исследователи] тестируют случайным образом выбранные 100 инфекций в невакцинированных людях и видят там 10 инфекций вариантом…

Comments for this post were disabled by the author