?

Log in

No account? Create an account

Previous Entry | Next Entry

Друзья мои, я тут на днях поныла и мне было очень тепло и приятно, что вы меня поддержали и дали поплакаться себе в жилетку. Спасибо вам за это!

Чтобы вы не думали, что я нынче только ною, расскажу вам какой я себе в этом году новый бизнес завела. Старый мой бизнес (аналитический софт распределяющий всякие коммерческие вложения фармам) разросся, занял большую часть маркета, и мне порядком надоел. Тут как раз у меня подросли талантливые мальчики, и я с большой радостью спихнула этот уже довольно обустроенный и по рельсам катящийся бизнес на них.

А сама пошла вспахивать новую целину. Чтобы жизнь медом не казалась было интереснее, поменяла всё – индустрию, типы данных, типы аналитики, типы систем. Пошла рассказывать мед-девайсовым компаниям как им надо обустраивать всякую коммерческую аналитику с помощью их же девайсовых данных, а так же разных прочих существующих на рынке данных – демографических, медицинских, погодных и всяких разных прочих.

А девайсовые данные, надо вам сказать, ужасно интересные. В них практически всегда можно найти что-нибудь совершенно неожиданное (и зачастую коммерчески полезное).

Если вы не представляете себе, что такое девайсовые данные, то это что-то вот такое, только не от фитбита, а от пейсмейкеров всяких, глюкозных мониторов и прочей медицинской техники, как имплантированной в пациента, так и стоящей где-нибудь в больнице в виде большого блестящего аппарата.

Работы тут непочатый край, все хотят что-то такое в своих данных найти, но это довольно нетривиально, потому что данные большие и иногда быстро-текущие (streaming). Чтобы реально узнать не только текущие измерения, но и что они означают в более широком контексте здоровья и образа жизни этих людей их надо сливать вместе с их медицинскими и прочими здоровье-аппликушными данными, и аналитика эта тоже довольно нетривиальная, потому что данные грязные, пористые и неполные, и сливать их можно только после предварительной деидентификации.

Но, как мы понимаем, где много проблем – там много денег, так что для нас, консультантов, все эти проблемы манна небесная, их решать не перерешать. Так что бизнес занялся, как лесной пожар, теперь только надо успевать новых людей находить-обучать-подтаскивать к клиентам. Сама я тоже мотаюсь по стране как пинг-понговый шарик, главное - успевать подхватывать то, что падает на голову.

В общем не было у бабы забот, купила баба порося. Теперь только надо все это вынести, вытащить, и не помереть в процессе.

Comments

( 29 comments — Leave a comment )
abcentia
Aug. 31st, 2018 03:45 pm (UTC)
Ссылка на девайсовые данные, похоже, сломалась.
_mak_
Aug. 31st, 2018 03:53 pm (UTC)
Починила вроде. Так лучше?
abcentia
Aug. 31st, 2018 04:17 pm (UTC)
Спасибо.
typed_by_mur4a
Aug. 31st, 2018 04:19 pm (UTC)
Я сейчас играюсь с браслетом, поставляющим всякое, как я понимаю, Цюри Шпиталю. Они мне за это графички рисуют и исследуют здоровье, а так хочется посмотреть, что у них там и какие пейперс они пишут.
Успехов, IoT наш друг и товарищ!
_mak_
Aug. 31st, 2018 06:58 pm (UTC)
А что этот браслет меряет?

Если они не дураки, то они сначала придумывают всякие геймификации для вас, чтобы вы больше с браслетиком играли.

А потом придумывают как бы доказать что у вас от этой игры что-то действительно в здоровье улучшилось. Тогда они потом маркетинг разведут "кто играет с нашими браслетиками, тот упражняется на 2 с половиной минуты в день дольше!"

А потом прикладывают эти данные ко всяким другим (например к вашим медицинским учетным записям и прочим данным от вашего выхлопа) и пытаются доказать что у этого есть еще и долгоиграющие хорошие для вас последствия.
typed_by_mur4a
Aug. 31st, 2018 07:09 pm (UTC)
Придумали, да. Про девичье здоровье и мы вам скажем, когда нужно делать детей, чтобы сделать наверняка. Или не сделать. Меряют resting pulse rate, skin temperature, breathing rate, sleep HVR ratio. Еще можно всякое логать им вокруг этого самого здоровья.
В интересные времена мы живем.
_mak_
Aug. 31st, 2018 07:19 pm (UTC)
Про интересные времена - это точно.
Скоро чихнуть невозможно будет, чтобы Гугель с Аппелем и прочие всякие тут же не переполошились и не начали всякие статистики подсчитывать.
abcentia
Aug. 31st, 2018 04:35 pm (UTC)
Если не секрет, порог входа в эту область высокий?
Сложная математика или софт?
_mak_
Aug. 31st, 2018 07:03 pm (UTC)
Смотря куда конкретно входить.

Если просто советы людям давать - что искать, какими данными пользоваться - то никакого порога. Лишь бы нашлись люди, которые хотят вас слушать и за советы платить.

Но если хочется им потом помочь и собственно аналитикой, то тогда нужны разные компетенции. Дата сайенс люди, умеющие рыться в данных. Big data люди, умеющие строить всякие технические места где эти данные можно процессать. Если хочется прямо медицинские данные грузить и анализировать, то нужны еще сертифицированные HIPAA compliant environments, в которых можно держать сенситивные персональные данные. Это уже более серьезные и дорогие компетенции, их надо строить некоторое время, искать правильных людей, инвестировать.
girit
Aug. 31st, 2018 06:15 pm (UTC)
а какого рода скилзы требуются в этой области?
_mak_
Aug. 31st, 2018 07:17 pm (UTC)
Область широкая, скиллзы разные. Знание медицинских данных, data science, big data, HIPAA legal and compliance frameworks, понимание какие в принципе use cases бывают и как именно их искать. Ну ты ж понимаешь.
girit
Aug. 31st, 2018 07:26 pm (UTC)
спасибо - в большинстве мест нет понятной дефиниции роли на use cases.
я никак не могу понять, это product management function или что?
и те кто да хотят use cases (что как раз и есть моя специальность) - они часто просят технические скилзы. или у нас выходит непонимание, я не знаю.
_mak_
Aug. 31st, 2018 07:30 pm (UTC)
Я не знаю как это называется официально. Можно и продукт менедментом назвать. Я думаю вся эта область еще довольно молода, и народ называет что хочет и как хочет, еще нет устаканенной классификации скиллов.
nat_sd
Aug. 31st, 2018 09:04 pm (UTC)
Я близко к этой области работаю (хотя я никаким образом не data science). Одно из подразделений нашей компании это devices, и довольно вплотную занимаются тем чтобы вся эта дата никуда не уплывала, а анализировалась на благо бизнеса.
Мы же (pharmra division) больше направлены на то что убыстрить темп развития, и использовать все что плохо лежит (дигитал, EHR, imaging). Но как вы правильно заметили, все это очень не тривиально. В добавок к тому что все надо обработать, слить, убрать грязь, люди должны понимать как это все можно использовать. Мы несколько лет потратили на то что каждодневно пытались пропихнуть людям которые признают только традиционные исследования как можно что то улучшить. И только делая крупицы снизу, и постоянное капание сверху привело к тому что мы более менее приняты к сердцу. Но все это ежедневная борьба. С другой стороны-интересно.
_mak_
Aug. 31st, 2018 09:20 pm (UTC)
В фармах вообще раздолье с этим. Одна оптимизация клинических испытаний может миллионы сохранить если с умом подходить к аналитике. Фармы должны научиться в таблетки что-нибудь вставлять, чтобы передавало на mother ship когда съел, когда переварил, когда вышло и все побочные измерения. Вот тогда будет им щастье :)
i_shmael
Aug. 31st, 2018 09:36 pm (UTC)
Какая ты молодец!
_mak_
Aug. 31st, 2018 09:42 pm (UTC)
Спасибо :)
starshoi
Aug. 31st, 2018 09:57 pm (UTC)
Так. И кто тут у нас ныл давеча?

Как прирожденный модельер, даю непрошеный совет - начни с таксономии и модели данных. А то все тут занимаются механизмами, мышиным обучением и прочими искусственными интеллекатами, а без модели гарбидж ин гарбидж аут. То есть, если тебя интересуют механизмы, это тоже здорово, но мне кажется разумная аналитика должна начинаться с моделей.
_mak_
Aug. 31st, 2018 10:03 pm (UTC)
Твой совет всегда полезен, и я готова начать с моделей, и объявить себя первой моделью (а что ростом и рожей не вышла - не судите, да не судимы будете).

Но данные у нас пока очень разные, мы еще не знаем хотим ли мы их классифицировать. Потому что всякие большие слоны в лавке все пытаются стандартизировать и классифицировать, а нам сам бог велел крутиться между ними, и хватать все что в ихние классификации и шаблоны не лезет (то есть пока все что есть). Они там постепенно Годзилла с Терминатором что-нибудь устаканят, и хрен с ними. На нашу долю всегда останется неклассифицированного.
starshoi
Aug. 31st, 2018 10:10 pm (UTC)
Ну, я человек старой школы. В любом большом наборе неструктурированных данных всегда можно найти какие-то интересные места. Вопрос, что ты потом с этим будешь делать. Поэтому полезнее было бы заранее задаться этим, поиграть с данными вручную и построить модель, отражающую основные свойства задачи (ну, например, искать аномалии, связанные с географией, демографией и давлением, это я так, от фонаря). При готовой модели обработка будет идти гораздо быстрее и ты заранее будешь знать, что ты можешь получить ответы на нужные тебе вопросы. Ну как-то так.

А с неклассифицированными - все равно ведь у тебя какая-то классификация в голове есть. Вот ее и приложи. Лет 12 назад я пытался построить анализ неструктурированных данных на персональных компьютерах, чтоб можно было лучше всякий мусор удалять. Даже почти продал, но мы тут начали эту свою бодягу и оно никуда не пошло. Но начал как раз с таксономии мусора. Увлекательное это дело, в дерьме копаться.

_mak_
Aug. 31st, 2018 10:26 pm (UTC)
Ты знаешь, я пока соверешенное блондинко, но у меня есть умные люди, и они говорят что нынче это все фигня. Что машина нынче сама все ищет и классифицирует (AI всякий и ML по совсместительству). И это не те данные на которые можно руками смотреть. Их во-первых очень много, а во-вторых они ХИПА-комлпаянт. Там все очень интересно, нетривиально и такое находится, что никому бы в голову не пришло даже смотреть в ту сторону. Я тебе как-нибудь за рюмкой кофе расскажу. Вобщем я тащусь с этого как от пачки дуста.

12 лет назад все было очень грустно, компьютерных мощностей было мало, приходилось своей головой все время думать. А теперь у нас машина железная - пущай думает :)
starshoi
Aug. 31st, 2018 10:30 pm (UTC)
Вот-вот, они все так говорят., нашли новую игрушку, которой сто лет в обед будет, радуются, что компьютеры быстрее стали. Неправдычка это все, но я убеждать не буду, под это сейчас много денег дом в Чикаго, много женщин и машин дают. Грустно было 50 лет назад, когда это все придумали. Но нового там ничего нет.

Ладно, подождем до рюмки.
_mak_
Aug. 31st, 2018 10:37 pm (UTC)
Новое, старое - какая разница?
Много машин, женщин и дом в Чикаго дают? И ладушки.
amigofriend
Aug. 31st, 2018 11:05 pm (UTC)
Крутецкис!!

Скажи, а почему бы тебе sooner rather then later не начать искать человека который будет с тобой мотаться по стране как пинг-понговый шарик, а через несколько месяцев станет это делать без тебя (имея конечно твой ground support из головного офиса)? Это к вопросу чтоб не выматываться в совсем...
_mak_
Aug. 31st, 2018 11:08 pm (UTC)
Это мысль правильная и хорошая. Как только я его найду и как только он сможет тоже мотаться, то мы сразу сможем покрыть вдвое больше клиентов и бизнес у нас разрастется еще быстрее :)

А все потому что таблетки от жадности наша фарма еще не изобрела, и меддевайсы наши с губозакаталкой тоже не спешат. Вот и приходится тем временем пытаться заработать все что плохо лежит.
amigofriend
Aug. 31st, 2018 11:11 pm (UTC)
Ну будет у вас два тоннеля.

Значит надо сразу искать двух человек!!
_mak_
Aug. 31st, 2018 11:13 pm (UTC)
И не говори. Надо, ой надо!
magicmirror
Sep. 2nd, 2018 01:34 am (UTC)
Вы молодец!
_mak_
Sep. 2nd, 2018 02:10 am (UTC)
Спасибо :)
( 29 comments — Leave a comment )