?

Log in

No account? Create an account
dump -0f - /dev/mind
Я знаю Haskell, OCaml, GSM, эндофункторы и много других страшных слов
Еще раз про запись всех разговоров 
18th-May-2012 08:25 pm
В комментариях к соседней записи опять стала муссироваться тема записи всех звонков без разбора, и мне захотелось сделать короткое резюме.

Для начала текущее положение вещей

Все известные мне законы (я в курсе про Россию-Украину, Евросоюз, UK, страны Балтии) обязывают операторов делать ровно две вещи:

* Хранить (много лет) и предоставлять метаданные о разговорах (кто кому когда звонил)
* По решению суда/прокуратуры записывать разговоры конкретного абонента или предоставлять техническую возможность вести такую запись с момента поступления к ним такого предписания. Список тех, кого слушают, "не резиновый" - нельзя взять и, грубо говоря, запихнуть туда все номера всех абонентов.

Записи разговоров и тексты СМС операторы сохранять не обязаны.

А если все же обяжут?

Если вдруг эти требования ужесточатся, оператору будет:
(1) Достаточно легко начать хранить тексты СМС. Так как SMS-центров мало, они расположены централизовано, SMS мелкий - возможно даже меньше, чем объем метаданных о том, кто кому и как его послал)
(2) Не очень легко начать хранить записи всех разговоров. Так как объемы солидные, коммутаторов много, они могут быть территориально разнесены, потребуется их апгрейд, плюс возможно понадобится пост-процессинг - в процессе разговоров звонки могут "кочевать" по узлам сети, и каждый отдельно взятый коммутатор может "слышать" только часть разговора. Плюс, если вдуматься, у оператора существующая базовая сеть рассчитана на определенную нагрузку. Если начать, грубо говоря, передавать тот же объем данных дважды (пусть и без жестких realtime-требований), то потребуется либо доп. каналы связи (чтобы сразу передавать куда-то в центр и там обрабатывать), либо процессорные мощности и каналы связи (жмем в mp3, а уже потом передаем), или какие-то другие инженерные решения. Естественно, это все решаемые проблемы. Все, что я хочу сказать - задача не сводится к "поставили винт побольше, и всего делов", как это многим кажется на первый взгляд.

А вдруг оператор сам ...?

А вдруг оператор сам хранит эти данные для каких-то своих нужд, и это делается для всех абонентов без разбора?

(3) Это справедливо в отношении метаданных - по ним производится биллинг, то есть определяется объем потребленных услуг и выставляются счета.
(4) Это может быть справедливо для СМС: они могут попадать в какие-то логи на SMS-центре, быть частью бэкапов, и т.п.
* Хранить записи всех разговоров оператору никакой необходимости нет
(5) При этом я вполне допускаю, что в процессе разбирательств с какой-то проблемой оператор вполне может выборочно сохранять как СМС-ы, так и звонки - но, скорее всего, критерием выборки будет не "для вот этих абонентов", а "для вот этого оборудования".

А вдруг все-таки оператор это делает?

Пофантазируем. Может ли все-таки получится, что оператор сохраняет все записи всех звонков? Может, он из этого извлекает какую-то выгоду? Честно говоря, как я ни старался, я не смог придумать подходящего сценария кроме "группа сотрудников вступила в сговор и продает данные криминальным элементам".

Ок, насколько это реально? Проблема в том, что сначала надо эти звонки где-то сохранять. Сделать это "на вот этом сервере вот тут в закутке" - не выйдет, не те объемы (если сохранять всё). Купить для этого отдельно железо - не выйдет, по понятным причинам. Да и потом, технически проще "торговать налево" чем-то, что имеет альтернативное легитимное применение - помогать спаммерам рассылать SMS, занижать суммы счетов, торговать распечатками метаданных или кодами пополнений баланса. И то, для этого, по моим прикидкам, потребуется соучастие не двух, и не пяти и даже не десяти человек в самых разных подразделениях, и подобная затея имеет очень большие шансы на провал даже при том, что можно попытаться сделать хорошую мину при плохой игре ("да мы тут просто ... это ... тестируем ...."). А большой склад записей звонков - это чистый криминал, никаких альтернативных объяснений ему быть не может, и любой безопасник с радостью съест всех замешанных без соли и перца.

А вот моего друга кума говорила, что ей показывали распечатки или записи звонков за 2006 год ...

У меня есть два гораздо более простых (по сравнению с "оператор пишет все") объяснения этому факту. Куму прослушивали в рамках оперативных мероприятий (см. выше), или же ее собеседника прослушивали точно таким же образом.

Для удобства восприятия информация сведена в табличку

Метаданные о звонке (кто, кому, когда, как долго, в какой соте, ...)Тексты СМСЗапись разговоров
Обязывает ли закон операторов хранить и предоставлять эти данные для всех абонентов?ДаНетНет
Если оператора обяжут, легко ли ему будет хранить эти данные в полном объеме?--Да(1)Нет(2)
Обязывает ли закон осуществлять выборочную запись этих данных (по предписанию прокуратуры, ...)--ДаДа
Хранит ли оператор такие данные для всех абонентов независимо от требований закона?Да(3)Возможно(4)Нет
Хранит ли оператор такие данные выборочно?--Возможно(5)Возможно(5)



Comments 
(Deleted comment)
18th-May-2012 08:24 pm (UTC)
Я ни разу не специалист, но разве не проще тупо спамить нетаргетировано? :)
18th-May-2012 08:40 pm (UTC)
SMS разве не сохраняются по умолчанию вместе с метаданными?
18th-May-2012 09:33 pm (UTC)
Нет, вовсе нет.
18th-May-2012 09:37 pm (UTC)
AMR-WB 12.65 kbps- 5.5 мбайт в час.

20м абонентов по полчаса в сутки = 60 тб/сутки.

Учитывая, что реалтайм не нужен, и особые требования к надежности - тоже, можно хранить на каждой соте или каком-то роутинг-узле rolling log, скажем, на 5-10 тб обьемом, длительностью суммарно по всем таким узлам выйдет где-то от нескольких суток до месяца.

Стоимость, по сравнению с остальными узлами - минимальна - можно даже эти данные никуда не передавать, пока люди в погонах или кто-то еще не попросят ("записи за вчерашний день"), а для них - гонять запрос параллельно на всех узлах.

Так что, по-моему, вполне реально. Но в нынешних реалиях намного проще и беспалевнее троянить смартфоны, чем отдельные товарищи (вроде CarrierIQ) успешно и занимаются.
18th-May-2012 09:43 pm (UTC)
А мотивация-то в чем? Кто внутри оператора инициирует такой проект, почему его не пошлет его начальник, и какой от этого будет профит? Как этот проект CEO будет представлять совету директоров или другим каким инвесторам?
(Deleted comment)
(Deleted comment)
19th-May-2012 01:40 am (UTC)
"gsm в amr-wb перегнать налету не сильно-то большие процессорные мощности нужны. "
а если на новый год? :)
19th-May-2012 01:31 am (UTC)
вот честно, 3.5 года занималась непосредственным обслуживанием ммс&sms&ussd платформ и сопутствующих сервисов. Вот так просто, взять и начать писать смс, это первое - куда их писать, второе - надо заказывать вендору новые фичи смсц, с тем, что бы он начал писать эти самые смс, нужно что бы вендор это написал, внедрил, и оно прошло тесты и ушло в продакшн, а еще надо прикрыть чем-то попу на новый год, когда нагрузка в течении 5 минут взлетает в 10 и более раз. И это очень не малые деньги, время и силы нескольких десятков специалистов на разных уровнях. Операторы, так просто, при текущей ситуации вкладывать бабло(крупное) не будут. Оно им не надо. Единственный вариант - лобби со стороны вендоров(но по той же украине, насколько я понимаю, их как минимум два у Life один, у mts&ks другой), и этим вендорам заниматься такой фигней так же я думаю не очень надо...
мне все еще интересно, ради кого были придумки с белыми списками IMEI , которые, так и не вошли в продакшн на украине, но при этом операторы насколько я понимаю, выложили по несколько миллионов вечнозеленых енотов.
19th-May-2012 03:09 am (UTC)
Классики называли это экспроприацией экспроприаторов :)
Обычно используется один из следующих способов:
1. Что-нибудь коммерчески провальное судорожно "перепиливается" в "общественно-полезное" (например - "чтобы мобильники меньше воровали") и законодательно навязывается под одобрительные крики благодарного населения.
2. Можно пропустить стадию "перепиливания", просто обязать делать что-нибудь заведомо неисполнимое, мотивируя например "защитой прав потребителей" и "штрафовать" за злостное неисполнение.
19th-May-2012 05:58 am (UTC)
А как же запись разговора по ключевым словам? Вы же не скажете, что это городская легенда? Подвыпитый телефонист как-то мне рассказывал о "секретной" комнате ещё аналогового узла связи, набитого магнитофонами от пола до потолка. Правда, там речь шла о ведомственной АТС НПО "Вектор".
19th-May-2012 09:37 am (UTC)
Думаю, что самым правильным ответом будет такой: вы у себя дома, на современном оборудовании (гигагерцы тактовой частоты, гигабайты оперативной памяти, терабайты дискового пространства) попробуйте сделать такую систему, а потом подумайте - могли ли такое сделать N лет тому на "магнитофонах". И нам заодно всем расскажите, насколько это просто сделать. Делов-то - распознавать голос, выделять ключевые слова и всё это для сотен (а то и тысяч) одновременных разговоров.
И не надо думать, что у операторов стоят волшебные компьютеры, которые считают в 100 раз быстрее и правильнее ))) Мало кто из производителей рискует и ставит самые новые и мощные сервера. Обычно ставится то, что уже проверено и обкатано. А потом же оно ещё и стоит годами. Так что ваш ноутбук/компьютер вполне сгодится для "секретной" системы - будем ждать от вас подробностей и деталей как дома замутить такую же.
19th-May-2012 01:19 pm (UTC)
Никаких больших проблем писать каналы между станциями нет.
Мы пишем входящий в контору e1 (30 линий) (у нас работа с финансовыми данными клиентов в т.ч. по телефону, так что мы должны иметь архив).
Висит коробочка в разрыв канала и от нее езернетом/usb скидывает на старую машину уровня пентиум3. Когда набивается 4 гига оно само режет на болванку. Болванки приходится ставить не чаще раза в месяц.
Т.е. технически писать потоки от базовых станций (а они так или иначе всеравно связаны, или прямо каналом или релейкой) больших затрат проца/ диска не требует.
19th-May-2012 03:01 pm (UTC)
это всё так просто только пока у вас короткие разговоры, и иx мало (как потоков так и активныx транков в ниx)
а потом - начинается ад
19th-May-2012 01:33 pm (UTC)
Вполне себе возможно писать абсолютно все разговоры и хранить сколь угодно долго. Битрейт GSM кодека 13 Кбит/с или 780 Кбит/мин. Поделим на 8, 97,5 Кбайт/с. То есть, в 1 Tb можно хранить чуть более, чем 10 млн минут разговора. Возьмем 10 минут разговора в день на человека, тогда одного терабайта хватит для обслуживания миллиона абонентов, 365 терабайт в год. Современные SAN системы могут вмещать петабайт в стойке 48U. То есть, одной такой стойки хватит почти на три года обслуживания миллиона абонентов. Давайте обеспечим надежность, вместо одной стойки использовать три и рейд массив, где фактическая емкость уменьшается в 4 раза. Уже 12 стоек + пара-тройка шкафов с коммутационным оборудованием и батареями резервного питания.
Дорого?
Вряд ли это даже 1% от стоимости 10^10 минут разговора.
19th-May-2012 06:28 pm (UTC)
То есть базовая еще должна это отдавать на хранилище. Фактически вкладываем в развитие сети двойнную сумму.
Хотя, даже без решения проблемы передать это в хранилище, только 12 стоек вам обойдутся в миллионы при внедрении и сотни тысяч в эксплуатации. И это не считая модификации софта.
PS. хотя про батареи резервного питания для такой системы - было немного смешно.
21st-May-2012 06:01 pm (UTC)
народ как-то сконцентрировался на задаче хранения. Тут, конечно, уместно вспомнить, что емкости и скорости винтов, которыми здесь хвастались, появились совсем недавно, по сравнению с сетями связи.
Но это полдела.
Эти объемы надо еще вынуть из сети. В случае чистого GSM или там CDMA с TDM коммутацией это тупо увеличение коммутационного поля в полтора раза. И еще MPTY девайсов. А так-то они только для конференций и сорма, то есть их мало. А надо будет более чем дохрена. Ну и интерфейсов Е1/STM тоже. И плюс железка, в которую входит N STM-1, а внутри эти винты или там выход гигабитный к железке с винтами. Ну да, это называется медиашлюз, внезапно.
А если у нас уже современная архитектура (NGN) с медиашлюзами, так все равно потребуется вышеперечисленное. И MPTY там тоже недешевые, это ресурсы DSP - самое дорогое, что есть в шлюзе.
А если тупо зеркалировать порты на LAN свиче, то да, мы получим весь трафик. Но с одним таким нюансом :) Это же и довод, почему снимать надо с ядра, а не с БС.
This page was loaded Nov 12th 2019, 10:44 am GMT.