Karachee (karachee) wrote,
Karachee
karachee

Categories:

о манипуляции данными

Товарищ Будда в свое время определил причиной страдания человека – непонимание собственной природы. Причинами страдания хуйней современного пользователя социальных сетей я смело определяю 1) непонимание природы социума 2)непонимание природы сетей.

Эпиграф. Но «думать за назначенными пределами» - это сегодня такой же люкс, как читать дальше заголовков (с) Мараховский

Философское 1. Вы всегда думаете в каких-то назначенных пределах. У вас нет никакого способа видеть ВСЮ реальную картину вещей. Она просто не поместится целиком в голову. Но у вас есть способ назначать эти пределы самому и в любой момент выйти из одних назначенных пределов в другие… назначенные пределы. Не впадая или впадая в омрачение: «Вот теперь я увидел реальную картину вещей такой, как она есть на самом деле».

Философское 2. Вы всегда думаете в каких-то назначенных пределах. У вас нет никакого способа видеть ВСЮ картину. Но есть способ видеть её АДЕКВАТНО и даже ЭФФЕКТИВНО, то есть ПРОГНОЗИРОВАТЬ происходящее. При этом нет никакого способа прогнозировать поведение ВСЕЙ реальности. Но вы можете спрогнозировать те грядущие реальные ситуации, которые связаны с вашей жизненной траекторией, которые помогают или мешают достижению ваших ЦЕЛЕЙ.

Философское 3 злобное Тот, кто не знает собственные ЦЕЛИ – /будет реализовывать чужие/ не имеет НИКАКОГО способа видеть картину реальности адекватной и эффективной. Если два человека имеют разные цели – рано или поздно коммуникация между ними непременно придет к точке, в которой их реальности окажутся различными, будут требовать различных выводов и поступков. Если внимательно изучив свои цели, обнаруживаешь, что они сводятся к «меньшими усилиями и страданиями взять от жизни больше свобод и удовольствий» - учи мантру: «Нефиг думать в масштабах вселенной, если /цели/ мозги куриные».

К делу. Все совпадения случайны, все цифры выдуманные.

Задача 0. С января по август умерло 71748 человек. 21358 из них умерло от ковида. Найти сколько человек умерло с января по август от борьбы с ковидом.

В этой задаче все правильно и логично. Всё правильно и логично ВНУТРИ задачи. Однако сама задача составлена в результате направленной манипуляции данными. В частности из всех официальных причин смерти, от которых умерли 71748 человек, отброшенными оказались все, кроме двух. То есть граничным условием задачи является постулат о том, что все умершие умерли либо от причины № 1 «Ковид» – официальная причина, либо причины № 2 «Борьба с ковидом» – гипотетическая причина. Тот же алгоритм позволяет составить набор из бесконечного числа задач, выбирая произвольно любые две другие причины смерти.

Задача 1. С января по август умерло 71748 человек. 1300 из них покончили жизнь самоубийством. Найти сколько человек умерло с января по август от катастроф на железнодорожном транспорте.

Задача 2. С января по август умерло 71748 человек. 9700 из них погибли в автокатастрофах. Найти сколько человек умерло с января по август в результате злоупотребления наркотическими средствами.

Задача 3. С января по август умерло 71748 человек. 28 из них отравились грибами. Найти сколько человек умерло с января по август в результате бесчеловечных опытов рептилоидов.


Соглашусь, что в первой задаче есть некоторая дополнительная внутренняя логика, но с точки зрения правильного, адекватного, строгого, эффективного, научного обращения с данными, она звучит ничуть не менее абсурдно, чем три другие.

Чтобы сориентироваться в поиске выхода из этого театра абсурда, попробуем понять, что по уровню доступности и распространенности есть три вида данных. Данные статистические, данные обработанные, данные афишируемые. Данные статистические о 71748 умерших, разделяются по непосредственным причинам смерти на несколько сотен групп. Данные обработанные в рамках ЦЕЛИ борьбы с ковидом дадут нам более общие группы а) умерших от ковида со 100% достоверностью. б) умерших скорее всего от ковида, но не 100% в) умерших не от самого ковида, а от осложнений другой болезни, которые вызвал ковид г) умерших от осложнений другой болезни, которые могли быть вызваны ковидом, но 100% уверенности в этом нет д) умерших точно от болезни, с ковидом не связанных. Сумма по этим группам (без д) составит примерно ¾ от 71748. Данные афишируемые и переданные в ВОЗ это группа а) и только а), она составляет число 21358. Естественно афишируемые данные – есть данные, которые покажут СМИ и отразят таблоиды, это тоже манипуляция в рамках целей, преследуемых телевидением и государством.

Примером более интересной, профессиональной и глобальной манипуляции является применение Big Data. Если у вас есть мистер Икс, который пару десятков раз летал на самолете, то вы можете получить данные о порядка 3-5 тыс. человек, которые летали с ним в одном салоне. И порядка ещё 50-100 тыс. человек, которые прилетели на других рейсах в то же время и то же место. Если порыться в этом наборе, то там наверняка окажутся клоуны, другие работники цирков, лица закончившие некогда цирковое училище, а также близкие знакомые директора главного цирка страны. Ещё там будет множество людей, которые имеют дома бейсбольные биты, посещают регулярно бейсбол, приценивались к битам в магазине, умеют работать по дереву и могут, следовательно, изготовить биту сами. Проведя перекрестное сравнение этих множеств, вы сможете (в силу чисто статистических вероятностей )выделить группу из 7-15 лиц, которые попали во все выборки разом и потенциально знакомы, даже порой звонят одним и тем же людям. Что позволит выдвинуть убедительную версию о «Заговоре Клоунов», целью которого является слежка, а затем ликвидация мистера Икс при помощи забития его бейсбольными битами.

Причем если клоунов окажется вдруг не 7-15, а 20-40, то можно усугубить расследование, разделив его на «Заговор Клоунов-десантников» (7 человек) и «заговор Клоунов-католиков» (9 человек) с тем чтобы расследовать дальше тот, который в рамках ваших политических целей выглядит более перспективным. Точно таким же образом, обрабатывая выборку за выборкой можно найти заговоры «Манекенщиц-провинциалок», «Рыболовов-олигархов», «Стюардесс-разведенок» и т.д. Причем вероятность существования любого из них ДЕЙСТВИТЕЛЬНО будет в 51 000 000 раз больше, чем заговора «Евреев-оленеводов» или «Уборщиц-яхтсменок». Статистическая достоверность это вам не шутки.

Однако, если вы имеете дело только с теми данными, которые были тут афишированы. Т.е. не имеете понятия, сколько с мистером Икс летало по три-пять раз аквалангистов, строителей, антикваров и пр.. то версия злобных клоунов с битами покажется вам исключительно логичной, непротиворечивой и обладающей всей совокупностью доказательств. Опять же Полоний.

Однажды в одном из аэропортов, одной из далеких стран вас задержат, откажут во въезде, а то и арестуют. Потому что ваша фамилия окажется как-то связана с терроризмом, ваши счета и транзакции будут похожи на счета и транзакции террориста средней руки, ваши путешествия окажутся в направлениях, которыми то и дело летают террористы, и выглядеть вы будете так, как маскируется типичный террорист, когда хочет, чтобы его не узнали. Короче, когда вы по совокупности 2500 оцениваемых параметров окажетесь похожи на террориста на 75% сильнее, чем остальные въезжающие в страну. И на все ваши «Какого хуя? А где доказательства?» вам будут говорить «Вы сами виноваты, нефиг было ездить в Тунис, Египет, Турцию имея фамилию похожую, на ту, что распространены на западе Сирии и двух деревнях Афганистана» - вот тогда, возможно, вы припомните этот пост и ваше неведение относительно природы сетей и социума чуть рассеется.
Tags: социо
Subscribe

  • фотолюбительское

    Картинку свистнул на Пикабу. Замечательная иллюстрация разницы между модельной и не модельной внешностью. При съемке модели любой ракурс, любая…

  • (no subject)

    Написал в нескольких ветках комментариев по Дворцам/Путиным, что сумма в 100 миллиардов меня совершенно не возбуждает. Когда с одной стороны "Путин -…

  • мои комментарии

    Если человек сидит на жопе - ему неплохо объективно. На горячей сковороде сидеть не будет никто, горящая жопа не позволит. Если сидит, значит ещё не…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 83 comments

  • фотолюбительское

    Картинку свистнул на Пикабу. Замечательная иллюстрация разницы между модельной и не модельной внешностью. При съемке модели любой ракурс, любая…

  • (no subject)

    Написал в нескольких ветках комментариев по Дворцам/Путиным, что сумма в 100 миллиардов меня совершенно не возбуждает. Когда с одной стороны "Путин -…

  • мои комментарии

    Если человек сидит на жопе - ему неплохо объективно. На горячей сковороде сидеть не будет никто, горящая жопа не позволит. Если сидит, значит ещё не…