о манипуляции данными |
[Dec. 15th, 2020|06:03 pm]
Karachee
|
Товарищ Будда в свое время определил причиной страдания человека – непонимание собственной природы. Причинами страдания хуйней современного пользователя социальных сетей я смело определяю 1) непонимание природы социума 2)непонимание природы сетей.
Эпиграф. Но «думать за назначенными пределами» - это сегодня такой же люкс, как читать дальше заголовков (с) Мараховский
Философское 1. Вы всегда думаете в каких-то назначенных пределах. У вас нет никакого способа видеть ВСЮ реальную картину вещей. Она просто не поместится целиком в голову. Но у вас есть способ назначать эти пределы самому и в любой момент выйти из одних назначенных пределов в другие… назначенные пределы. Не впадая или впадая в омрачение: «Вот теперь я увидел реальную картину вещей такой, как она есть на самом деле».
Философское 2. Вы всегда думаете в каких-то назначенных пределах. У вас нет никакого способа видеть ВСЮ картину. Но есть способ видеть её АДЕКВАТНО и даже ЭФФЕКТИВНО, то есть ПРОГНОЗИРОВАТЬ происходящее. При этом нет никакого способа прогнозировать поведение ВСЕЙ реальности. Но вы можете спрогнозировать те грядущие реальные ситуации, которые связаны с вашей жизненной траекторией, которые помогают или мешают достижению ваших ЦЕЛЕЙ.
Философское 3 злобное Тот, кто не знает собственные ЦЕЛИ – /будет реализовывать чужие/ не имеет НИКАКОГО способа видеть картину реальности адекватной и эффективной. Если два человека имеют разные цели – рано или поздно коммуникация между ними непременно придет к точке, в которой их реальности окажутся различными, будут требовать различных выводов и поступков. Если внимательно изучив свои цели, обнаруживаешь, что они сводятся к «меньшими усилиями и страданиями взять от жизни больше свобод и удовольствий» - учи мантру: «Нефиг думать в масштабах вселенной, если /цели/ мозги куриные».
К делу. Все совпадения случайны, все цифры выдуманные.
Задача 0. С января по август умерло 71748 человек. 21358 из них умерло от ковида. Найти сколько человек умерло с января по август от борьбы с ковидом.
В этой задаче все правильно и логично. Всё правильно и логично ВНУТРИ задачи. Однако сама задача составлена в результате направленной манипуляции данными. В частности из всех официальных причин смерти, от которых умерли 71748 человек, отброшенными оказались все, кроме двух. То есть граничным условием задачи является постулат о том, что все умершие умерли либо от причины № 1 «Ковид» – официальная причина, либо причины № 2 «Борьба с ковидом» – гипотетическая причина. Тот же алгоритм позволяет составить набор из бесконечного числа задач, выбирая произвольно любые две другие причины смерти.
Задача 1. С января по август умерло 71748 человек. 1300 из них покончили жизнь самоубийством. Найти сколько человек умерло с января по август от катастроф на железнодорожном транспорте.
Задача 2. С января по август умерло 71748 человек. 9700 из них погибли в автокатастрофах. Найти сколько человек умерло с января по август в результате злоупотребления наркотическими средствами.
Задача 3. С января по август умерло 71748 человек. 28 из них отравились грибами. Найти сколько человек умерло с января по август в результате бесчеловечных опытов рептилоидов.
Соглашусь, что в первой задаче есть некоторая дополнительная внутренняя логика, но с точки зрения правильного, адекватного, строгого, эффективного, научного обращения с данными, она звучит ничуть не менее абсурдно, чем три другие. Чтобы сориентироваться в поиске выхода из этого театра абсурда, попробуем понять, что по уровню доступности и распространенности есть три вида данных. Данные статистические, данные обработанные, данные афишируемые. Данные статистические о 71748 умерших, разделяются по непосредственным причинам смерти на несколько сотен групп. Данные обработанные в рамках ЦЕЛИ борьбы с ковидом дадут нам более общие группы а) умерших от ковида со 100% достоверностью. б) умерших скорее всего от ковида, но не 100% в) умерших не от самого ковида, а от осложнений другой болезни, которые вызвал ковид г) умерших от осложнений другой болезни, которые могли быть вызваны ковидом, но 100% уверенности в этом нет д) умерших точно от болезни, с ковидом не связанных. Сумма по этим группам (без д) составит примерно ¾ от 71748. Данные афишируемые и переданные в ВОЗ это группа а) и только а), она составляет число 21358. Естественно афишируемые данные – есть данные, которые покажут СМИ и отразят таблоиды, это тоже манипуляция в рамках целей, преследуемых телевидением и государством.
Примером более интересной, профессиональной и глобальной манипуляции является применение Big Data. Если у вас есть мистер Икс, который пару десятков раз летал на самолете, то вы можете получить данные о порядка 3-5 тыс. человек, которые летали с ним в одном салоне. И порядка ещё 50-100 тыс. человек, которые прилетели на других рейсах в то же время и то же место. Если порыться в этом наборе, то там наверняка окажутся клоуны, другие работники цирков, лица закончившие некогда цирковое училище, а также близкие знакомые директора главного цирка страны. Ещё там будет множество людей, которые имеют дома бейсбольные биты, посещают регулярно бейсбол, приценивались к битам в магазине, умеют работать по дереву и могут, следовательно, изготовить биту сами. Проведя перекрестное сравнение этих множеств, вы сможете (в силу чисто статистических вероятностей )выделить группу из 7-15 лиц, которые попали во все выборки разом и потенциально знакомы, даже порой звонят одним и тем же людям. Что позволит выдвинуть убедительную версию о «Заговоре Клоунов», целью которого является слежка, а затем ликвидация мистера Икс при помощи забития его бейсбольными битами.
Причем если клоунов окажется вдруг не 7-15, а 20-40, то можно усугубить расследование, разделив его на «Заговор Клоунов-десантников» (7 человек) и «заговор Клоунов-католиков» (9 человек) с тем чтобы расследовать дальше тот, который в рамках ваших политических целей выглядит более перспективным. Точно таким же образом, обрабатывая выборку за выборкой можно найти заговоры «Манекенщиц-провинциалок», «Рыболовов-олигархов», «Стюардесс-разведенок» и т.д. Причем вероятность существования любого из них ДЕЙСТВИТЕЛЬНО будет в 51 000 000 раз больше, чем заговора «Евреев-оленеводов» или «Уборщиц-яхтсменок». Статистическая достоверность это вам не шутки.
Однако, если вы имеете дело только с теми данными, которые были тут афишированы. Т.е. не имеете понятия, сколько с мистером Икс летало по три-пять раз аквалангистов, строителей, антикваров и пр.. то версия злобных клоунов с битами покажется вам исключительно логичной, непротиворечивой и обладающей всей совокупностью доказательств. Опять же Полоний.
Однажды в одном из аэропортов, одной из далеких стран вас задержат, откажут во въезде, а то и арестуют. Потому что ваша фамилия окажется как-то связана с терроризмом, ваши счета и транзакции будут похожи на счета и транзакции террориста средней руки, ваши путешествия окажутся в направлениях, которыми то и дело летают террористы, и выглядеть вы будете так, как маскируется типичный террорист, когда хочет, чтобы его не узнали. Короче, когда вы по совокупности 2500 оцениваемых параметров окажетесь похожи на террориста на 75% сильнее, чем остальные въезжающие в страну. И на все ваши «Какого хуя? А где доказательства?» вам будут говорить «Вы сами виноваты, нефиг было ездить в Тунис, Египет, Турцию имея фамилию похожую, на ту, что распространены на западе Сирии и двух деревнях Афганистана» - вот тогда, возможно, вы припомните этот пост и ваше неведение относительно природы сетей и социума чуть рассеется. |
|
|