Top.Mail.Ru
? ?
Журнал Морфея и его об'ятий [entries|archive|friends|userinfo]
Karachee

[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

о манипуляции данными [Dec. 15th, 2020|06:03 pm]
Karachee
[Tags|]

Товарищ Будда в свое время определил причиной страдания человека – непонимание собственной природы. Причинами страдания хуйней современного пользователя социальных сетей я смело определяю 1) непонимание природы социума 2)непонимание природы сетей.

Эпиграф. Но «думать за назначенными пределами» - это сегодня такой же люкс, как читать дальше заголовков (с) Мараховский

Философское 1. Вы всегда думаете в каких-то назначенных пределах. У вас нет никакого способа видеть ВСЮ реальную картину вещей. Она просто не поместится целиком в голову. Но у вас есть способ назначать эти пределы самому и в любой момент выйти из одних назначенных пределов в другие… назначенные пределы. Не впадая или впадая в омрачение: «Вот теперь я увидел реальную картину вещей такой, как она есть на самом деле».

Философское 2. Вы всегда думаете в каких-то назначенных пределах. У вас нет никакого способа видеть ВСЮ картину. Но есть способ видеть её АДЕКВАТНО и даже ЭФФЕКТИВНО, то есть ПРОГНОЗИРОВАТЬ происходящее. При этом нет никакого способа прогнозировать поведение ВСЕЙ реальности. Но вы можете спрогнозировать те грядущие реальные ситуации, которые связаны с вашей жизненной траекторией, которые помогают или мешают достижению ваших ЦЕЛЕЙ.

Философское 3 злобное Тот, кто не знает собственные ЦЕЛИ – /будет реализовывать чужие/ не имеет НИКАКОГО способа видеть картину реальности адекватной и эффективной. Если два человека имеют разные цели – рано или поздно коммуникация между ними непременно придет к точке, в которой их реальности окажутся различными, будут требовать различных выводов и поступков. Если внимательно изучив свои цели, обнаруживаешь, что они сводятся к «меньшими усилиями и страданиями взять от жизни больше свобод и удовольствий» - учи мантру: «Нефиг думать в масштабах вселенной, если /цели/ мозги куриные».

К делу. Все совпадения случайны, все цифры выдуманные.

Задача 0. С января по август умерло 71748 человек. 21358 из них умерло от ковида. Найти сколько человек умерло с января по август от борьбы с ковидом.

В этой задаче все правильно и логично. Всё правильно и логично ВНУТРИ задачи. Однако сама задача составлена в результате направленной манипуляции данными. В частности из всех официальных причин смерти, от которых умерли 71748 человек, отброшенными оказались все, кроме двух. То есть граничным условием задачи является постулат о том, что все умершие умерли либо от причины № 1 «Ковид» – официальная причина, либо причины № 2 «Борьба с ковидом» – гипотетическая причина. Тот же алгоритм позволяет составить набор из бесконечного числа задач, выбирая произвольно любые две другие причины смерти.

Задача 1. С января по август умерло 71748 человек. 1300 из них покончили жизнь самоубийством. Найти сколько человек умерло с января по август от катастроф на железнодорожном транспорте.

Задача 2. С января по август умерло 71748 человек. 9700 из них погибли в автокатастрофах. Найти сколько человек умерло с января по август в результате злоупотребления наркотическими средствами.

Задача 3. С января по август умерло 71748 человек. 28 из них отравились грибами. Найти сколько человек умерло с января по август в результате бесчеловечных опытов рептилоидов.


Соглашусь, что в первой задаче есть некоторая дополнительная внутренняя логика, но с точки зрения правильного, адекватного, строгого, эффективного, научного обращения с данными, она звучит ничуть не менее абсурдно, чем три другие.

Чтобы сориентироваться в поиске выхода из этого театра абсурда, попробуем понять, что по уровню доступности и распространенности есть три вида данных. Данные статистические, данные обработанные, данные афишируемые. Данные статистические о 71748 умерших, разделяются по непосредственным причинам смерти на несколько сотен групп. Данные обработанные в рамках ЦЕЛИ борьбы с ковидом дадут нам более общие группы а) умерших от ковида со 100% достоверностью. б) умерших скорее всего от ковида, но не 100% в) умерших не от самого ковида, а от осложнений другой болезни, которые вызвал ковид г) умерших от осложнений другой болезни, которые могли быть вызваны ковидом, но 100% уверенности в этом нет д) умерших точно от болезни, с ковидом не связанных. Сумма по этим группам (без д) составит примерно ¾ от 71748. Данные афишируемые и переданные в ВОЗ это группа а) и только а), она составляет число 21358. Естественно афишируемые данные – есть данные, которые покажут СМИ и отразят таблоиды, это тоже манипуляция в рамках целей, преследуемых телевидением и государством.

Примером более интересной, профессиональной и глобальной манипуляции является применение Big Data. Если у вас есть мистер Икс, который пару десятков раз летал на самолете, то вы можете получить данные о порядка 3-5 тыс. человек, которые летали с ним в одном салоне. И порядка ещё 50-100 тыс. человек, которые прилетели на других рейсах в то же время и то же место. Если порыться в этом наборе, то там наверняка окажутся клоуны, другие работники цирков, лица закончившие некогда цирковое училище, а также близкие знакомые директора главного цирка страны. Ещё там будет множество людей, которые имеют дома бейсбольные биты, посещают регулярно бейсбол, приценивались к битам в магазине, умеют работать по дереву и могут, следовательно, изготовить биту сами. Проведя перекрестное сравнение этих множеств, вы сможете (в силу чисто статистических вероятностей )выделить группу из 7-15 лиц, которые попали во все выборки разом и потенциально знакомы, даже порой звонят одним и тем же людям. Что позволит выдвинуть убедительную версию о «Заговоре Клоунов», целью которого является слежка, а затем ликвидация мистера Икс при помощи забития его бейсбольными битами.

Причем если клоунов окажется вдруг не 7-15, а 20-40, то можно усугубить расследование, разделив его на «Заговор Клоунов-десантников» (7 человек) и «заговор Клоунов-католиков» (9 человек) с тем чтобы расследовать дальше тот, который в рамках ваших политических целей выглядит более перспективным. Точно таким же образом, обрабатывая выборку за выборкой можно найти заговоры «Манекенщиц-провинциалок», «Рыболовов-олигархов», «Стюардесс-разведенок» и т.д. Причем вероятность существования любого из них ДЕЙСТВИТЕЛЬНО будет в 51 000 000 раз больше, чем заговора «Евреев-оленеводов» или «Уборщиц-яхтсменок». Статистическая достоверность это вам не шутки.

Однако, если вы имеете дело только с теми данными, которые были тут афишированы. Т.е. не имеете понятия, сколько с мистером Икс летало по три-пять раз аквалангистов, строителей, антикваров и пр.. то версия злобных клоунов с битами покажется вам исключительно логичной, непротиворечивой и обладающей всей совокупностью доказательств. Опять же Полоний.

Однажды в одном из аэропортов, одной из далеких стран вас задержат, откажут во въезде, а то и арестуют. Потому что ваша фамилия окажется как-то связана с терроризмом, ваши счета и транзакции будут похожи на счета и транзакции террориста средней руки, ваши путешествия окажутся в направлениях, которыми то и дело летают террористы, и выглядеть вы будете так, как маскируется типичный террорист, когда хочет, чтобы его не узнали. Короче, когда вы по совокупности 2500 оцениваемых параметров окажетесь похожи на террориста на 75% сильнее, чем остальные въезжающие в страну. И на все ваши «Какого хуя? А где доказательства?» вам будут говорить «Вы сами виноваты, нефиг было ездить в Тунис, Египет, Турцию имея фамилию похожую, на ту, что распространены на западе Сирии и двух деревнях Афганистана» - вот тогда, возможно, вы припомните этот пост и ваше неведение относительно природы сетей и социума чуть рассеется.
linkReply

Comments:
[User Picture]From: nezrim
2020-12-15 03:45 pm (UTC)

Э, нет


В частности из всех официальных причин смерти, от которых умерли 71748 человек, отброшенными оказались все, кроме двух. То есть граничным условием задачи является постулат о том, что все умершие умерли либо от причины № 1 «Ковид» – официальная причина, либо причины № 2 «Борьба с ковидом» – гипотетическая причина. Тот же алгоритм позволяет составить набор из бесконечного числа задач, выбирая произвольно любые две другие причины смерти.

У Вас точно такая же (ну, хорошо, не такая же, но близкая по смыслу) манипуляция — только в обратную сторону.

ОТ ЧЕГО ЖЕ, ПО-ВАШЕМУ, УМЕРЛИ ТЕ, КТО УМЕР НЕ ОТ КОВИДА — но при этом их смерти составили ту самую «добавочную смертность» по сравнению с другими годами?

Что такого добавилось в этом году ПОМИМО ковида и борьбы с ним, что могло эту самую добавочную смертность спровоцировать?

Именно ДОБАВОЧНУЮ, подчёркиваю. Так, в 2010 году, когда в России было жаркое лето и много дыма от множества пожаров, тоже была добавочная смертность. Но вот её природа, причины — ни у кого особых вопросов не вызывали. Почему, интересно?

(Reply) (Thread)
[User Picture]From: karachee
2020-12-15 08:01 pm (UTC)

Re: Э, нет

Я говорю, что имеет место манипуляция данными, подтасовка, с целью получить нужный ответ. И только.

Чтобы это заметить мне не нужно отвечать на вопрос ОТ ЧЕГО ЖЕ, ПО-ВАШЕМУ, УМЕРЛИ ТЕ, КТО УМЕР НЕ ОТ КОВИДА. Меня здесь интересует "как люди заблуждаются", а не "что происходит".

(Reply) (Parent) (Thread)
[User Picture]From: nezrim
2020-12-15 08:22 pm (UTC)

Нет


Имеет место быть пропуск (достаточно очевидных) промежуточных рассуждений. Сразу выдаётся наиболее обоснованный ответ — просто потому, что он наиболее прост и логичен.

(Reply) (Parent) (Thread)
[User Picture]From: karachee
2020-12-15 08:46 pm (UTC)

Re: Нет

Это рассуждение в рамках здравого смысла, которое не применимо для работы со статистическими данными.

У каждой смерти есть официальная непосредственная причина. Каждая смерть попадает в статистику. Убийство, самоубийство, болезнь, несчастный случай, война, стихийное бедствие и т.д. Есть косвенные причины, голод, пьянство, наркомания, стресс, ожирение, депрессия и т.д. Все эти данные - ЕСТЬ. По всем 75 и прочим тысячам.

Нельзя взять и седлать вид, что их нет, просто потому, что есть простое и логичное объяснение.
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: john_jack
2020-12-15 05:06 pm (UTC)

Вот да

Пропущен один маленький нюанс: не просто "умерли", а умерли дополнительно. По статистике, в обычный год эти люди не должны были умереть. Однако ж именно в этот — умерли. Часть их умерла от ковида. Часть по несчастливой случайности. Хотя нам рассказывают, что "борьба" с "эпидемией" уменьшает смертность: если всех запереть по домам, никто не попадёт под машину например. Но от чего же умерло большинство этой необъяснимой избыточной смертности?
(Reply) (Thread)
[User Picture]From: nezrim
2020-12-15 05:23 pm (UTC)

ВОТ ИМЕННО


При том что смертность, например, в ДТП объективно снизилась.

Отчего же, и правда, умерли те, кто умер ДОПОЛНИТЕЛЬНО?

(Reply) (Parent) (Thread)
[User Picture]From: karachee
2020-12-15 08:17 pm (UTC)

Re: ВОТ ИМЕННО

Если вам интересно знать ответ на этот вопрос - копайте, разбирайтесь. Но делайте это по хорошему, качественно, объективно, тщательно, усердно. Не хватайтесь за версию, что сама падает в руку не уподобляйтесь слепому, который ведет слепого.

Речь идет о смертях, смертях реальных. Вы говорите в том числе их родственникам "кто виноват" не ударив пальцем о палец. Это очень хреновая практика.
(Reply) (Parent) (Thread)
[User Picture]From: nezrim
2020-12-15 08:20 pm (UTC)

Я умею складывать 2 и 2


Версия и правда «сама падает в руку». А знаете, ПОЧЕМУ?

Потому что она наиболее обоснованная.

Если у Вас нет более убедительных альтернативных предположений, придётся согласиться с ней.

(Reply) (Parent) (Thread)
[User Picture]From: karachee
2020-12-15 08:52 pm (UTC)

Re: Я умею складывать 2 и 2

Хозяин - барин.

Но не "придется согласиться", а "хочу и соглашаюсь". Вас никто к такому согласию не вынуждает, вы - соглашаетесь с этой версией сами, добровольно, осознанно, принимая на себя всю ответственность за все последствия вашего согласия.
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: karachee
2020-12-15 08:09 pm (UTC)

Re: Вот да

Это загадка. Сейчас вы можете выбрать из двух вариантов:
1) продолжать не знать на неё отгадку
2) знать отгадку, полученную путем подтасовок


(Reply) (Parent) (Thread)
[User Picture]From: nezrim
2020-12-15 08:23 pm (UTC)

Где Вы увидели подтасовки?


Если Вас что-то не представляется очевидным (Вы не знаете и/или не хотите знать, как это обосновывается) — из этого не следует, что данный ответ неверен.

(Reply) (Parent) (Thread)
[User Picture]From: karachee
2020-12-15 08:57 pm (UTC)

Re: Где Вы увидели подтасовки?

В математике, статистике и пр. точных науках не бывает доказательств от "очевидного".

И таки да, из того, что человек заблуждается, не следует, что его ответ непременно не верен. "Заблуждение" может совпасть с "истиной". Так человек может думать что 2*2 = 4 потому, что 2+2=4. Заблуждающимся его делает, не факт неверного ответа, а ошибочность метода, которым ответ получен.
(Reply) (Parent) (Thread)
[User Picture]From: nezrim
2020-12-15 09:04 pm (UTC)

Не от очевидного, а от противного


Если есть действительно логичное, непротиворечивое, убедительное объяснение — то в отсутствие иных ПРИДЁТСЯ признать верным его. По крайней мере, до получения новых данных, принципиально меняющих ситуацию.

Если, конечно, вообще есть желание размышлять на эту тему.

(Reply) (Parent) (Thread) (Expand)
[User Picture]From: john_jack
2020-12-15 11:26 pm (UTC)

Re: Вот да

Это манипуляция, основанная на очевидной подтасовке. Вы в посте утверждаете, что умершие не от ковида люди и так все должны были умереть. А проблема в том, что по статистике заметное количество людей умирать было не должно. Но умерло. Именно в этот год. От чего-то, что происходило только в этот год и не происходило в другие.
Конечно, это целое множество факторов, но общая причина у них точно есть. Иначе придётся всю причинность выкинуть. Что-то произошло, но почему — нельзя знать!
(Reply) (Parent) (Thread)
[User Picture]From: karachee
2020-12-16 05:27 am (UTC)

Re: Вот да

Нет я этого не утверждаю. Я готов рассматривать версию что причина смерти этих людей - борьба с ковидом. Так вполне может быть.

Я не готов принять заведомо ложную, манипуляторскую аргументацию в пользу этой версии, которая используется рядом пользователей соцсетей.

Я вижу применение способа, который позволяет натянуть Сову на глобус и продеть верблюда в игольное ушко - я говорю, что этот способ здесь использован и вестись на него не следует. А использован этот порочный способ, чтобы донести истину, или донести ложь - совершенно не важно. Важно не быть слепым.

Edited at 2020-12-16 07:44 pm (UTC)
(Reply) (Parent) (Thread)