Причинно-следственная связь — Психологос
01 октября 2022 г., 21:42
Причинно-следственная связь — связь между явлениями, при которой одно явление, называемое причиной, при наличии определенных условий порождает другое явление, называемое следствием.
Если собаке давали мясо одновременно с включением лампочки, то через несколько повторений выделение слюны у собаки начиналось не только на само мясо, но и на включение лампочки. Образовался условный рефлекс. Повторение совпадений двух раздражителей — причина, рефлекс — следствие.
Корреляция или причинно-следственная связь
Частая ошибка — в корреляции разглядеть причинно-следственную связь.
Наибольшая продолжительность жизни отмечается в регионах Шотландии с наименьшей плотностью населения и самым низким уровнем безработицы. В США продолжительность жизни коррелирует с уровнем дохода (жизнь бедняков и людей невысокого социоэкономического статуса чаще обрывается преждевременно). В современной Великобритании профессиональный статус коррелирует с продолжительностью жизни. Согласно результатам исследования, проводившегося в течение 10 лет с участием 17 350 государственных служащих Великобритании, количество смертей среди работников управленческого аппарата в 1,6 раза больше, а среди конторских служащих и рабочих — соответственно в 2,2 и 2,7 раза больше, чем среди управленцев высшего звена (Adler et al., 1993, 1994). Складывается впечатление, что в разное время и в разных географических точках между статусом и здоровьем существует вполне определенная взаимозависимость.
Приведенный выше пример взаимосвязи статуса и продолжительности жизни иллюстрирует наиболее распространенную как среди любителей, так и среди профессионалов ошибку мышления: когда два фактора «идут рука об руку», как статус и состояние здоровья, трудно не поддаться искушению и не сделать вывод о том, что один является причиной другого. Можно предположить, что статус каким-то образом защищает человека от того, что может причинить вред его здоровью.
Или все совсем не так, и хорошее здоровье не следствие, а причина активности и успеха? Может быть, долгожители успевают накопить больше денег, и именно поэтому на их могилах стоят более дорогие надгробия? Корреляционное исследование позволяет нам сделать прогноз, но оно не может ответить на вопрос о том, вызовет ли изменение одного параметра (например, социального статуса) изменение другого параметра (например, состояния здоровья).Факт: те дети, которых родители часто били, обычно хуже учатся и чаще демонстрируют асоциальное поведение. Значит ли, что одно следует из другого? Совершенно не очевидно. Скорее, и жестокие наказания детей, и плохая учеба вместе с асоциальным поведением — следствие того, что это дети росли в неблагополучных семьях.
Факт: дети с развитым чувством собственного достоинства обычно учатся лучше, чем дети с низким самоуважением. Значит ли это, что чувство собственного достоинства является причиной, а хорошая успеваемость — следствием? Нет, корреляция здесь еще ничего не говорит о том, что является причиной, а что — следствием.
- Научность
Комментарии (9):
Анатолий Сальск, 02 октября 2015 г., 07:21
Считаю, что материал весьма и весьма полезный, так как позволит мне правильно оценить многие ситуации в прошлом. Спасибо за подборку!
Гость, 12 марта 2018 г., 14:12
Благодарю за полезную информацию!
Гость, 25 января 2020 г., 15:15
В моем понимании, выше социальная статус, значит выше доходы, значит лучше медобслужиыие, значит дольше СРЕДНЕСТАТИСТИЧЕСКАЯ продолжительность жить. Чётко отслеживается, причинно-следственная связь. Я не говорю про частные случаи. Чем масштабные сравнение, тем точнее результат. ИМХО.
1
ответ
Гость, 20 июня 2021 г., 02:21
Социальный статус — это не материальные блага.
Гость, 01 февраля 2020 г., 23:19
Наверно тут соглашусь с Богом. Не судите. Человек — это соотношение миллионов факторов случившихся в его жизни проектирование их на себя. Кроме того индивидуальный код днк, который в вкупе с факторами влияния на этого человека, даст бесконечное множество разнообразных поведенческих характеристик и действий. Тут надо учитывать множество параметров, в одних только генах прописано только миллиарды предрасположенностей, помножте на внешние факторы развития и получите астрономическую цифру из которой и состоит отдельный человек. Как его судить, если он грешен, да, но уже в днк у него было прописано малодушие и слабая сила воли. Это все подкрепилось внешними факторами из наблюдениями из жизни и вуаля — плохой человек. Человек, изначально кишмиш, кому что досталось. Выглядит как оправдание бессильности, но так оно и есть, бесхарактерный в виду своей предрасположенности и генам не может быть сильным, а сильный наоборот, не вникая откуда в нем есть то, что есть обвиняет слабого в том, что он такой слабый духом и говорит, как же так можно, фу будь сильным. Не понимает, что та сила которая у него есть, и которую он считает по праву своим достижением, уже изначально была у него, в виду кода днк и ряда последующих и воздействующих на него обстоятельств.
1
ответ
Гость, 16 октября 2021 г., 20:25
Вы правы, судить может только Бог. Потому что он, как Создатель, знает индивидуальный код ДНК каждого человека. И, как живой Бог, наблюдающий за всеми, он знает и все факторы влияния на человека. Но также Бог очень хорошо знает, что у каждого человека есть разум, совесть и свобода выбора, потому что он сам таким создал человека. Бог очень хочет, чтобы люди воспользовались разумом и совестью и поняли, что у них есть Создатель, который очень хочет помочь им стать не только сильными, но и порядочными людьми. Бог никого не списывает со счетов, ему дорог каждый, ведь он — его Создатель. В Библии рассказывается о царе Манассии. По сегодняшним меркам ему дали бы несколько пожизненных. Но он раскаялся перед Богом, умолял его о прощении. Это было искреннее раскаяние, ведь Бога обмануть нельзя. И Бог простил его и помог ему изменить свою жизнь. После этого Манассия помог своему внуку стать замечательным человеком. Любой может стать хорошим человеком, если слушается Бога.
1
ответ
Гость, 22 апреля 2022 г., 19:45
Цель всех религий (секты не в счёт) — избавить от инстинктов (очеловечить человека).
Гость, 20 февраля 2020 г., 09:31
Классический условный рефлекс — это пример сигнально-следственной, а не причинно-следственной связи.
Гость, 16 декабря 2020 г., 03:28
А дети-мажоры, и учатся хорошо, и не демонстрируют асоциальное поведение?
Материалы по теме:
01 окт. 2022 г.
Корреляция
0Подробнее
01 окт. 2022 г.
Результат
Результат — конечный итог, объективные последствия наших намерений, решений и действий.
0Подробнее
Содержание
- Работа над собой
- Воспитание детей
- Любовь, муж-жена
- Жизнь, деятельность
- Психика и здоровье
- Общение и влияние
- Личность, общество
- Психология для профи
Новые статьи:
- Профнабор интересной статусной девушки
- Формат, обязательный для маленьких детей
- Уважение начинается с вежливости
- Кружки и развивающие занятия – как часто?
- Как развивать у ребенка самостоятельность?
Популярные статьи:
- Знакомство с Дистанцией 2
- Знакомство с Дистанцией
- Убираю нетки: отчеты
- Навигатор по сайту
- Ложусь вовремя. Отчеты
Хиты недели:
- Знакомство с Дистанцией 2
- Знакомство с Дистанцией
- Детские болезни
- Дистанция для членов Клуба
- Чингисхан как руководитель и человек
Причинно-следственные связи для малышей — Дошкольник «ONLINE»
Приветствуем вас, уважаемые родители!
В мире нет ничего случайного, в нем каждое событие связано причинно-следственной связью. Все мы знакомы с понятием причинно-следственных связей: опустил руку в горячее – обжегся, наступил на грабли – они ударили вас по лбу. С причинно-следственными связями мы сталкиваемся на каждом шагу.
Причинно-следственная связь – связь между явлениями, при котором одно явление, которое является причиной, при наличии определенных условий порождает другое явление – следствие.
Ребенок 5—7 лет владеет достаточным объемом представлений об окружающем мире и может оперировать имеющейся у него информацией, довольно легко устанавливать прямые и обратные связи между объектами и явлениями, которые ему хорошо знакомы.
В старшем дошкольном возрасте дети уже достаточно хорошо умеют анализировать, сравнивать, обобщать, классифицировать объекты и явления, т.е. сформированы основы для освоения действия установления причинно-следственных связей и зависимостей уже на более высоком уровне, нежели на предыдущих возрастных этапах дошкольного детства.
Предлагаем вам игры, направленные на развитие причинно-следственных связей у ребенка 5-7 лет.
Игра «Почему это произошло?»
Предложите ребенку назвать как можно больше причин для следующих ситуаций:
• На улице стояло много людей.
• Дети стояли, открыв рот от изумления.
• Внезапно в комнате погас свет.
• Пение птиц внезапно прекратилось.
• Мама открыла дверь в комнату и ахнула.
Постарайтесь придумать как обычные, так и самые невероятные объяснения ситуаций. Например: мама могла удивиться, увидев подарок на столе или разбитую чашку, а может быть Карлсона, сидящего на подоконнике.
Игра «Что может произойти, если…»
• Если положить лед на ладонь, то … .
• Если у медведя вырастут крылья, то … .
• Если полететь высоко-высоко, то … .
• Если съесть много мороженого, то … .
• Если летом пойдет снег, то … .
Подключите фантазию: если выбросить кусочек хлеба, то его могут скушать птички, он может упасть на голову кому-то, его отнесет ветром в волшебную страну и хлебный кусочек превратится в съедобный домик.
Игра «Что тяжелее?»
В этой игре нужно будет разобраться, какие предметы тяжелее других, а какие легче.
Взрослым-то хорошо, для них понятно, что книжка весит больше, чем карандаш, а стол тяжелее стула. Перейдите по данной ссылке и играйте вместе с ребенком:
http://igraem.pro/igry-dlya-malyshej/chto-tyazhelee/
Игра «Найди связь»
Предложите ребенку найти связь между двумя предложениями, на первый взгляд не имеющих ничего общего. Объясните, как все происходило.
Например:
Шишка упала с елки. — Автобус не пришел вовремя.
Белка сидела на дереве и упустила шишку. В это время под деревом сидел зайчик, на которого упала шишка. С перепугу трусишка бросился бежать, выскочил на дорогу. Дети, сидящие в автобусе, выбежали посмотреть на зайца и разбрелись. Водитель их долго ждал и поэтому автобус не пришел на станцию вовремя.
Это варианты предложений, которые можно предложить ребенку:
- Котенок подошел к блюдечку. — Мальчик не выучил уроки.
- Утром отключили воду. – Папа опоздал на работу.
- Дворник чистил весь день дорожки от снега. — Мама опоздала на работу.
- Все прохожие промокли. — Наконец-то вылезли первые первоцветы из земли.
- Мама купила вкусный арбуз. — Папа, наконец-то поменял колесо на машине.
- Многие ученики заболели. — Окна покрыты инеем.
- Мама устроила дома праздник. — Мальчик получил хорошую оценку.
Игра «Что сначала, что потом?»
Важный момент при развитии ребенка, его подготовки к школе, научиться определять последовательность событий. Для тренировки подойдет дидактическая игра «Что сначала, что потом?». Карточки нужно распечатать, разрезать на квадратики и предложить ребенку определить, что сначала, а что потом. Не торопите ребенка, пусть хорошо подумает, включит логику, объяснит свою точку зрения, а потом у него будет получаться все быстрее и легче. Для деток 6-7 лет можно предложить по расставленным в логическом порядке картинкам составить небольшой рассказ в качестве развития речи.
(Кликните на картинку, чтобы увеличить ее в размерах)
Играйте в эти замечательные игры и развивайте воображение ваших детей!
Материал подготовлен Исламовой Р.А. (специалист МАУ ИМЦ «Альтернатива»)
В чем разница (+ примеры!)
Перейти к тому, что вам интересно прочитать:
Очень краткое изложение
Прежде чем мы начнем официально пост в блоге… . Итак, если вы здесь, чтобы получить краткий ответ о том, в чем разница между причинно-следственной связью и корреляцией, вот она:
Корреляция — это связь между двумя переменными; при изменении одной переменной изменяется и другая переменная.
Причина — это когда существует реальное объяснение того, почему это логически происходит; это подразумевает причину и следствие.
Итак: причинность есть корреляция с причиной .
Если вам интересно прочитать полное объяснение, чтобы правильно понять термины, разницу между ними и учиться на реальных примерах, продолжайте прокручивать!
Прошли те дни, когда данные в основном использовались исследователями или были доступны только тем, кто обладал огромным техническим мастерством. Времена, когда получение данных было тяжелым испытанием, требующим месяцев ручного отслеживания, разработки опроса или кода отслеживания, написанного с нуля больше .
Слава богу.
В наше время, когда все на свете отслеживается и каталогизируется, у каждого есть доступ к данным. Однако этот обильный доступ может выступать в качестве большого барьера между компаниями, которые становятся великими, и компаниями, которые этого не делают.
Люди, которые знают, как говорить на языке данных, таким образом, имеют большое преимущество, потому что они могут владеть этим мощным инструментом.
Великие маркетологи больше не придумывают кампании на основе интуиции; вместо этого они позволяют своим данным подсказать им, на какой кампании им следует сосредоточиться, а затем используют свой маркетинговый опыт для создания именно этой оптимальной кампании, определенной с помощью данных.
Лучшие продакт-менеджеры предлагают тестировать продукты и вносить изменения на основе обширных исследований пользователей и данных об использовании продуктов.
Каждый может использовать данные в своей роли, и получить доступ к важным для вас данным несложно.
Но часто самым большим препятствием является понимание: «Со всеми этими данными, как мне узнать, что действительно важно, на чем сосредоточить свои усилия и какие шаги предпринять?»
В этой записи блога, состоящей из двух частей, я покажу вам, как отвечать на эти вопросы и что значит правильно использовать ваши данные.
В этом посте мы рассмотрим основы, такие как понимание того, что такое корреляция и причинно-следственная связь, и более подробно рассмотрим свойства корреляции, различные типы и роль, которую играет шум.
Во втором сообщении блога мы рассмотрим формулы, как определить силу корреляции, как они могут помочь нам определить причинно-следственную связь и как понять, насколько важна каждая переменная для конечного результата.
Что такое корреляция и причинно-следственная связь?
Ключ к правильному использованию ваших данных заключается в понимании разницы между причинно-следственной связью и корреляцией, поэтому давайте сейчас рассмотрим каждый из этих терминов.
Что такое причинно-следственная связь?
Суть причинно-следственной связи заключается в понимании причины и следствия.
Это такие вещи, как:
- Дождевые облака вызывают дождь
- Упражнения вызывают рост мышц
- Переедание вызывает увеличение веса
Это предполагает, что потому что x произошло, затем следует y ; есть причина и следствие.
Однако они не очень практичны в бизнес-среде.
Когда вы просматриваете свои данные на практике, вы, в основном, ищете ответы на вопросы, в зависимости от вашей роли, например следующие:
- Какой канал привлечения клиентов является наиболее успешным и почему?
- Какие части моего продукта нравятся пользователям больше всего?
- Почему люди покупают мой продукт/оплачивают мои услуги?
И, наконец, то, что вы хотите сделать, это различать факторы, которые действительно способствовали более успешному каналу, лучшей части продукта или причине, по которой клиенты покупают то, что вы продаете. .
Здесь вы ищете индикаторы, которые сообщают вам какие из ваших действий привели к желаемому результату.
Обычно это не что-то одно, а скорее сочетание многих факторов, каждый из которых в той или иной степени влияет на конечный результат.
Так что на практике это может быть очень сложно, потому что у вас часто происходит много дел одновременно.
Например, если вы работаете в отделе маркетинга и видите, что ваша последняя запись в блоге или видео привлекает много веб-трафика на ваш сайт, вы можете задаться вопросом, действительно ли это произошло благодаря вашим усилиям или :
- Новое дополнение к продукту, которое команда разработчиков запустила на прошлой неделе, или
- Гостевое выступление вашего генерального директора в подкасте, или
- Праздники не за горами, или
- Кто-то разместил положительный отзыв о вашем продукте на популярном веб-сайте,
- и т. д.
Или, если вы хотите быть более точным, , насколько увеличился трафик части контента, который вы создали, по сравнению с другими переменными факторами?
Как вы понимаете, установить причинно-следственную связь может быть довольно сложно. Поскольку эти вещи могут оказаться очень сложными на практике, вы часто будете сталкиваться с родственной, но более общей концепцией, называемой корреляцией.
Что такое корреляция?
Корреляция описывает взаимосвязь между двумя разными переменными, которая гласит: когда одна переменная изменяется, меняется и другая.
Зависимые и независимые переменные
Когда у вас есть пара коррелированных переменных, одна называется зависимой переменной, а другая — независимой переменной.
Значение, которое зависимая переменная принимает на , зависит от значения, которое имеет независимая переменная. Вы можете думать о независимой переменной как о той, которая задает сцену, и зависимая переменная должна реагировать соответствующим образом.
Например, если вы анализируете количество приготовленных блюд в вашем ресторане на основе количества клиентов, то количество приготовленных блюд является зависимой переменной, а количество клиентов — независимой переменной.
С большим количеством клиентов вам нужно готовить больше блюд, но если вы просто начнете готовить больше блюд, вы, вероятно, не сможете волшебным образом привлечь больше клиентов в свой ресторан.
Иногда эти отношения могут стать немного более туманными.
Например: если вы анализируете общее время просмотра ваших видео на Youtube по сравнению с количеством просмотров видео.
В этом случае зависимая переменная — это время просмотра, а независимая переменная — количество просмотров, поскольку время просмотра является результатом количества просмотров и того, сколько времени смотрел каждый человек.
Хотя вы можете оценить количество просмотров на основе времени просмотра, эта связь не имеет особого смысла, поскольку зритель сначала должны нажать на ваше видео и начать просмотр, прежде чем они смогут увеличить время просмотра.
Основные свойства корреляций
Корреляции могут быть:
- Положительный
- Отрицательный (обратно коррелированная)
- Не коррелирован
Их корреляция может быть классифицирована как:
- 111111111111111111111111111111111111111111111111. СТАРИТЕЛЬНАЯ
В расширенной записи блога, которая выйдет на следующей неделе, мы рассмотрим статистические тесты, которые вы можете выполнить для определения силы корреляции, но здесь мы сначала сосредоточимся на том, чтобы лучше понять, что на самом деле означает корреляция и как она выглядит.
На следующих графиках показаны упомянутые выше типы корреляций:
В каждом столбце сначала показано отсутствие корреляции, затем слабая корреляция, сильная корреляция и полная корреляция.
Первая и вторая строки показывают положительную и отрицательную линейную корреляцию соответственно.
- положительная корреляция означает, что когда одна переменная растет, растет и другая.
- Отрицательная корреляция означает, что когда одна переменная растет, другая снижается.
Как мы видим, никакая корреляция просто не показывает никакой связи вообще: перемещение влево или вправо по оси x не позволяет нам предсказать какое-либо изменение по оси y.
Например, нет никакой зависимости между весом моего кота и ценой нового компьютера; они не имеют никакого отношения друг к другу.
(Если бы существовала положительная корреляция между весом моего кота и ценой нового компьютера, у нас у всех были бы большие проблемы. )
Слабая корреляция означает, что мы можем видеть тенденцию положительной или отрицательной корреляции, если смотреть на данные издалека; однако эта тенденция очень слаба и может исчезнуть, если вы сосредоточитесь на определенной области.
Например, давайте возьмем слабую положительную и слабую отрицательную линейную корреляцию сверху и увеличим масштаб в диапазоне x от 0 до 4.
Вот что мы можем получить:
И вдруг та слабая корреляция, которую мы видели раньше, исчезла.
Это показывает нам, что, хотя слабая корреляция может дать нам информацию о более крупных тенденциях, эти правила могут не работать, если рассматривать меньший регион.
Поэтому, когда у нас есть слабая корреляция, мы должны быть осторожны, чтобы не пытаться использовать ее в слишком малом масштабе.
Сильная корреляция означает, что мы можем увеличивать масштаб намного, намного дальше, пока нам не придется беспокоиться о том, что это отношение не соответствует действительности. Если мы возьмем нашу сильную положительную и сильную отрицательную корреляцию сверху, а также увеличим масштаб до области x между 0–4, мы увидим следующее:
Верхний ряд показывает нам, как выглядят сильные корреляции, когда мы увеличиваем x в диапазоне от 0 до 4. Как мы видим, даже здесь корреляции все еще очень очевидны, и они также все еще довольно сильны (хотя и не так сильно, как раньше).
Чтобы попасть в область, где эта корреляция больше не выполняется, нам нужно довольно сильно увеличить масштаб, что мы и видим в нижней строке графика выше.
Здесь мы увеличили масштаб области, где x находится в диапазоне 0,5–1,5, что составляет 10% от исходного диапазона. В этом масштабе наши корреляции больше не видны, даже в слабой форме.
И, наконец, идеальная корреляция — это корреляция без шума, и как бы мы ни увеличивали масштаб, она всегда останется идеальной. Этот тип корреляции не совсем практичен, но все же важно знать, как выглядит «идеальная» корреляция.
Сила корреляции и наклон?
Другая часто неправильно понимаемая вещь о корреляциях состоит в том, что сила корреляции зависит от наклона .
Взгляните на следующие графики. Все они, кроме одного, демонстрируют сильную корреляцию с одинаковой силой.
Обратите внимание, что у нас может быть сильная корреляция независимо от того, большой ли у нас (левый столбец) или маленький (средний столбец) наклон.
В крайнем правом столбце показан график без корреляции, несмотря на то, что шума практически нет. Это связано с тем, как определяются корреляции: насколько изменение одной переменной влияет на другую переменную.
В данном случае значение y не зависит от значения x, следовательно, это еще один пример отсутствия корреляции (хотя более реалистичный пример отсутствия корреляции больше похож на случайный разброс точек, который мы видели на изображении в предыдущем разделе.)
Что такое шум и почему он важен для измерения корреляций
Возможно, вы заметили, что средний столбец приведенного выше графика больше похож на идеальную корреляцию, чем крайний левый столбец. Это связано с тем, что силы корреляции зависят от масштаба вашего шума относительно наклона.
Таким образом, чтобы средний и левый столбцы имели одинаковую силу корреляции, масштаб шума в среднем столбце должен быть меньше, чем масштаб шума в левом столбце, поскольку средний столбец имеет меньшую (более мелкую) ) склон.
Причина этого — то, о чем мы поговорим подробнее в расширенном сообщении блога, которое выйдет на следующей неделе, так что пока просто знайте, что у вас могут быть очень сильные корреляции, даже если ваш наклон не очень велик.
Давайте сейчас сосредоточимся только на одном термине: шум.
Итак, что такое шум?
Ссылки на шум вариации ваших данных. Он существует, потому что всегда есть много факторов, влияющих на данные, которые вы просматриваете.
Мы видели шум на наших графиках выше, особенно при рассмотрении различных сил корреляции.
Давайте снова потянем это изображение вверх:
В крайнем левом столбце мы видим много шума; данные сильно разнятся, и все выглядит совершенно по-разному.
Второй слева столбец показывает общую тенденцию, как мы обсуждали выше, но все еще происходит много изменений. Мы можем видеть на нашей оси Y, что значения Y варьируются от 0 до 4, но ширина нашей линии составляет около 2.
В третьем слева столбце («Сильная положительная/отрицательная линейная корреляция») мы видим гораздо более четкую тенденцию. Наши данные все еще немного колеблются, но не очень сильно. В данном случае у нас мало шума .
Крайний правый столбец вообще не имеет колебаний и показывает идеальную прямую линию без шума.
Вот как «выглядит» шум. Мы также только сравнили наш шум со значениями y, но точки данных x и y будут иметь шум, который влияет на них.
Но давайте сделаем это более практичным.
Что такое шум на самом деле и откуда он берется?
Давайте представим, что вы создали игру для смартфона и смотрите, сколько времени каждый пользователь потратил на вашу игру при первой загрузке.
Лучший способ представить это в виде гистограммы, которая может выглядеть следующим образом:
Обычно после того, как вы нанесете точки данных, которые у вас есть, появляется форма распределения, и вы можете оценить форму распределение на основе очков, которые у вас есть.
Идеальное распределение — это то, как выглядело бы ваше распределение, если бы у вас было бесконечное количество точек данных. Это распределение может принимать любую форму; это не обязательно должно быть нормальное распределение, как показано выше.
Отклонение от идеального распределения, которое мы видим на гистограмме, является еще одной формой шума. Шум изменяет точки данных в зависимости от факторов, не зависящих от эксперимента.
Этот шум исходит от таких вещей, как:
- Пользователь запускает вашу игру, а затем забывает выключить ее, из-за чего остается дольше
- Другого пользователя зовет на ужин его мама
- Игра другого пользователя дала сбой, поэтому он не смог играть в первый раз
Все это вносит шум, из-за которого ваши данные отклоняются от «идеальной» формы, которую они имели бы, если бы каждого пользователя просто поместили в пустую комнату и попросили играть в вашу игру до тех пор, пока им это не надоест.
Таким образом, при любом анализе данных, который вы когда-либо выполняли, следует помнить о шуме, и в идеале вы должны свести к минимуму влияние шума на свои данные.
Контроль шума
Ваши данные всегда будут подвержены влиянию шума, но если вы хотите попытаться уменьшить количество шума в ваших данных, вы можете попытаться контролировать некоторые источники шума.
Например, вы можете смотреть только на своих пользователей, чье приложение не закрылось из-за ошибки, чтобы контролировать шум, исходящий от сбоя приложений пользователя.
Однако для каждой переменной шума, которую вы контролируете, размер выборки будет уменьшаться, поэтому, если вы попытаетесь контролировать слишком много вещей, вы получите слишком мало точек данных, которые не позволят вам это сделать. тоже ничего полезного.
Итак, что вам нужно сделать, это определить самые большие источники шума , , т. е. какие переменные приводят к наибольшему количеству колебаний, и попытаться контролировать эти .
Таким образом, вы сможете максимально увеличить размер выборки, контролируя только несколько параметров, и в то же время устраняя как можно больше шума.
Конечно, поиск правильного баланса между допустимым количеством шума и желаемым размером выборки всегда зависит от того, что вы делаете, поэтому, в конце концов, вам нужно решить, соответствует ли количество шума см. на вашем графике, является приемлемым для вас анализом, и если размер выборки достаточно велик.
Есть несколько математических методов, которые вы можете использовать, чтобы помочь в этом, и это то, о чем мы поговорим в расширенной записи блога на следующей неделе, если вам интересно.
Типы корреляции
Выше мы видели примеры положительных и отрицательных линейных комбинаций при разной силе корреляции, но корреляции не обязательно должны быть линейными.
Они также могут быть в различных формах, таких как линейная, квадратичная, экспоненциальная, логарифмическая и практически любая другая функция, которую вы только можете себе представить.
Следующие графики показывают несколько примеров коррелированных переменных:
Мы можем видеть на крайнем левом графике, что когда значение «x» увеличивается, значение «y» увеличивается на пропорциональную величину, и эта сумма всегда одно и то же.
Связь между осью x и осью y может быть описана уравнением «y = mx + b», что делает этот тип корреляции линейным (это также легко увидеть на прямой линии на графике) .
На среднем графике мы видим, что в зависимости от того, где мы находимся на графике, значение y уменьшается (при x < ~ 3), не изменяется на самом деле (приблизительно при x = 3) или увеличивается. с x (при x > ~3).
Здесь очень важно отметить, что, хотя корреляции не обязательно должны быть линейными, стандартно искать только линейные корреляции, потому что их проще всего искать и легче всего проверять с помощью формул. .
Давайте рассмотрим некоторые примеры корреляций, например:
- Чем жарче погода, тем больше мороженого вы продаете
- Чем больше голосов ваш контент получает на Reddit, тем больше посетителей вы получаете с этого поста
- Чем больше у вас подписчиков в Instagram, тем больше продаж вы делаете в своем бизнесе.
Чтобы лучше понять эти примеры, я представил, как могут выглядеть графики для каждого из приведенных выше примеров.
Вот график количества покупателей мороженого в зависимости от температуры:
Вот график посетителей страницы в зависимости от положительных отзывов Reddit:
А вот график ежемесячных продаж бизнеса в зависимости от подписчиков в Instagram:
Обратите внимание, что ни один из них не имеет настоящей линейной формы.
И на самом деле — наши продажи мороженого, кажется, достигают максимума около 200, количество посещений страниц от голосов Reddit, кажется, растет намного быстрее после того, как мы набираем 20–30 голосов, а продажи продуктов, кажется, растут медленнее, когда мы достигаем тысяч Подписчики в инстаграме.
Итак, чтобы быть более точным, мы могли бы сказать, что первый график выглядит как «S» (он же сигмовидная форма), второй график выглядит немного экспоненциальным или как степенная зависимость, а третий график выглядит немного логарифмическим потому что он выравнивается.
Тем не менее, Я все же рекомендую, если он выглядит более или менее линейным, рассматривать его части как линейные для анализа.
Моя точка зрения такова: эти корреляции выглядят достаточно близко к линейным, поэтому мы можем предположить, что некоторые из них являются линейными, а не рассматривать их как более сложные формы, которые может быть сложнее оценить и которые не приведут к значительным улучшениям ваших результатов.
Конечно, когда отношение слишком далеко от линейного, вы не можете считать его просто линейным.
Таким образом, из приведенных выше графиков мы можем прийти к следующим выводам при рассмотрении их частей как линейных корреляций в рамках более сложных форм: потребительский спрос быстро растет (в центре), а во внешних регионах спрос практически не меняется. Нашему магазину мороженого не нужно планировать до последнего рожка мороженого, проданного в данный день, но было бы очень полезно знать, сколько ведер мороженого вообще нужно приготовить, исходя из завтрашнего прогноза погоды.
- С помощью Reddit мы можем подготовить наши серверы к повышенному трафику на тот случай, если наша публикация начнет появляться в трендах, чтобы наши пользователи не загружали наш сайт слишком долго. С помощью графика мы можем сделать обоснованные оценки ожидаемого трафика и свести к минимуму риск недокупки или перекупки.
- Или с нашими подписчиками в Instagram , мы знаем, какой доход ожидать при определенном количестве подписчиков. Но с уменьшающейся отдачей, которую мы видим на графике выше, мы можем подумать о стратегиях того, как сделать наших нынешних подписчиков более лояльными или заинтересованными, а не просто пытаться постоянно получать новых подписчиков.
- Имеет ли эта корреляция смысл? Существует ли фактическая связь между этими переменными?
- Сохранится ли корреляция, если я посмотрю на некоторые новые данные, которые я не использовал в своем текущем анализе?
- Является ли связь между этими переменными прямой или они обе являются результатом какой-то другой переменной?
- « В дни, когда я бегаю, я замечаю больше машин на дороге. “
- Лично я не ЗАСТАВЛЯЮ больше машин выезжать на улицу, когда я бегу. Просто потому, что я бегаю на улице, я вижу больше машин, чем когда остаюсь дома. Эта связь не является причинно-следственной потому что ни машины, ни я не сталкиваемся друг с другом.
- « В дни, когда я пью кофе, я чувствую себя более продуктивным. “
- Конечно, благодаря кофеину я чувствую себя более продуктивным. Но это также может быть связано с тем, что я хожу в кофейню, чтобы выпить кофе, и я более продуктивна в кофейне, чем дома, когда меня отвлекают миллионы. Эта причинно-следственная связь IS НЕ подтверждено.
- После тренировки я чувствую себя физически истощенным.
- Это причинно-следственная связь потому что Я целенаправленно довожу свое тело до физического истощения во время упражнений. Мышцы, которые я использовал для упражнений, истощены (следствие) после того, как я тренируюсь (причина). Эта причинно-следственная связь IS подтверждается.
- Когда я даю кошке больше 2 лакомств в день, она становится немного пухлее.
- Мой кот толстеет потому что я его больше кормлю. Это причина и следствие. То, что я кормлю свою кошку лакомствами, является причиной, а следствием является то, что она становится немного круглее.
- Чем больше лайков, тем больше людей смотрели видео дольше, потому что оно им понравилось, или
- что видео понравилось большему количеству людей, потому что они смотрели его дольше и наслаждались им.
- Заработайте на больше денег , не считая вашего маленького ценного свободного времени вашего времени
- 9000ака вашего плана на работу на диване в пижаме)
- Получайте еженедельно приглашения на работу от рекрутеров на Linkedin, которые действительно хотят оставаться на связи
- Выделитесь в грядущей революции Интернета вещей, больших данных и машинного обучения
- Получите эту суперсилу , которой, кажется, нет ни у кого другого
- Найдите работу, за которую можно умереть в сфере технологий, банковского дела, консалтинга, разработки программного обеспечения, разработки веб-сайтов, кибербезопасности, цифровых медиа и т. д.
- Помогите людям своими идеями и создайте реально работающую программу, которой смогут пользоваться миллионы
- …. или, может быть, вы просто хотите написать программу, которая будет собирать все ваши любимых поста о кошках в Интернете и отправлять их вам по электронной почте…
В чем разница между причинно-следственной связью и корреляцией?
Итак, вопрос на миллион долларов: в чем разница между причинно-следственной связью и корреляцией?
Короче говоря:
Корреляция является мерой для того, как зависимая переменная реагирует на изменение независимой переменной .
Корреляция, в конце концов, это просто число, полученное из формулы.
Причинность — это особый тип отношений между коррелирующими переменными, в котором конкретно говорится, что изменение одной переменной вызывает соответствующую реакцию другой.
Причинность добавляет корреляции реальный контекст и значение.
Все причинно-следственные связи являются корреляциями, но не все корреляции являются причинно-следственными связями.
Корреляции между переменными могут появляться чисто случайно, поэтому, размышляя о причинно-следственной связи, мы должны спросить себя:
Примеры корреляции и причинно-следственной связи
Ниже приведены несколько быстрых примеров корреляции и причинно-следственной связи.
Примеры корреляции, а НЕ причинно-следственной связи:
Хорошо, а как насчет примера, который на первый взгляд может показаться более связанным с :
Примеры причинно-следственной связи:
Различение между причинно-следственной связью и корреляцией может быть сложным, когда вещи имеют положительную или отрицательную корреляцию без какой-либо причины или из-за кажущихся случайными, не связанными причинами.
Давайте представим, что каждый раз, когда я пью кофе, цена на кукурузу в Испании растет.
Это может быть положительной корреляцией: когда я увеличиваю потребление кофе, цена на кукурузу увеличивается.
Но делает ли это волшебным образом причинно-следственную связь? Нет.
То, что я пью больше кофе, НЕ означает, что я вызываю рост цен на кукурузу в Испании.
Между мной и ценами на кукурузу нет причинно-следственной связи.
Хотя… если по какой-то странной, сложной, глобальной логистической цепочке причин, связанных с моим спросом на кофе, увеличивающим производство кофе в Испании, что затем каким-то образом увеличивает стоимость на соседних кукурузных полях, тем самым фактически увеличивая цены на кукурузу, и было, НА САМОМ ДЕЛЕ, причинно-следственная связь… тогда это была бы другая история.
Но, к счастью, в этом сценарии вероятно нет причинно-следственной связи, просто корреляция.
Эти примеры немного более анекдотичны с целью установления разницы между ними, но давайте рассмотрим более практический сценарий, в котором грань между причинно-следственной связью и корреляцией может быть размыта.
Например, давайте рассмотрим две переменные: 1) количество лайков на видео на Youtube и 2) общее время просмотра видео.
Мы можем видеть, что по мере увеличения количества отметок «Нравится» видео увеличивается и общее время просмотра видео. Точно так же по мере увеличения общего времени просмотра увеличивается и количество лайков.
Следующее изображение представляет собой построенный мной график взаимосвязи между временем просмотра и количеством лайков для выбранной группы видео на Youtube, чтобы помочь нам визуализировать эту взаимосвязь:
Здесь мы видим слабую положительную корреляцию, которая не является полностью линейной, но для простоты мы приблизим ее к линейной.
Но что это значит? И в каком направлении идет эта корреляция? Какая из них является зависимой, а какая независимой переменной?
Ну, эти переменные могут быть слабо связаны друг с другом:
Объяснения в обоих направлениях имеют смысл, но с уверенностью можно сказать, что ни одно из них на самом деле не является причиной друг друга.
Лучшей причинной переменной, которая также коррелирует с обеими этими переменными, является переменная «количество просмотров» видео на Youtube. Зрители несут ответственность за лайки и просмотры видео, и, следовательно, они вызывают рост этих цифр.
В этом случае на самом деле может происходить то, что переменная «количество просмотров» ВЫЗЫВАЕТ увеличение времени просмотра и лайков на видео. И переменные «время просмотра» и «лайки» являются корреляциями друг с другом только из-за их случайной связи с переменной «количество просмотров», но переменные «время просмотра» и «лайки» сами по себе причинно не связаны с друг друга.
Итак, как вы можете себе представить, существует множество случаев , где мы можем получить корреляции между переменными, которые напрямую связаны с причинно-следственной связью между ними.
Важно отметить, что если у вас есть каузальная переменная, которая коррелирует с несколькими другими переменными, то эти другие переменные также могут быть коррелированы друг с другом просто из-за их зависимости от одной и той же каузальной переменной.
Это то, что мы видели в примере выше.
Короче говоря, корреляция — это очень важная взаимосвязь между переменными, которая может указывать на причинно-следственную связь, но сами корреляции иногда могут вводить в заблуждение или быть неинформативными.
Если мы не оценили эту взаимосвязь и не нашли действительное значение, которое связывает две переменные, мы не должны принимать решения, основанные на том, как мы обнаружили поведение коррелированной, но в остальном, казалось бы, не связанной переменной.
Вот и весь пост на этой неделе!
Следите за новостями на следующей неделе, чтобы не пропустить вторую часть этого сообщения в блоге, где мы рассмотрим эту тему более подробно.
Кодирование с макс.
Что такое наука о данных? Чем занимается Data Scientist? Как начать работу с наукой о данных?
Зарегистрируйтесь на мой бесплатный 30-минутный семинар «Как начать работу в качестве специалиста по данным» и начните свое путешествие по науке о данных уже сегодня!
ПРИСОЕДИНЯЙТЕСЬ К БЕСПЛАТНОМУ КЛАССУ
Привет! Я МАКС!Я здесь, чтобы научить вас
как стать специалистом по данным.Готовы ли вы к:
Позвольте предположить.
«Хотел бы я стать специалистом по данным… Просто этому слишком сложно учиться».
«Я даже не знаю, какие навыки мне нужно выучить в первую очередь, не говоря уже о том, где их выучить».
«Наука о данных выглядит сложной… Я не знаю, с чего начать».
«Только люди с математическим образованием могут быть исследователями данных…. и я не очень силен в математике».
«Чтобы уметь программировать, вам нужна степень в области компьютерных наук».
Программирование и наука о данных имеют плохую репутацию из-за того, что они слишком «пугающие» или слишком «сложные».Правда далеко не так.
И настоящий секрет:
Программирование и обработка данных просты. Я здесь, чтобы показать вам почему.Многие технические материалы говорят о многом. Я знаю, потому что я был там; Я ходил на курсы, читал книги и смотрел видео.
Иногда кажется, что после 14 часов контента вы так и не понимаете, в чем суть чего-либо, и вы даже не представляете, как сделать с этим что-то практическое.
Зачем тратить так много времени на так много разговоров и так мало фактического кодирования и на самом деле «занимаясь наукой о данных»? Я, честно говоря, не понимал — поэтому решил взять на себя ответственность изучать программирование и науку о данных по-своему.
Я гуглил, исследовал и учился, но самое главное: я кодировал, визуализировал, анализировал.