Эта статья - логичное продолжение предыдущей, и в ней мы поговорим о проблеме восприятия человеком объективной реальности по отдельным частностям немного с другой стороны. А именно, как люди считают репрезентативной общность фактов и явлений, которая сама по себе своим способом отбора является совсем не случайной.
Выбрать много... и всё равно ошибиться
Пресловутое "100% жителей страны пользуются Интернетом, согласно опросу на сайте Яндекса" представляет из себя совсем неслучайную выборку. Ведь на сайт Яндекса ходят люди, которые априори умеют выходить в Интернет и регулярно его используют. Большая выборка - не всегда гарантия от ошибок.
А вот все мои друзья и знакомые голосовали против Путина, значит, на самом деле за него никто не голосует.
Наверняка многим знакомый довод. Разумно? Совсем нет. Группа "все мои знакомые" нерепрезентативна, потому что люди в качестве знакомых обычно имеют лиц более-менее одной национальности, близкого места жительства, уровня доходов, политических и религиозных убеждений, образования и рода деятельности. Не все эти показатели одинаковы, конечно, но общего обычно хватает. Более того, если люди регулярно общаются друг с другом, то они заодно влияют на формирование взглядов друг друга. Неудивительно, что их политические убеждения могут отличаться от средних по стране.
Неслучайные случайности
Не всякая "случайная" выборка действительно случайна, даже если брать абсолютно незнакомых между собой людей. Если спрашивать возраст людей около станции метро "Университет", то может показаться, будто бы пенсионеров у нас в стране исчезающе мало. Среди жителей вахтового посёлка Сабетта процент мужчин будет высок, как и показатели их здоровья, а жители сельской местности покажут просто невероятно высокую в масштабах страны долю умеющих доить коров. Таких примеров можно придумать много. Всё дело в том, что сам способ отбора задаёт не совсем случайные условия. Понятно же, что полагаться на подобные выборки значит изначально загнать себя в ловушку ошибочных данных и неверных выводов.
Любая выборка людей должна быть не просто случайной, а отражающей разнообразие граждан страны, живущих в разных городах и сёлах, в разных климатических условиях, с разным доходом и разного возраста. И чтобы это учесть, по уму нужно следить за репрезентативностью выборки, она должна адекватно отражать генеральную совокупность.
Например, процент жителей села в выборке должен быть похож на реальный процент сельских жителей в среднем по стране. Должны присутствовать люди с разным уровнем образования, живущие в разных уголках страны, должны присутствовать и мужчины, и женщины...
Разумеется, ни у кого нет достаточного большого количества (не менее социологически-традиционных 1600 человек!) знакомых с таким разнообразием личных характеристик. А это значит, что по знакомым в принципе нельзя ничего узнать. Судить о чём-либо по ним - ошибка.
Тем более у женщин в выборке своих знакомых чаще всего будет нерепрезентативный перекос в сторону числа женщин, аналогичный перекос будет и у мужчин в сторону мужчин. Студент обязательно привлечёт молодёжь своей возрастной категории, а у молодых матерей, кроме других мамочек, в выборку наверняка попадут и их малолетние дети. Структура своего круга общения обязательно налагает отпечаток, и это не может не повредить объективности эксперимента.
Пираты и глобальное потепление
Согласно исследованиям британских учёных, в которых участвовали все жители города Когалым, уровень образования у местных находится в явной корреляции с расстоянием от носа до пупка. Это случайность? Оказывается, не совсем. Просто фразу "все жители" надо понимать буквально - участвовали даже грудные младенцы.
Корреляция - это когда две величины, две характеристики имеют поведение, которое обладает каким-то сходством или видимой взаимосвязью. Классический пример - влияние числа пиратов на глобальное потепление: в течении XX века пиратов становится всё меньше, зато растёт среднеклиматическая температура.
Распространённой ошибкой является считать корреляцию доказательством наличия причинно-следственной связи. Это необязательно так. Уменьшение числа пиратов вовсе не вызывает глобальное потепление. Там, где нам может показаться наличие связи, может не быть ничего, кроме случайного совпадения.
И тем более ошибкой является считать корреляцию показателей в круге своих знакомых с наличием аналогичной корреляции (не говоря уже о причинно-следственной связи) в масштабах всей страны. Например, если все знакомые не прививались от гриппа, при этом за всю зиму ни разу не болели им, то это не значит, что все непривитые по всей стране якобы не заболели, причём якобы именно потому, что не прививались.
Выводы
Время для выводов? Нет, по личным знакомствам ни о чём достоверно судить нельзя. Не только потому, что знакомых маловато для статистически значимых результатов, но и из-за того, что круг знакомых нерепрезентативен - он не очень-то похож на генеральную совокупность. Об этом надо помнить и не спешить делать слишком поспешных выводов буквально из ничего.
Оценили 16 человек
33 кармы