Андрей Микитюк (amikityuk) wrote,
Андрей Микитюк
amikityuk

Categories:

Парадокс Симпсона

В статистике есть забавное явление, которое называется «Парадокс Симпсона». Работает это так. Предположим, что мы хотим изучить гендерную дискриминацию, и собрали следующие данные (все цифры вымышлены).

Мы изучили по 1000 кандидатов, которые подавали заявления в компании Microsoft и Google. В компанию Microsoft подавали заявление 100 мужчин и 900 женщин, а в компанию Google – наоборот, 900 мужчин и 100 женщин. Уровень приема на работу следующий: в Microsoft: мужчины – 10% (10 из 100), женщины 20% (180 из 900); в Google – мужчины 50% (450 из 900), женщины 80% (80 из 100).



Несложно заметить, что существует откровенная дискриминация в отношении мужчин: в обеих компаниях их шансы устроиться на работу ниже, чем у женщин (10% против 20% в Microsoft, 50% против 80% в Google). Статья “Победа толерантности над здравым смыслом: у мужчин меньше шансов устроиться в технологические компании” практически готова. А теперь следите за руками.

Если мы посмотрим данные по обеим компаниям вместе, то получится, что из 1000 мужчин смогли устроиться на работу 460 (т.е. 46%), а из 1000 женщин – всего 260 (26%). Упс. Обмана нет: комбинированный результат действительно противоположен «сумме» отдельных.



Если присмотреться, то можно заметить, что в первом случае мы сравниваем неравные выборки (900 мужчин против 100 женщин и наоборот), а во втором – одинаковые (1000 мужчин против 1000 женщин), что и позволяет (при определенных условиях) такую манипуляцию. При этом манипуляция абсолютно незаметна, если у читателя нет доступа к исходным данным, а есть только итоговые процентные соотношения. Скажите, круто?
Tags: статистика
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 3 comments