The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Более половины опрошенных американцев используют блокировщики рекламы, opennews (??), 28-Мрт-24, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


75. "Более половины опрошенных американцев используют блокировщик..."  +4 +/
Сообщение от Аноним (-), 28-Мрт-24, 11:15 
> Надо полагать что исследование провели просто неправильно, ибо по выборке в 2000 пользователей давать какие-то заключения это бред

Не надо полагать. Ты можешь проверить это вычислительно. Берёшь разные гипотезы, типа распределения мнений 10:90 или 50:50, делаешь из такого распределения сотню выборок по 2k, считаешь расклад в каждой выборке, потом дисперсию этих раскладов. Двигаясь таким подходом, ты чисто вычислительно, не всекая в теорвер и комбинаторику, можешь получить диапазон исходных распределений мнений, который с вероятностью 90%+ даст те результаты на выборке, которые ты наблюдаешь.

Альтернативно ты можешь почитать про теорвер и посчитать это ручкой по бумажке, без вычислительно натужных моделирований.

Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору

93. "Более половины опрошенных американцев используют блокировщик..."  +/
Сообщение от Аноним324 (ok), 28-Мрт-24, 11:55 
но эти клоуны не брали сотню выборок по 2к, они взяли одну, и в лучших традициях исследований частных контор просто экстраполировали данные. Всё. Их исследование полный ноль, не имеет ничего общего с реальностью.
Ответить | Правка | Наверх | Cообщить модератору

117. "Более половины опрошенных американцев используют блокировщик..."  +2 +/
Сообщение от Аноним (-), 28-Мрт-24, 13:21 
> но эти клоуны не брали сотню выборок по 2к

Нет нужды. Сотни выборок тебе понадобятся для того, чтобы вывести общую формулу перехода распределения по выборке к распределению по пространству гипотез. При знании теорвера и матана это можно проделать без единой выборки чисто аналитически.

Легко считаются прямые вероятности: когда ты знаешь распределение по генеральной совокупности, ты можешь легко посчитать какие результаты ты можешь получить на случайной выборке и с какими вероятностями. Вот в обратную сторону сложнее: если у тебя есть результат измеренный на выборке, то определить какие гипотезы и с какими вероятностями тебе дадут такой результат...

В качестве спойлера: если выборка в 2k делится +-пополам, то ты можешь поставить знак равенства между результатом выборки и гипотезой. Вот если выборка поделилась на группы, из которых одна меньше 15 точек данных содержит, вот тогда надо задуматься, прежде чем переходить от эмпирики к вероятностям гипотез. Лучше при этом держать для себя планку повыше, и требовать 30 точек в группе.

> лучших традициях исследований частных контор просто экстраполировали данные

Ну вот не надо, все это лучшие традиции практически всех исследований. Физики, меряя заряд электрона, не меряют заряды всех электронов Вселенной. Статистика на то и нужна, чтобы сделать исследования достаточно дешёвыми, чтобы они стали практичными.

Если тебе очень хочется придраться к исследованию, и разгромить его как запоротое, то я рекомендую посмотреть на другое. Все рассуждения, которые я тебе привёл, исходят из допущения рандомности выборки, или, если более точно, из допущения, что метод набора людей в выборку не коррелирует с измеряемыми характеристиками. И в _любом_ исследовании, которое типа случайную выборку набирает, всегда можно найти к чему придраться в этом смысле, потому что не существует способа выбрать случайного американца (или русского, или представителя любой другой группы, типа геев или сантехников). Если ты подумаешь, ты поймёшь почему.

Но здесь же, особенно непонятно как избавиться от корреляции. Паранойя о приватности коррелирует с использованием адблокеров и с готовностью участвовать в опросах. То есть надо транзитивно ожидать корреляции между попаданием в выборку и использованием адблокера. Это, конечно же, умозрительное рассуждение, но выглядит очень правдоподобным, так? Вот пускай теперь авторы исследования отдуваются, измеряют эту корреляцию (как интересно, лол, если она в метод опросов фундаментальным камнем заложена), и показывают как это влияет на достоверность вывода.

Твои же попытки докопаться к генерализации с рандомной выборки в 2k на генсовокупность довольно унылы, на самом деле. Надо докапываться к рандомности выборки и показывать, что она не рандомна и что это может быть очень сильно влиять на результаты. Более того, я вот заглянул в pdf и там в разделе methodolody вообще ничего не сказано про выборку, никаких попыток показать репрезентативность выборки (то есть что она позволяет обобщать на генсовокупность), только какая-то отсылка к ESOMAR principles. Я не знаю, что это за принципы, но если эти принципы не требуют разбора репрезентативности выборки, то не принципы и были.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру