Определение размера выборки это акт выбора количества наблюдений или копирует включить в статистическая выборка. Размер выборки — важная особенность любого эмпирического исследования, цель которого — сделать выводы Об численность населения по образцу.
На практике размер выборки, используемой в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости предоставления достаточных данных. статистическая мощность. В сложных исследованиях может быть несколько разных размеров выборки: например, в стратифицированный опрос для каждого слоя будут разные размеры. В перепись, данные ищутся для всей генеральной совокупности, следовательно, предполагаемый размер выборки равен генеральной совокупности. В экспериментальная конструкция, где исследование можно разделить на разные лечебные группы, для каждой группы могут быть разные размеры выборки.
Объем выборки можно выбрать несколькими способами:
- используя опыт — небольшие выборки, хотя иногда и неизбежны, могут привести к большим доверительные интервалы и риск ошибок в статистическая проверка гипотез.
- использование целевой дисперсии для оценки, которая должна быть получена из выборки, полученной в конечном итоге, то есть если требуется высокая точность (узкий доверительный интервал), это приводит к низкой целевой дисперсии оценщика.
- используя мишень для силы статистический тест наносить после взятия пробы.
- с использованием уровня достоверности, т. е. чем больше требуемый уровень достоверности, тем больше размер выборки (с учетом требования постоянной точности).
- 1 Вступление
- 2 Оценка
- 2.1 Оценка пропорции
- 2.2 Оценка среднего
- 3.1 Столы
- 3.2 Уравнение ресурсов Мида
- 3.3 Кумулятивная функция распределения
Вступление
Большие размеры выборки обычно приводят к увеличению точность когда оценка неизвестные параметры. Например, если мы хотим узнать долю определенного вида рыб, инфицированных патогеном, мы обычно можем получить более точную оценку этой доли, если бы мы взяли и исследовали 200, а не 100 рыб. Несколько фундаментальных фактов математической статистики описывают это явление, в том числе закон больших чисел и Центральная предельная теорема.
В некоторых ситуациях повышение точности для больших размеров выборки минимально или даже отсутствует. Это может произойти из-за наличия систематические ошибки или сильный зависимость в данных, или если данные соответствуют распределению с тяжелым хвостом.
Размеры выборки можно оценить по качеству полученных оценок. Например, если оценивается пропорция, можно пожелать, чтобы 95% доверительный интервал быть менее 0,06 единицы шириной. В качестве альтернативы размер выборки можно оценить на основе мощность проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, мы можем пожелать иметь 80% мощности, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.
Оценка
Оценка пропорции
Основная статья: Доля населения
Относительно простая ситуация — оценка пропорция. Например, мы можем захотеть оценить долю жителей в сообществе, которым исполнилось 65 лет.
В оценщик из пропорция является п ^ = Икс / п < displaystyle < hat
> = X / n> , куда Икс количество «положительных» наблюдений (например, количество людей из п отобранные люди в возрасте от 65 лет). Когда наблюдения независимый, эта оценка имеет (масштабированный) биномиальное распределение (а также образец иметь в виду данных из Распределение Бернулли ). Максимум отклонение этого распределения составляет 0,25п, что происходит при истинном параметр является п = 0,5. На практике, поскольку п неизвестно, максимальная дисперсия часто используется для оценки размера выборки. Если известна разумная оценка p, то величина п ( 1 − п ) < displaystyle p (1-p)>может использоваться вместо 0,25.
Для достаточно больших п, распределение п ^ < displaystyle < hat
>> будут близко аппроксимированы нормальное распределение. [1] Используя это и Метод Вальда для биномиального распределения, дает доверительный интервал вида
( п ^ − Z 0.25 п , п ^ + Z 0.25 п ) < displaystyle left (< widehat
> — Z < sqrt < frac >>, quad < widehat
> + Z < sqrt < frac ) >> right)> , где Z — стандартная Z-оценка для желаемого уровня достоверности (1,96 для 95% доверительного интервала).
Если мы хотим иметь доверительный интервал, равный W единиц по ширине (W / 2 на каждой стороне выборочного среднего), мы решим
за п, что дает размер выборки
п = Z 2 W 2 < Displaystyle п = < гидроразрыва > >>> , в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W / 2 = погрешность.)
В противном случае формула была бы такой Z п ( 1 − п ) п = W / 2 < Displaystyle Z < sqrt < frac
>> = W / 2> , что дает п = 4 Z 2 п ( 1 − п ) W 2 < Displaystyle п = < гидроразрыва p (1-p)> >>> .
Например, если нас интересует оценка доли населения США, поддерживающей конкретного кандидата в президенты, и мы хотим, чтобы ширина 95% доверительного интервала составляла не более 2 процентных пунктов (0,02), тогда нам потребуется размер выборки. из (1.96 2 )/(0.02 2 ) = 9604. В этом случае разумно использовать оценку 0,5 для p, потому что президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. В погрешность в данном случае — 1 процентный пункт (половина 0,02).
Сказанное обычно упрощается .
сформирует 95% доверительный интервал для истинной пропорции. Если этот интервал должен быть не более W единиц шириной, уравнение
можно решить для п, уступая [2] [3] п = 4/W 2 = 1/B 2 куда B — граница ошибки оценки, т.е. оценка обычно дается как в пределах ± B. Таким образом, для B = 10% требуется п = 100, для B = 5% нужно п = 400, для B = 3% требование приближается к п = 1000, а для B = 1% размер выборки п = 10000 требуется. Эти цифры часто цитируются в новостях опросы мнений и другие выборочные опросы. Однако всегда помните, что сообщаемые результаты могут не соответствовать точному значению, поскольку числа предпочтительно округлять в большую сторону. Зная, что ценность п — минимальное количество выборок, необходимое для получения желаемого результата, тогда количество респондентов должно быть не меньше минимума.
Оценка среднего
Пропорция — это частный случай среднего. При оценке совокупности среднее значение с использованием независимой и одинаково распределенной (iid) выборки размера п, где каждое значение данных имеет дисперсию σ 2 , то стандартная ошибка выборочного среднего составляет:
Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. С использованием Центральная предельная теорема для обоснования аппроксимации выборочного среднего с нормальным распределением дает доверительный интервал вида
( Икс ¯ − Z σ п , Икс ¯ + Z σ п ) < displaystyle left (< bar > — < frac < sqrt >>, quad < bar > + < frac < sqrt >> right)> , где Z — стандартная Z-оценка для желаемого уровня достоверности (1,96 для 95% доверительного интервала).
Если мы хотим иметь доверительный интервал, равный W единиц по ширине (W / 2 на каждой стороне выборочного среднего), мы решим
за п, что дает размер выборки
Например, если мы заинтересованы в оценке степени, на которую лекарство снижает кровяное давление субъекта, с доверительным интервалом 95% шириной в шесть единиц, и мы знаем, что стандартное отклонение кровяного давления в популяции составляет 15, тогда требуемый размер выборки 4 × 1.96 2 × 15 2 6 2 = 96.04 < displaystyle < frac times 15 ^ > <6 ^ >> = 96,04> , которое будет округлено до 97, поскольку полученное значение является минимум размер выборки и размеры выборки должны быть целыми числами и не должны превышать рассчитанный минимум.
Необходимые размеры выборки для проверки гипотез
Обычная проблема, с которой сталкиваются статистики, — это вычисление размера выборки, необходимого для получения определенного мощность для теста, учитывая заранее определенный Ошибка типа I ставка α. Как показано ниже, это можно оценить с помощью заранее определенных таблиц для определенных значений, с помощью уравнения ресурсов Мида или, в более общем смысле, с помощью кумулятивная функция распределения:
Столы
| 84 | 14 | 6 |
| 193 | 32 | 13 |
| 246 | 40 | 16 |
| 310 | 50 | 20 |
| 393 | 64 | 26 |
| 526 | 85 | 34 |
| 651 | 105 | 42 |
| 920 | 148 | 58 |
Таблица, показанная справа, может использоваться в двухвыборочный t-критерий для оценки размеров выборки экспериментальная группа и контрольная группа которые имеют равный размер, то есть общее количество людей в испытании вдвое больше указанного числа, и желаемое уровень значимости составляет 0,05. [4] Используемые параметры:
- Желаемый статистическая мощность испытания, показанного в столбце слева.
- Коэна d (= размер эффекта), что является ожидаемой разницей между средства целевых значений между экспериментальной группой и контрольная группа, деленное на ожидаемое стандартное отклонение.
Уравнение ресурсов Мида
Уравнение ресурсов Мида часто используется для оценки размеров выборки лабораторные животные, а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов при оценке размера выборки, но дает намек на то, что является подходящим размером выборки, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить. [5]
Фактически, все параметры в уравнении степени свободы количества их концептов, и, следовательно, их числа вычитаются на 1 перед вставкой в уравнение.
- N общее количество людей или единиц в исследовании (минус 1)
- B это блокирующий компонент, представляющий воздействие окружающей среды, разрешенное в проекте (минус 1)
- Т это компонент лечения, что соответствует количеству лечебные группы (включая контрольная группа ) или количество задаваемых вопросов (минус 1)
- E это степени свободы компонент ошибки, и должно быть где-то между 10 и 20.
Например, если исследование с использованием лабораторных животных планируется с четырьмя группами лечения (Т= 3), по восемь животных в группе, всего 32 животных (N= 31), без дальнейшего стратификация (B= 0), то E будет равно 28, что выше порогового значения 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими. [6]
Кумулятивная функция распределения
Позволять Икся, я = 1, 2, . п быть независимыми наблюдениями, взятыми из нормальное распределение с неизвестным средним μ и известной дисперсией σ 2 . Рассмотрим две гипотезы: нулевая гипотеза:
и альтернативная гипотеза:
ЧАС а : μ = μ ∗ < displaystyle H_ : mu = mu ^ >
для некоторой «наименьшей значимой разницы» μ * > 0. Это наименьшее значение, при котором мы хотим наблюдать разницу. Теперь, если мы хотим (1) отклонить ЧАС0 с вероятностью не менее 1 -β когдаЧАСа верно (т.е. мощность из 1 -β) и (2) отклонить ЧАС0 с вероятностью α, когда ЧАС0 верно, то нам понадобится следующее:
Если zα — верхняя α процентная точка стандартного нормального распределения, тогда
‘Отклонять ЧАС0 если наша выборочная средняя ( Икс ¯ < displaystyle < bar >> ) больше чем z α σ / п < displaystyle z _ < alpha>sigma / < sqrt >> ‘
это правило принятия решения которое удовлетворяет (2). (Это односторонний тест.)
Теперь мы хотим, чтобы это произошло с вероятностью не менее 1 -β когдаЧАСа правда. В этом случае среднее значение по нашей выборке будет получено из нормального распределения со средним μ * . Следовательно, мы требуем
Путем осторожных манипуляций это можно показать (см. Статистическая мощность # Пример ) случиться, когда
п ≥ ( z α + Φ − 1 ( 1 − β ) μ ∗ / σ ) 2 < displaystyle n geq left (< frac + Phi ^ (1- beta)> < mu ^ / sigma>> right) ^ < 2>>
Размер стратифицированной выборки
С более сложными методами отбора проб, такими как стратифицированная выборка, образец часто можно разделить на подвыборки. Обычно, если есть ЧАС такие подвыборки (из ЧАС разные страты), то каждый из них будет иметь размер выборки пчас, час = 1, 2, . ЧАС. Эти пчас должен соответствовать правилу, что п1 + п2 + . + пЧАС = п (т.е. общий размер выборки определяется как сумма размеров подвыборки). Выбор этих пчас оптимально можно сделать различными способами, используя (например) оптимальное распределение Неймана.
Есть много причин использовать стратифицированную выборку: [7] для уменьшения дисперсии оценок выборки, использования частично неслучайных методов или изучения слоев по отдельности. Полезным, частично неслучайным методом может быть выборка отдельных лиц там, где они легко доступны, а где нет, выборка кластеров для экономии транспортных расходов. [8]
В общем, для ЧАС страты, средневзвешенное значение выборки
Икс ¯ ш = ∑ час = 1 ЧАС W час Икс ¯ час , < displaystyle < bar > _ = sum _ ^ W_ < bar > _ ,>
Вар ( Икс ¯ ш ) = ∑ час = 1 ЧАС W час 2 Вар ( Икс ¯ час ) . < displaystyle operatorname (< bar > _ ) = sum _ ^ W_ ^ operatorname (< бар > _ ).> [9]
Веса, W час < displaystyle W_ > , часто, но не всегда, представляют собой пропорции элементов населения в стратах, и W час = N час / N < displaystyle W_ = N_ / N> . Для фиксированного размера выборки, то есть п = ∑ п час < displaystyle n = сумма n_ > ,
Вар ( Икс ¯ ш ) = ∑ час = 1 ЧАС W час 2 Вар ( Икс ¯ час ) ( 1 п час − 1 N час ) , < displaystyle operatorname (< bar > _ ) = sum _ ^ W_ ^ operatorname (< bar > _ ) left ( < frac > — < frac > right),> [10]
который можно свести к минимуму, если частота выборки внутри каждой страты делается пропорционально стандартному отклонению внутри каждой страты: п час / N час = k S час < displaystyle n_ / N_ = kS_ > , куда S час = Вар ( Икс ¯ час ) < displaystyle S_ = < sqrt < operatorname (< bar > _ )>>> и k < displaystyle k>константа такая, что ∑ п час = п < Displaystyle сумма > = п> .
«Оптимальное распределение» достигается, когда частота дискретизации внутри страт прямо пропорциональна стандартным отклонениям внутри страты и обратно пропорциональна квадратному корню из стоимости выборки на элемент внутри страт, C час < displaystyle C_ > :
куда K < displaystyle K>константа такая, что ∑ п час = п < Displaystyle сумма > = п> , или, в более общем смысле, когда
Качественное исследование
При определении размера выборки в качественных исследованиях используется другой подход. Как правило, это субъективное суждение, принимаемое по ходу исследования. [13] Один из подходов состоит в том, чтобы продолжать включать других участников или материал, пока насыщенность достигнуто. [14] Число, необходимое для достижения насыщения, было исследовано эмпирически. [15] [16] [17] [18]
Существует нехватка надежных указаний по оценке размеров выборки перед началом исследования с рядом приведенных предложений. [16] [19] [20] [21] Инструмент, похожий на количественный расчет мощности, основанный на отрицательное биномиальное распределение, был предложен для тематический анализ. [22] [21]
Смотрите также
- Математический портал
- Дизайн экспериментов
- Пример инженерной поверхности отклика под Пошаговая регрессия
- Коэна h
Примечания
- ^NIST /SEMATECH, «7.2.4.2. Требуемые размеры выборки», Электронный справочник статистических методов.
- ^«Вывод для регресса». utdallas.edu.
- ^«Доверительный интервал для пропорции»В архиве 2011-08-23 на Wayback Machine
- ^ абГлава 13, стр. 215, в: Кенни, Дэвид А. (1987). Статистика для социальных и поведенческих наук. Бостон: Маленький, Браун. ISBN978-0-316-48915-7 .
- ^ аб Кирквуд, Джеймс; Роберт Хубрехт (2010). Справочник UFAW по уходу за лабораторными и другими исследовательскими животными и управлению ими. Вили-Блэквелл. п. 29. ISBN978-1-4051-7523-4 .
- онлайн Страница 29
- ^Isogenic.info> Уравнение ресурсов пользователя Michael FW Festing. Обновлено сентябрь 2006 г.
- ^ Киш (1965, раздел 3.1)
- ^ Киш (1965), стр. 148.
- ^ Киш (1965), стр. 78.
- ^ Киш (1965), стр. 81.
- ^ Киш (1965), стр. 93.
- ^ Киш (1965), стр. 94.
- ^ Санделовски, М. (1995). Размер выборки при качественном исследовании. Исследования в области сестринского дела и здравоохранения, 18, 179–183
- ^ Глейзер, Б. (1965). Постоянный сравнительный метод качественного анализа. Социальные проблемы, 12, 436–445
- ^ Фрэнсис, Дж. Дж., Джонстон, М., Робертсон, К., Глидуэлл, Л., Энтвистл, В., Экклс, М. П., и Гримшоу, Дж. М. (2010). Каков адекватный размер выборки? Использование насыщенности данными для теоретических интервью. Психология и здоровье, 25, 1229–1245. Дои:10.1080/08870440903194015
- ^ абГость, Г., Банс, А., и Джонсон, Л. (2006). Сколько интервью достаточно ?: эксперимент с насыщением и вариативностью данных. Полевые методы, 18, 59–82. Дои:10.1177 / 1525822X05279903
- ^Райт, А., Мэлони, Ф. Л., и Фебловиц, Дж. К. (2011). Отношение клиницистов к электронным спискам проблем и их использование: тематический анализ. BMC Медицинская информатика и принятие решений, 11, 36. Дои:10.1186/1472-6947-11-36
- ^«Размер выборки и насыщенность в исследованиях PhD с использованием качественных интервью — Мейсон — Forum Qualitative Sozialforschung / Forum: Качественные социальные исследования». Qualitative-research.net. 11 (3). 2010-08-24.
- ^ Эммель, Н. (2013). Отбор и выбор случаев в качественном исследовании: реалистичный подход. Лондон: Мудрец.
- ^Onwuegbuzie, A. J., Potts HWW (10 февраля 2015 г.). «Поддержка размышлений о размерах выборки для тематического анализа: количественный инструмент» (PDF) . Международный журнал методологии социальных исследований. 18 (6): 669–684. Дои:10.1080/13645579.2015.1005453. S2CID59047474.
- ^ Гэлвин Р. (2015). Сколько интервью достаточно? Обеспечивают ли качественные интервью при исследовании энергопотребления здания надежные знания? Журнал строительной техники, 1: 2–12.
Рекомендации
- Bartlett, J.E., II; Kotrlik, J. W .; Хиггинс, К. (2001). «Организационное исследование: определение подходящего размера выборки для опросного исследования» (PDF) . Журнал информационных технологий, обучения и производительности. 19 (1): 43–50.
- Киш, Л. (1965). Выборка обследования . Вайли. ISBN978-0-471-48900-9 .
- Смит, Скотт (8 апреля 2013 г.). «Определение размера выборки: как убедиться, что вы получаете правильный размер выборки». Qualtrics . Получено 19 сентября 2018 .
- Израиль, Гленн Д. (1992). «Определение размера выборки». Университет Флориды, PEOD-6 . Получено 29 июн 2019 .
- Ренс ван де Шут, Милица Миочевич (ред.). 2020. Решения для малых выборок (открытый доступ): руководство для прикладных исследователей и практиков. Рутледж.
дальнейшее чтение
- NIST: выбор размеров образцов
- ASTM E122-07: Стандартная практика расчета размера выборки для оценки с заданной точностью среднего значения для характеристики партии или процесса
Источник: wikinlu.ru
Практические способы построения выборки в исследованиях и опросах
Предисловие редакции HT.ru:
Данная статья адресована, в первую очередь, маркетологам и социологам, которые занимаются проведением массовых опросов и исследований. Но нам бы хотелось, чтобы с этим материалом были знакомы наши hr-ы. Даже если Вы еще никогда не занимались проведением опросов в своей организации, поверьте, Вам предстоит когда-нибудь столкнуться с этой интереснейшей областью работы.
И одной из первых проблем, которая встанет перед Вами, будет вопрос «Кого привлекать к опросу?». Скажем так, данная статья не даст простого и четкого ответа на этот, в действительности, непростой вопрос. Но, прочитав ее, Вы сможете по-новому, осмысленнее и более профессионально взглянуть на тот фронт работ, который представляет собой проведение опросов. Например, Вы сможете предугадать, чьи ответы Вы получите в случае, когда опрос в организации будут проходить «все желающие».

Автор статьи: Игopь Cтанислaвович Бepeзин, консультант по маркетинговым стратегиям, президент Гильдии мapкетoлoгов (г. Моcква).
Опрос и анкетирование являются ведущими, универсальными методами проведения социологических и маркетинговых исследований. Чаше всего, когда говорят о маркетинговом исследовании — сборе первичной информации, имеют в виду именно опрос или анкетирование, предполагающие прямое выяснение, непредвзятого мнения достаточно многочисленной группы респондентов.
Массовым считается опрос, в ходе которого путем личной беседы сотрудника исследовательской компании — интервьюера с носителями информации (респондентами), состоящей из нескольких десятков коротких вопросов, изучаются мнения нескольких сотен (тысяч) человек. Под анкетированием понимают безличную форму общения исследователей с носителями информации, при которой респонденты самостоятельно отвечают на вопросы анкеты, следуя содержащейся в ней инструкции и не вступая в непосредственный контакт с интервьюерами.
Конечной целью анкетирования и массового опроса является получение данных, характеризующих так называемую генеральную совокупность. Генеральная совокупность — это все представители какой-либо группы, носители какого-либо важного признака, например:
все российские избиратели;
все потенциальные потребители пива, проживающие в Перми;
все подростки (12-16 лет) Поволжского региона;
все учителя физики и химии, работающие в средних школах;
все домохозяйства, имеющие доход от 500 до 1 500 долл. в месяц;
все компании, занимающиеся розничной торговлей в Самаре и т. д. и т. п.
Для того чтобы опросить десятки или сотни тысяч, а тем более — миллионы человек (компаний), из которых может состоять генеральная совокупность, нужны сотни или даже тысячи интервьюеров. На проведение подобного исследования могут понадобиться десятки, если не сотни миллионов долларов и не менее полугода напряженной работы. Такое возможно только при переписи населения (проводящейся не чаще одного раза в 10 лет).
Однако в маркетинге этого и не требуется. Достаточно того, чтобы относительно небольшая выборка (от нескольких сотен до нескольких тысяч представителей) репрезентировала (выразила) мнение генеральной совокупности. Как такое возможно? На каком основании можно распространять данные, полученные от небольшой группы людей, на существенно (в десятки и сотни раз) большую группу? На основании гипотезы о том, что на поведение, знания, отношение потребителей к компании, товару, услуге или отдельных их компонентов оказывают влияние социально-демографические характеристики самих потребителей.
Иными словами, большинство представителей четко определенной социально-демографический группы будут сходным образом реагировать на внешние, в данном случае — рыночные стимулы: товар, цену, упаковку, рекламу и т. д. и т. п. И нет никакой необходимости опрашивать всех представителей этой группы, поскольку ее мнение (с допустимой погрешностью) может представить (репрезентировать) небольшая выборка из ее представителей.
Способы построения выборки
Существуют две группы методов построения выборки , в той или иной степени реализующих репрезентацию мнений и позиций генеральной совокупности: вероятностные и детерминированные.
Первая группа методов (вероятностные) базируется на использовании теории вероятности. В основе ее применения лежит постулат, что репрезентация будет достигнута в случае, если каждой единице генеральной совокупности обеспечено равновероятное попадание в выборку. Например, если генеральной совокупностью является все взрослое (16-85 лет) население города (200 тыс. человек), то каждому жителю должна быть обеспечена вероятность стать участником исследования(попасть в выборку), равная 1 / 200 000. В противном случае выборка будет не случайной, а смещенной, т. е. менее репрезентативной.
Реализовать это можно в случае, если все элементы генеральной совокупности могут быть тем или иным образом пронумерованы, а затем эти номера будут выбраны в определенной последовательности — «по воле случая». Например, в Москве около 2 500 средних школ, каждаяиз которых имеет свой номер. Мы могли бы выбрать наугад 100 номеров и провести опрос 100 директоров (завучей, учителей физики, классных руководителей 11-х классов и т. п.) в этих школах.
Эти 100 номеров мы можем выбрать с помощью таблицы или «генератора случайных чисел» (есть такая специальная компьютерная программа), а также с помощью «барабана» но принципу того, как это делается при проведении лотереи. Такие способы построения выборки называются «простой случайной выборкой» . Каждый ее элемент отбирается независимо и имеет равную вероятность попасть в выборку.
