23. Определение необходимой численности выборки

Численность выборки должна обеспечивать требуемую точность, при которой пределы возможной ошибки не превысят некоторой, наперед заданной величины. До того как произвести отбор, необходимо определить, какова будет численность выборочной совокупности, т.е. определить, сколько единиц следует отобрать из генеральной совокупности в выборку. Эта задача решается с помощью формулы предельной ошибки выборки.

Формула для определения необходимой численности выборки выводится из формулы предельной ошибки выборки:

Следовательно,

Из последней формулы видно, что необходимая численность выборки зависит от трех параметров: коэффициента доверия t , предельной ошибки А, дисперсии σ 2. Величина допустимой ошибки выборки и уровень вероятности, а следовательно, и значение коэффициента t задаются самим исследователем. При этом не следует гнаться за чрезмерно большими значениями t и чрезмерно малыми значениями σ 2, так как это ведет к увеличению объема выборочного наблюдения n , а следовательно, к увеличению затрат средств, труда и времени, не вызванных необходимостью. Значение коэффициента доверия t находят по специальной таблице, где каждому значению коэффициента ставится в соответствие значение уровня вероятности.

Сложнее определить дисперсию, которая неизвестна. В связи с этим используют следующие способы приближенной оценки дисперсии:

1) проводят пробное обследование небольшой части совокупности. На его основе определяется величина дисперсии, используемая в качестве оценки генеральной дисперсии если структура совокупности и условия ее развития достаточно стабильны, оценкой генеральной дисперсии может служить выборочная дисперсия, полученная по результатам предшествующего выборке наблюдения;

3) находят дисперсию из соотношения

 если известна примерная величина средней;

4) определяют среднее квадратическое отклонение в соответствии с правилом «трех сигм»:

, если известны максимальное и минимальное значения изучаемого признака в совокупности (хmax и хmin), Правило показывает, что при нормальном распределении размах вариации не превышает 6σ (±3σ);

5) устанавливают для относительной величины максимальную величину дисперсии равной σ 2 max = 0,5 х 0,5 = 0,25 ;

6) принимают при выборочном наблюдении альтернативного признака долю, равную w = 0,5, а дисперсия — σ2 = 0,25. Необходимая численность выборки при изучении альтернативного признака определяется формулой: