Уход и... Инструменты Дизайн ногтей

Выборочная совокупность часть генеральной совокупности. Генеральная совокупность и выборка

Совокупность однородных объектов часто исследуют относительно какого-либо признака, характеризующего их, измеренного количественно либо качественно.

К примеру, если имеется партия деталей, то количественным признаком может быть размер детали по ГОСТу, а качественным - стандартность детали.

В случае необходимости их проверки на соответствие стандартам иногда прибегают к сплошному обследованию, но на практике это применяется крайне редко. К примеру, если генеральная совокупность содержит огромное количество изучаемых объектов, то практически невозможно проводить сплошное обследование. В таком случае из всей совокупности отбирают определенное число объектов (элементов) и их исследуют. Таким образом, имеется генеральная и выборочная совокупность.

Генеральной называют совокупность всех объектов, которые подвергаются обследованию или изучению. Генеральная совокупность, как правило, содержит в себе конечное число элементов, но если оно слишком велико, то с целью упрощения математических вычислений допускается, что вся совокупность состоит из бесчисленного числа объектов.

Выборкой или выборочной совокупностью называется часть отобранных элементов из всей совокупности. Выборка может быть повторной либо бесповторной. В первом случае её возвращают в генеральную совокупность, во втором - нет. В практической деятельности чаще используют бесповторный случайный отбор.

Генеральная совокупность и выборка должны быть связаны между собой репрезентативностью. Говоря по другому, для того, чтобы по характеристикам выборочной совокупности можно было уверенно определять признаки всей совокупности, надо, чтобы элементы выборки максимально точно их представляли. Иными словами, выборка должна быть представительной (репрезентативной).

Выборка будет более или менее репрезентативной, если она производится случайно из очень большого числа всей совокупности. Это можно утверждать на основе так называемого закона больших чисел. При этом все элементы имеют равную вероятность попасть в выборку.

Имеются различные варианты отбора. Все эти способы в принципе можно разделить на два варианта:

  • Вариант 1. Отбираются элементы, когда генеральная совокупность не делится на части. К этому варианту можно отнести простой случайный повторный и бесповторный отборы.
  • Вариант 2. Генеральная совокупность разделяется на части и производится отбор элементов. Сюда можно отнести типический, механический и серийный отборы.

Простой случайный - отбор, при котором элементы извлекаются по одному из всей совокупности случайным образом.

Типический - это отбор, при котором элементы отбираются не из всей совокупности, а из всех её «типических» частей.

Механический - это такой отбор, когда всю совокупность разделяют на количество групп, равное числу элементов, которое должно быть в выборке, и, соответственно, из каждой группы выбирается один элемент. К примеру, если надо отобрать 25% деталей, изготовленных станком, то выбирают каждую четвёртую деталь, а если требуется отобрать 4% деталей, то выбирают каждую двадцать пятую деталь и так далее. При этом необходимо сказать, что иногда механический отбор может не обеспечивать достаточной

Серийный - это такой отбор, при котором элементы отбирают из всей совокупности «сериями», подвергаемыми сплошному исследованию, а не по одному. К примеру, когда детали изготавливаются большим числом станков-автоматов, то сплошное обследование проводится только в отношении продукции нескольких станков. Серийный отбор используют, если исследуемый признак имеет незначительную вариативность в разных сериях.

С целью уменьшения погрешности применяют оценки генеральной совокупности с помощью выборочной. Причем выборочный контроль может быть как одноступенчатым, так и многоступенчатым, что повышает надежность обследования.

Всякое каким-то образом выделенное множество объектов, которые могут отличаться друг от друга значением некоторой определенной характеристики, называется генеральной совокупностью.

Число элементов генеральной совокупности называется ее объемом.

Часть генеральной совокупности, случайным образом отобранная для наблюдений, называется случайной выборкой или, для краткости, выборкой.

Число элементов выборки называется ее объемом.

Так, если из ста тысяч упаковок некоторого лекарства (генеральная совокупность) для контроля качества отобрано сто упаковок (выборка), то объем генеральной совокупности составляет 100000, а объем выборки – 100.

Свойства выборочной совокупности тем лучше отражают соответствующие свойства генеральной совокупности, чем больше объектов содержит эта выборочная совокупность (т.е. чем больше ее объем). Например, если интересует концентрация некоторого вещества в таблетках, выпускаемых при помощи аппарата определенной конструкции, то чем больше случайным образом отобранных таблеток мы исследуем, тем более достоверную информацию получим.

Поскольку мы рассчитываем с помощью статистических методов высказать определенное суждение о свойствах генеральной совокупности по свойствам выборки, то последняя должна быть репрезентативной (представительной), т.е. должна быть организована таким образом, чтобы, по возможности, отражать все интересующие нас свойства генеральной совокупности.

Например, при обследовании на предмет успеваемости по физиологии студентов медицинских университетов А, В и С, в которых обучаются 500, 200 и 300 студентов соответственно, выборку объемом 100 следует строить так, чтобы в нее входило 50 случайным образом выбранных студентов университета А, 20 студентов университета В и 30 студентов университета С. Пропорции в выборке должны соответствовать пропорциям генеральной совокупности.

Для обеспечения репрезентативности выборка должна быть достаточно объемной с тем, чтобы охватывать всю генеральную совокупность, и производиться беспристрастно по отношению к отдельным ее частям.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. На практике обычно пользуются бесповторным случайным отбором.

На практике применяются различные способы отбора. Принудительно эти способы можно подразделить на два вида:
I. Отбор, не требующий расчленения генеральной совокупности на части, сюда относятся:
а) простой случайный бесповторный отбор;
б) простой случайный повторный отбор.
II. Отбор, при котором генеральная совокупность разбивается на части, сюда относятся:
а) типический отбор;
б) механический отбор;
в) серийный отбор.

Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Если извлеченные карточки не возвращать в пачку, то выборка будет простой случайной бесповторной.

Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части.

Механическим называют отбор, при котором генеральная совокупность «механически» делится на столько групп, сколько объектов должно войти в выборку, и из каждой группы отбирается один объект.
Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию.

Математическая статистика – это раздел математики, изучающий приближенные методы отыскания законов распределения и числовых характеристик по результатам эксперимента.

Генеральная совокупность – это множество всех мыслимых значений наблюдений (объектов), однородных относительно некоторого признака, которые смогли быть сделаны.

Выборка это совокупность случайно отобранных наблюдений (объектов) для непосредственного изучения из генеральной совокупности.

Статистическое распределение – это совокупность вариант x i и соответствующих им частот n i .

Гистограмма частот – это ступенчатая фигура, состоящая из смежных прямоугольников, построенных га оной прямой, основания которых одинаковы и равны ширине класса, а высота равна или частоте попадания в интервал n i или относительной частоте n i /n. Ширину интервала i можно определить по формуле Стерджеса :

I=(x max -x min)/(1+3,32lgn),

Где x max – максимальное; x min – минимальное значение вариант, а их разность носит название вариационный размах ; n – объем выборки.

Полигон частот – ломаная линия, отрезки которой соединяют точки с координатами x i , n i .

5. Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выборочная дисперсия и выборочное среднее квадратическое отклонение).

Мода (М о ) это такое значение варианты, что предшествующее и следующее за ним значения имеют меньшие частоты встречаемости.

Для одномодальных распределений мода – это наиболее часто встречающаяся варианта в данной совокупности.

Для определения моды интервальных рядов служит формула:

M 0 =x ниж +i*((n 2 -n 1 )/(2n 2 -n 1 +n 3 )),

где х ниж – нижняя граница модального класса, т.е. класса с наибольшей частотой встречаемости n 2 ; n 2 – частота модального класса; n 1 – частота класса, предшествующего модальному; n 3 – частота класса, следующего за модальным; i – ширина классового интервала.

Медиана (М е )- это значение признака. Относительно которого ряд распределения делится на 2 равные по объему части.

Выборочная средняя – это среднее арифметическое значение вариант статистического ряда

Выборочная дисперсия – среднее арифметическое квадратов отклонения вариант от их среднего значения:

Среднее квадратическое отклонение это квадратный корень из выборочной дисперсии:

S в =√(S в 2 )

6. Оценка параметров генеральной совокупности по ее выборке (точечная и интервальная). Доверительный интервал и доверительная вероятность.

Числовые значения, характеризующие генеральную совокупность, называются параметрами.

Статистическое оценивание может выполняться двумя способами:

1)точечная оценка – оценка, которая дается для некоторой определенной точки;

2)интервальная оценка – по данным выборки оценивается интервал, в котором лежит истинное значение с заданной вероятностью.

Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке.

Точечная оценка называется состоятельной , если при увеличении объема выборки выборочная характеристика стремится к соответствующей характеристике генеральной совокупности.

Точечная оценка называется эффективной , если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками.

Точечную оценку называют несмещенной , если ее математическое ожидание равно оценивающему параметру при любом объеме выборки.

Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя в:

в = i n i ,

где x i – варианты выборки; n i – частота встречаемости вариант x i ; n – объем выборки.

Интервальная оценка – это числовой интервал, который определяется двумя числами – границами интервала, содержащий неизвестный параметр генеральной совокупности.

Доверительный интервал – это интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность p это такая вероятность, что событие вероятности (1-р) можно считать невозможным. α=1-р – это уровень значимости. Обычно в качестве доверительных вероятностей используют вероятности, близкие к 1. Тогда событие, что интервал накроет характеристику, будет практически достоверным. Это р≥0,95, р≥0,99, р≥0,999.

Для выборки малого объема (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:

в - m t≤≤ в + m t (р≥0,95),

где – генеральное среднее; в – выборочное среднее; t – нормированный показатель распределения Стьюдента с(n-1) степенями свободы, который определяется вероятностью попадания генерального параметра в данный интервал; m – ошибка выборочной средней.

Статистическая совокупность


Статистическая совокупность состоит из материально существующих объектов (Работники, предприятия, страны, регионы), является объектом
статистического исследования . Статистическая совокупность
- множество единиц, обладающих массовостью, типичностью, качественной однородностью и наличием вариации.

Единица совокупности - каждая конкретная единица статистической совокупности.

Одна и таже статистическая совокупность может быть однородна по одному признаку и неоднородна по другому.

Качественная однородность - сходство всех единиц совокупности по какому-либо признаку и несходство по всем остальным.

В статистической совокупности отличия одной единицы совокупности от другой чаще имеют количественную природу. Количественные изменения значений признака разных единиц совокупности называются вариацией.

Вариация признака - количественное изменение признака (для количественного признака) при переходе от одной единицы совокупности к другой.

Признак - это свойство, характерная черта или иная особенность единиц, объектов и явлений, которая может быть наблюдаема или измерена. Признаки делятся на количественные и качественные. Многообразие и изменчивость величины признака у отдельных единиц совокупности называется вариацией .

Атрибутивные (качественные) признаки не поддаются числовому выражению (состав населения по полу). Количественные признаки имеют числовое выражение (состав населения по возрасту).

Показатель - это обобщающая количественно качестванная характеристика какого-либо свойства единиц или совокупности в цельм в конкретных условиях времени и места.

Система показателей - это совокупность показателей всесторонне отражающих изучаемое явление.

Например, изучается зарплата:
  • Признак - оплата труда
  • Статистическая совокупность - все работники
  • Единица совокупности - каждый работник
  • Качественная однородность - начисленная зарплата
  • Вариация признака - ряд цифр

Генеральная совокупность и выборка из нее

Основу статистического исследования составляет множество данных, полученных в результате измерения одного или нескольких признаков. Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений случайной величины , является выборкой , а гипотетически существующая (домысливаемая) - генеральной совокупностью . Генеральная совокупность может быть конечной (число наблюдений N = const ) или бесконечной (N = ∞ ), а выборка из генеральной совокупности - это всегда результат ограниченного ряда наблюдений. Число наблюдений , образующих выборку, называется объемом выборки . Если объем выборки достаточно велик (n → ∞ ) выборка считается большой , в противном случае она называется выборкой ограниченного объема . Выборка считается малой , если при измерении одномерной случайной величины объем выборки не превышает 30 (n <= 30 ), а при измерении одновременно нескольких (k ) признаков в многомерном пространстве отношениеn к k не превышает 10 (n/k < 10) . Выборка образует вариационный ряд , если ее члены являются порядковыми статистиками , т. е. выборочные значения случайной величины Х упорядочены по возрастанию (ранжированы), значения же признака называютсявариантами .

Пример . Практически одна и та же случайно отобранная совокупность объектов - коммерческих банков одного административного округа Москвы, может рассматриваться как выборка из генеральной совокупности всех коммерческих банков этого округа, и как выборка из генеральной совокупности всех коммерческих банков Москвы, а также как выборка из коммерческих банков страны и т.д.

Основные способы организации выборки

Достоверность статистических выводов и содержательная интерпретация результатов зависит от репрезентативности выборки, т.е. полноты и адекватности представления свойств генеральной совокупности, по отношению к которой эту выборку можно считать представительной. Изучение статистических свойств совокупности можно организовать двумя способами: с помощью сплошного инесплошного наблюдения . Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности , анесплошное (выборочное) наблюдение - только его части.

Существуют пять основных способов организации выборочного наблюдения:

1. простой случайный отбор , при котором объектов случайно извлекаются из генеральной совокупности объектов (например с помощью таблицы или датчика случайных чисел), причем каждая из возможных выборок имеют равную вероятность. Такие выборки называются собственно-случайными ;

2. простой отбор с помощью регулярной процедуры осуществляется с помощью механической составляющей (например, даты, дня недели, номера квартиры, буквы алфавита и др.) и полученные таким способом выборки называются механическими ;

3. стратифицированный отбор заключается в том, что генеральная совокупность объема подразделяется на подсовокупности или слои (страты) объема так что . Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия - по отраслям). В этом случае выборки называются стратифицированными (иначе, расслоенными, типическими, районированными );

4. методы серийного отбора используются для формирования серийных или гнездовых выборок . Они удобны в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или население при территориально-административном делении страны). Отбор серий можно осуществить собственно-случайным или механическим способом. При этом проводится сплошное обследование определенной партии товара, или целой территориальной единицы (жилого дома или квартала);

5. комбинированный (ступенчатый) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический); такая выборка называется комбинированной .

Виды отбора

По виду различаются индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе - качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборку.

Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности N сокращается в процессе отбора. Приповторном отборе попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности N остается неизменной (метод в социально-экономических исследованиях применяется редко). Однако, при большом N (N → ∞) формулы для бесповторного отбора приближаются к аналогичным для повторного отбора и практически чаще используются последние (N = const ).

Основные характеристики параметров генеральной и выборочной совокупности

В основе статистических выводов проведенного исследования лежит распределение случайной величины , наблюдаемые же значения(х 1 , х 2 , … , х n) называются реализациями случайной величины Х (n - объем выборки). Распределение случайной величины в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением. Некоторые теоретические распределения заданы аналитически, т.е. их параметры определяют значение функции распределения в каждой точке пространства возможных значений случайной величины . Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение. При этом предположение (или гипотеза ) о виде распределения может быть как статистически верным, так и ошибочным. Но в любом случае восстановленное по выборке эмпирическое распределение лишь грубо характеризует истинное. Важнейшими параметрами распределений являются математическое ожидание и дисперсия .

По своей природе распределения бывают непрерывными и дискретными . Наиболее известным непрерывным распределением является нормальное . Выборочными аналогами параметров идля него являются: среднее значение и эмпирическая дисперсия . Среди дискретных в социально-экономических исследованиях наиболее часто применяется альтернативное (дихотомическое) распределение. Параметр математического ожидания этого распределения выражает относительную величину (или долю ) единиц совокупности, которые обладают изучаемым признаком (она обозначена буквой ); доля совокупности, не обладающая этим признаком, обозначается буквой q (q = 1 - p) . Дисперсия же альтернативного распределения также имеет эмпирический аналог .

В зависимости от вида распределения и от способа отбора единиц совокупности по-разному вычисляются характеристики параметров распределения. Основные из них для теоретического и эмпирического распределений приведены в табл. 9.1.

Долей выборки k n называется отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

k n = n/N .

Выборочная доля w - это отношение единиц, обладающих изучаемым признаком x к объему выборки n :

w = n n /n .

Пример. В партии товара, содержащей 1000 ед., при 5% выборке доля выборки k n в абсолютной величине составляет 50 ед. (n = N*0,05); если же в этой выборке обнаружено 2 бракованных изделия, то выборочная доля брака w составит 0,04 (w = 2/50 = 0,04 или 4%).

Так как выборочная совокупность отлична от генеральной, то возникают ошибки выборки .

Таблица 9.1 Основные параметры генеральной и выборочной совокупностей

Весь массив особей определенной категории называется генеральной совокупностью. Объем генеральной совокупности определяется задачами исследования.

Если изучается какой-нибудь вид диких животных или растений, то генеральной совокупностью будут все особи этого вида. В данном случае объем генеральной совокупности будет очень большой и при расчетах он принимается за бесконечно большую величину.

Если изучается действие какого-нибудь агента на растения и животных определенной категории, то генеральной совокупностью будут все растения и животные той категории (вида, пола, возраста, хозяйственного назначения), к которой относились подопытные объекты. Это уже не очень большое количество особей, но еще недоступное для сплошного изучения.

Не всегда объем генеральной совокупности недоступен для сплошного исследования. Иногда изучаются небольшие совокупности, например, определяется средний удой или средний настриг шерсти у группы животных, закрепленных за определенным работником. В таких случаях генеральной совокупностью будет совсем небольшое количество особей, которые все исследуются. Небольшая генеральная совокупность встречается также при исследовании растений или животных, имеющихся в какой-нибудь коллекции, с целью характеристики определенной группы в данной коллекции.

Характеристики групповых свойств ( и т. д.), относящиеся ко всей генеральной совокупности, называются генеральными параметрами.

Выборка – группа объектов, отличающихся тремя особенностями:

1 это часть генеральной совокупности;

2 отобранная в случайном порядке, определенным образом;

3 исследуемая для характеристики всей генеральной совокупности.

Для того чтобы по выборке можно было получить достаточно точную характеристику всей генеральной совокупности, необходимо организовать правильный отбор объектов из генеральной совокупности.

Теорией и практикой разработано несколько систем отбора особей в выборку. В основу всех этих систем положено стремление обеспечить максимальную возможность выбора любого объекта из генеральной совокупности. Тенденциозность, предвзятость при отборе объектов для выборочного исследования препятствуют получению правильных общих выводов, делают результаты выборочного исследования непоказательными для всей генеральной совокупности, т. е. нерепрезентативными.

Для получения правильной, неискаженной характеристики всей генеральной совокупности необходимо стремиться обеспечить возможность отбора в выборку любого объекта из любой части генеральной совокупности. Это основное требование должно выполняться тем строже, чем более изменчив изучаемый признак. Вполне понятно, что при разнообразии, приближающемся к нулю, например в случае изучения цвета волос или перьев некоторых видов, любой способ отбора выборки даст репрезентативные результаты.

В различных исследованиях применяются следующие способы отбора объектов в выборку.

4 Случайный повторный отбор, при котором объекты изучения отбираются из генеральной совокупности без предварительного учета развития у них изучаемого признака, т. е. в случайном (для данного признака) порядке; после отбора каждый объект изучается и затем возвращается в свою генеральную совокупность, так что любой объект может попасть повторно в выборку. Такой способ отбора равносилен отбору из бесконечно большой генеральной совокупности, для которого разработаны основные показатели взаимоотношений между выборочными и генеральными величинами.

5 Случайный бесповторный отбор, при котором объекты, отобранные, как и при предыдущем способе, случайно, не возвращаются в генеральную совокупность и не могут повторно попасть в выборку. Это наиболее распространенный способ организации выборки; он равносилен отбору из большой, но ограниченной генеральной совокупности, что учитывается при определении генеральных показателей по выборочным.

6 Механический отбор, при котором производится отбор объектов из отдельных частей генеральной совокупности, причем эти части предварительно намечаются механически по квадратам опытного поля, по случайным группам животных, взятых из разных ареалов популяции и т. д. Обычно намечается столько таких частей, сколько предполагается взять объектов для изучения, поэтому число частей бывает равно численности выборки. Механический отбор иногда осуществляется выбором для изучения особей через определенное число, например при пропускании животных через раскол и отборе каждого десятого, сотого и т. д., или при взятии укоса через каждые 100 или 200 м, или отборе одного объекта через каждые встретившиеся 10, 100 и т. д. экземпляров при исследовании всей популяции.

8 Серийный (гнездовой) отбор, при котором генеральная совокупность разбивается на части – серии, некоторые из них исследуются целиком. Применяется этот способ с успехом в тех случаях, когда исследуемые объекты достаточно равномерно распределены в определенном объеме или на определенной территории. Например, при исследовании зараженности воздуха или воды микроорганизмами берут пробы, которые подвергаются сплошному исследованию. В некоторых случаях гнездовым способом могут быть обследованы также сельскохозяйственные объекты. При изучении выходов мяса и других продуктов переработки мясной породы скота в выборку можно взять всех животных этой породы, поступивших на два-три мясокомбината. При изучении величины яйца в колхозном птицеводстве можно в нескольких колхозах провести изучение этого признака у всего поголовья кур.

Характеристики групповых свойств (μ, s и т. д.), полученные для выборки, называются выборочными показателями.

Репрезентативность

Непосредственное изучение группы отобранных объектов дает, прежде всего, первичный материал и характеристику самой выборки.

Все выборочные данные и сводные показатели имеют значение в качестве первичных фактов, вскрытых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивается процесс извлечения информации, заложенный в первичных материалах исследования.

То обстоятельство, что объекты отбирались в выборку специальными приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка.

Выборка при определенных условиях становится более или менее точным отражением всей генеральной совокупности. Это свойство выборки называется репрезентативностью, что означает представительность с определенной точностью и надежностью.

Как и всякое свойство, репрезентативность выборочных данных может быть выражена в достаточной или в недостаточной степени. В первом случае в выборке получаются достоверные оценки генеральных параметров, во втором – недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.