Основи вибіркового дослідження та формування простої випадкової вибірки. Як правильно розрахувати обсяг вибірки? Дослідницьке вікно: Блискуче! Але хто буде це читати
Статистичні дослідження дуже трудомісткі і дороги, тому виникла думка про заміну суцільного спостереження вибірковим.
Основна мета несплошного спостереження полягає в отриманні характеристик досліджуваної статистичної сукупності по обстеженій її частини.
вибіркове спостереження- це метод статистичного дослідження, при якому узагальнюючі показники сукупності встановлюються тільки по окремо взятій частині на основі положень випадкового відбору.
При вибірковому методі вивчення піддається тільки деяка частина досліджуваної сукупності, при цьому підлягає вивченню статистична сукупність називається генеральною сукупністю.
Вибіркової сукупністю чи просто вибіркою можна називати відібрану з генеральної сукупності частина одиниць, яка буде піддаватися статистичному дослідженню.
Значення вибіркового методу: при мінімальній чисельності досліджуваних одиниць проведення статистичного дослідження буде відбуватися в більш короткі проміжки часу і з найменшими витратами коштів і праці.
У генеральній сукупності частка одиниць, яка володіє досліджуваним ознакою, називається генеральною часткою (позначається р),а середня величина досліджуваного варьирующего ознаки - це генеральна середня (позначається х).
У вибіркової сукупності частку досліджуваної ознаки називають вибірковою часткою, або частиною (позначається w), середня величина в вибірці - це вибіркова середня.
Якщо в період обстеження будуть дотримані всі правила його наукової організації, то вибірковий метод дасть досить точні результати, і тому даний метод доцільно застосовувати для перевірки даних суцільного спостереження.
Цей метод набув широкого поширення в державній і позавідомчої статистикою, тому що при дослідженні мінімальної чисельності досліджуваних одиниць дозволяє ретельно і точно провести дослідження.
Досліджувана статистична сукупність складається з одиниць з варьирующими ознаками. Склад вибіркової сукупності може відрізнятися від складу генеральної сукупності, це розбіжність між характеристиками вибірки і генеральної сукупності становить похибку вибірки.
Помилки, властиві вибіркового спостереження, характеризують розмір розбіжності між даними вибіркового спостереження і всієї сукупності. Помилки, що виникають в ході вибіркового спостереження, називаються помилками репрезентативності і діляться на випадкові і систематичні.
Якщо вибіркова сукупність недостатньо точно відтворює всю сукупність через несплошного характеру спостереження, то це називають випадковими помилками, і їх розміри визначаються з достатньою точністю на підставі закону великих чисел і теорії ймовірностей.
Систематичні помилки виникають в результаті порушення принципу випадковості відбору одиниць сукупності для спостереження.
2. Види і схеми відбору
Розмір помилки вибірки та методи її визначення залежать від виду і схеми відбору.
Розрізняють чотири види відбору сукупності одиниць спостереження:
1) випадковий;
2) механічний;
3) типовий;
4) серійний (гніздовий).
випадковий відбір- найбільш поширений спосіб відбору в випадковою вибіркою, його ще називають методом жеребкування, при ньому на кожну одиницю статистичної сукупності заготовляється квиток з порядковим номером.
Далі у випадковому порядку відбирається необхідну кількість одиниць статистичної сукупності. При цих умовах кожна з них має однакову ймовірність потрапити до вибірки, наприклад тиражі виграшів, коли із загальної кількості випущених квитків у випадковому порядку навмання відбирається певна частина номерів, на які припадають виграші. При цьому всім номерам забезпечується рівна можливість потрапити до вибірки.
механічний відбір- це спосіб, коли вся сукупність розбивається на однорідні за обсягом групи за випадковою ознакою, потім з кожної групи береться лише одна одиниця Всі одиниці досліджуваної статистичної сукупності попередньо розташовуються в певному порядку, але в залежності від обсягу вибірки механічно через певний інтервал відбирається необхідну кількість одиниць .
Типовий відбір -це спосіб, при якому досліджувана статистична сукупність розбивається щодо істотного, типового ознакою на якісно однорідні, однотипні групи, потім з кожної цієї групи випадковим способом відбирається певна кількість одиниць, пропорційне питомій вазі групи в усій сукупності.
Типовий відбір дає точніші результати, так як при ньому в вибірку потрапляють представники всіх типових груп.
Серійний (гніздовий) відбір.Відбору підлягають цілі групи (серії, гнізда), відібрані випадковим або механічним способом. По кожній такій групі, серії проводиться суцільне спостереження, а результати переносяться на всю сукупність.
Точність вибірки залежить і від схеми відбору. Вибірка може бути проведена за схемою повторного і бесповторного відбору.
Повторний відбір.Кожна відібрана одиниця або серія повертається на всю сукупність і може знову потрапити до вибірки Це так звана схема повернутого кулі.
Бесповторний відбір.Кожна обстежена одиниця вилучається і не повертається в сукупність, тому вона не потрапляє в повторне обстеження. Ця схема отримала назву неповерненого кулі.
Бесповторний відбір дає точніші результати, тому що при одному і тому ж обсязі вибірки спостереження охоплює більшу кількість одиниць досліджуваної сукупності.
комбінований відбірможе проходити одну або кілька ступенів. Вибірка називається одноступінчастої, якщо відібрані одного разу одиниці сукупності піддаються вивченню.
Вибірка називається багатоступеневою, якщо відбір сукупності проходить по східцях, послідовним стадіям, причому кожен ступінь, стадія відбору має свою одиницю відбору.
Багатофазна вибірка - на всіх щаблях вибірки зберігається одна і та ж одиниця відбору, але проводиться кілька стадій, фаз вибіркових обстежень, які розрізняються між собою широтою програми обстеження і обсягом вибірки.
Характеристики параметрів генеральної і вибіркової сукупностей позначаються наступними символами:
N- обсяг генеральної сукупності;
n - обсяг вибірки;
X- генеральна середня;
х- вибіркова середня;
р- генеральна частка;
w - вибіркова частка;
2 - генеральна дисперсія (дисперсія ознаки в генеральній сукупності);
2 - вибіркова дисперсія того ж ознаки;
? - середньоквадратичне відхилення в генеральній сукупності;
? - середнє відхилення у вибірці.
3. Помилки вибірки
Кожна одиниця при вибірковому спостереженні повинна мати рівну з іншими можливість бути відібраною - це є основою собственнослучайной вибірки.
Собственнослучайная вибірка - це відбір одиниць з усієї генеральної сукупності за допомогою жеребкування або іншим подібним способом.
Принципом випадковості є те, що на включення або виключення об'єкта з вибірки не може вплинути будь-який чинник, крім випадку.
частка вибірки- це відношення числа одиниць вибіркової сукупності до числа одиниць генеральної сукупності:
Собственнослучайний відбір в чистому вигляді є вихідним серед всіх інших видів відбору, в ньому полягають і реалізуються основні принципи вибіркового статистичного спостереження.
Два основних види узагальнюючих показників, які використовують у вибірковому методі - це середня величина кількісної ознаки і відносна величина альтернативного ознаки.
Вибіркова частка (w), чи просто випадковість, визначається ставленням числа одиниць, які мають досліджуваним ознакою m, до загальної кількості одиниць вибіркової сукупності (n):
Для характеристики надійності вибіркових показників розрізняють середню і граничну помилки вибірки.
Помилка вибірки, її ще називають помилкою репрезентативності, являє собою різницю відповідних вибіркових і генеральних характеристик:
?х \u003d | х - х |;
?w \u003d | х - p |.
Тільки вибірковим спостереженням властива похибка вибірки
Вибіркова середня і вибіркова частка - це випадкові величини, які беруть різні значення в залежності від одиниць досліджуваної статистичної сукупності, які потрапили у вибірку. Відповідно помилки вибірки - теж випадкові величини і також можуть набувати різних значень. Тому визначають середню з можливих помилок - середню похибку вибірки.
Середня помилка вибірки визначається обсягом вибірки: чим більше чисельність при інших рівних умовах, тим менше величина середньої помилки вибірки. Охоплюючи вибірковим обстеженням все більшу кількість одиниць генеральної сукупності, всі більш точно характеризує всю генеральну сукупність.
Середня помилка вибірки залежить від ступеня варіювання досліджуваного ознаки, в свою чергу ступінь варіювання характеризується дисперсією? 2 або w (l - w) - для альтернативної ознаки. Чим менше варіація ознаки і дисперсія, тим менше середня помилка вибірки, і навпаки.
При випадковому повторному відборі середні помилки теоретично розраховують за наступними формулами:
1) для середньої кількісної ознаки:
де? 2 - середня величина дисперсії кількісної ознаки.
2) для частки (альтернативного ознаки):
Так як дисперсія ознаки у генеральній сукупності? 2 точно невідома, на практиці користуються значенням дисперсії S 2, розрахованим для вибіркової сукупності на підставі закону великих чисел, згідно з яким вибіркова сукупність при досить великому обсязі вибірки достатньо точно відтворює характеристики генеральної сукупності.
Формули середньої помилки вибірки при випадковому повторному відборі наступні. Для середньої величини кількісної ознаки: генеральна дисперсія виражається через виборну наступним співвідношенням:
де S 2 - значення дисперсії.
механічна вибірка- це відбір одиниць у вибіркову сукупність з генеральної, яка розбита по нейтральному ознакою на рівні групи; проводиться так, що з кожної такої групи в вибірку відбирається лише одна одиниця.
При механічному відборі одиниці досліджуваної статистичної сукупності попередньо розташовують в певному порядку, після чого відбирають заданий число одиниць механічно через певний інтервал. При цьому розмір інтервалу в генеральної сукупності дорівнює зворотному значенню частки вибірки.
При досить великій сукупності механічний відбір по точності результатів близький до собственнослучайному Тому для визначення середньої помилки механічної вибірки використовують формули собственнослучайной бесповторной вибірки.
Для відбору одиниць з неоднорідною сукупності застосовується так звана типова вибірка, використовується, коли всі одиниці генеральної сукупності можна розбити на кілька якісно однорідних, однотипних груп за ознаками, від яких залежать досліджувані показники.
Потім з кожної типової групи собственнослучайной або механічною вибіркою проводиться індивідуальний відбір одиниць у вибіркову сукупність.
Типова вибірка зазвичай застосовується при вивченні складних статистичних сукупностей.
Типова вибірка дає точніші результати. Типізація генеральної сукупності забезпечує репрезентативність такої вибірки, представництво в ній кожної типологічної групи, що дозволяє виключити вплив груповий дисперсії на середню похибку вибірки. Тому при визначенні середньої помилки типової вибірки в якості показника варіації виступає середня з внутрішньогрупових дисперсій.
Серійна вибірка передбачає випадковий відбір з генеральної сукупності рівновеликих груп для того, щоб в таких групах піддавати спостереження все без винятку одиниці.
Оскільки всередині груп (серій) обстежуються всі без винятку одиниці, середня помилка вибірки (при відборі рівновеликих серій) залежить тільки від груповий (межсерийная) дисперсії.
4. Способи поширення вибіркових результатів на генеральну сукупність
Характеристика генеральної сукупності на основі вибіркових результатів - це кінцева мета вибіркового спостереження.
Вибірковий метод застосовується для отримання характеристик генеральної сукупності за певними показниками вибірки. Залежно від цілей дослідження це здійснюється прямим перерахунком показників вибірки для генеральної сукупності або методом розрахунку поправочних коефіцієнтів.
Спосіб прямого перерахунку в тому, що при ньому показники вибіркової частки w або середньої хпоширюються на генеральну сукупність з урахуванням похибки вибірки.
Спосіб поправочних коефіцієнтів застосовується, коли метою вибіркового методу є уточнення результатів суцільного обліку. Даний спосіб використовується при уточненні даних щорічних переписів худоби у населення.
Вибірка - безліч випадків (випробовуваних, об'єктів, подій, зразків), за допомогою певної процедури вибраних з генеральної сукупності для участі в дослідженні.
обсяг вибірки
Обсяг вибірки - число випадків, включених до вибіркової сукупності. З статистичних міркувань рекомендується, щоб число випадків складало не менше 30-35.
Залежні і незалежні вибірки
При порівнянні двох (і більше) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфності пару (тобто, коли одному випадку з вибірки X сооветствует один і тільки один випадок з вибірки Y і навпаки) для кожного випадку в двох вибірках (і це підстава взаємозв'язку є важливим для вимірюваного на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:
- пари близнюків,
- два виміри якої-небудь ознаки до і після експериментального впливу,
- чоловіки і дружини
- і т.п.
У разі, якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:
- чоловіки та жінки,
- психологи і математики.
- Відповідно, залежні вибірки завжди мають однаковий обсяг, а обсяг незалежних може відрізнятися.
Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:
- t-критерій Стьюдента
- T-критерій Вілкоксона
- U-критерій Манна-Уїтні
- критерій знаків
- та ін.
репрезентативність
Вибірка може розглядатися в якості репрезентативної або репрезентативної.
Приклад репрезентативної вибірки
У США одним з найбільш відомих історичних прикладів репрезентативної вибірки вважається випадок, що стався під час президентських виборів в 1936 році. Журнал «Літрері Дайджест», успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним за телефонним книгам всієї країни, і людям з реєстраційних списків автомобілів. У 25% повернулися бюлетенів (майже 2,5 мільйона) голоси були розподілені наступним чином:
57% віддавали перевагу кандидатові-республіканцеві Альфу Лендону
40% вибрали чинного на той час президента-демократа Франкліна Рузвельта
На дійсних же виборах, як відомо, переміг Рузвельт, набравши понад 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, - так як їм було відомо, що більшість їх передплатників вважають себе республіканцями, - вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Однак вони не врахували сучасних їм реалій і в дійсності набрали ще більше республіканців: під час Великої депресії володіти телефонами і автомобілями могли собі дозволити в основному представники середнього і верхнього класу (тобто більшість республіканців, а не демократів).
Види плану побудови груп з вибірок
Виділяють кілька основних видів плану побудови груп:
- Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
- Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору
- Дослідження з використанням тільки однієї групи - експериментальної.
- Дослідження з використанням змішаного (факторного) плану - все групи ставляться в різні умови.
Стратегії побудови груп
Відбір груп для їх участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності
- Рандомизация (випадковий відбір)
- Залучення реальних груп
рандомизация
рандомизация, або випадковий відбір, Використовується для створення простих випадкових вибірок. Використання такої вибірки грунтується на припущенні, що кожен член популяції з однаковою ймовірністю може потрапити до вибірки. Наприклад, щоб зробити випадкову вибірку з 100 студентів, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців - це буде випадковим відбором (Гудвін Дж., С. 147).
попарний відбір
попарний відбір - стратегія побудови груп вибірки, при якому групи випробовуваних складаються із суб'єктів, еквівалентних по значущим для експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом - залученням
Вибірка в 1С 8.2 та 8.3- спеціалізований спосіб перебору записів таблиць інформаційної бази. Розглянемо докладно, що таке вибірка і як її використовувати.
Що таке вибірка в 1С?
вибірка - спосіб перебору інформації в 1С, який полягає в послідовній установки курсору на подальшого запису. Вибірку в 1С можна отримати з результату запиту і з менеджера об'єктів, наприклад, документів або довідників.
Приклад отримання і перебору з менеджера об'єкта:
Вибірка \u003d Довідники. Банки. Вибрати (); Поки Вибірка. Наступний () Цикл КонецЦікла;
Приклад отримання вибірки із запиту:
Отримайте 267 відеоуроків по 1С безкоштовно:
Запит \u003d Новий запит ( "Вибрати Посилання, Код, Найменування З Справочнік.Банкі"); Вибірка \u003d Запит. Виконати (). Вибрати (); Поки Вибірка. Наступний () Цикл // виробляємо цікавлять дії з довідником "Банки" КонецЦікла;Обидва перерахованих вище прикладу отримують однакові набори даних для перебору.
Методи Вибірки 1С 8.3
Вибірка має велику кількість методів, розглянемо їх детальніше:
- Вибрати () - метод, за допомогою якого отримують безпосередньо вибірку. З вибірки можна отримати ще одну, підпорядковану, вибірку якщо зазначений тип обходу «по угрупованням».
- Власник () - метод, зворотний Вибрати (). Дозволяє отримати «батьківську» вибірка запиту.
- Наступний () - метод, що виробляє переклад курсору на наступний запис. Якщо запис існує, повертає Істина, якщо записи закінчилися - Брехня.
- НайтіСледующій () - дуже корисний метод, за допомогою якого можна виконувати перебір тільки потрібних поле за значенням відбору (відбір - структура полів).
- СледующійПоЗначеніюПоля () - дозволяє отримати такий запис з відмінним від поточного положення значення. Наприклад, необхідно перебрати всі записи з унікальний значенням поля «Контрагент»: Виборка.СледующійПоЗначеніюПоля ( «Контрагент»).
- Скинути () - дозволяє скинути поточне розташування курсора і встановити його в початкове положення.
- Кількість () - повертає кількість записів у вибірці.
- Отримати () - за допомогою методу можна можна встановити курсор на потрібний запис за значенням індексу.
- Рівень () - рівень в ієрархії поточного запису (число).
- ТіпЗапісі () - відображає тип запису - ДетальнаяЗапісь, ІтогПоГруппіровке, ІтогПоІерархіі або ОбщійІтог
- Угруповання () - повертає ім'я поточної угруповання, якщо запис не є угрупованням - порожній рядок.
Якщо Ви починаєте вивчати 1С програмування, рекомендуємо наш безкоштовний курс (не забудьте
Фактично ми почнемо ні з одного, а з трьох питань: що таке вибірка? коли вона є репрезентативною? що вона собою являє?
сукупність - це будь-яка група людей, організацій, що цікавлять нас подій, щодо яких ми хочемо зробити висновки, а випадок, або об'єкт, - будь-який елемент такої сукупності 1 .вибірка - будь-яка підгрупа сукупності випадків (об'єктів), виділена для аналізу. Якщо ми захочемо вивчити діяльність законодавців штату щодо прийняття рішень, ми могли б досліджувати таку діяльність в законодавчих органах штатів Віргінія, Північна Кароліна і Південна Кароліна, а не у всіх п'ятдесяти штатах і, виходячи з цього, поширити отримані дані на генеральну сукупність, з якої були обрані ці три штати. Якщо ми хочемо дослідити систему переваг виборців Пенсільванії, ми могли б зробити це, опитавши 50 робочих компанії "Ю. С. Стіл "в Пітсбурзі, і поширити результати опитування на всіх виборців штату. Аналогічно, якщо ми хочемо виміряти розумові здібності студентів коледжів, ми могли бипротестіровать всіх гравців захисту, зареєстрованих в штаті Огайо в даному футбольному сезоні, і потім поширити отримані результати на генеральну сукупність, частиною якої вони є. У кожному прикладі ми діємо таким чином: встановлюємо підгрупу всередині генеральної сукупності, досить детально вивчаємо цю підгрупу, або вибірку, і поширюємо наші результати на всю сукупність. Це і є основні етапи формування вибірки.
Однак можна вважати цілком очевидним, що кожна з цих вибірок має істотний недолік. Наприклад, хоча законодавчі органи Віргінії, Північної Кароліни та Південної Кароліни і є частиною сукупності законодавчих органів штатів, вони в силу історичних, географічних і політичних причин, швидше за все, будуть діяти дуже схожим чином і зовсім інакше, ніж законодавчі органи таких відрізняються від них штатів, як Нью-Йорк, Небраска і Аляска. Хоча п'ятдесят робітників-сталеливарників в Пітсбурзі дійсно можуть бути виборцями штату Пенсільванія, вони в силу соціально-економічного статусу, освіти і життєвого досвіду, цілком можливо, будуть мати погляди, відмінні від поглядів багатьох інших людей, точно так же є виборцями. І точно так само, хоча футболісти штату Огайо і є студентами коледжів, вони в силу різних причин цілком можуть відрізнятися від інших студентів. Іншими словами, хоча кожна з цих підгруп дійсно є вибіркою, члени кожної з них систематично відрізняються від більшості інших членів сукупності, з якої вони обрані. В якості окремої групи жодна з них не є типовою з точки зору розподілу ознак думок, мотивів поведінки і характеристик в генеральної сукупності, з якої вона асоціюється. Відповідно, політологи сказали б, що жодна з цих вибірок не є репрезентативною.
репрезентативна вибірка - це така вибірка, в якій всі основні ознаки генеральної сукупності, з якої вилучено дана вибірка, представлені приблизно в тій же пропорції або з тією ж частотою, з якою дана ознака виступає в цій генеральної сукупності. Таким чином, якщо 50% всіх законодавчих органів штатів збираються лише раз на два роки, приблизно половина складу репрезентативної вибірки законодавчих органів штатів повинна бути такого типу. Якщо 30% виборців Пенсільванії належать до "синіх комірців", близько 30% репрезентативною вибірки для цих виборців (а не 100%, як в наведеному вище прикладі) повинні бути з числа "синіх комірців". І якщо 2% всіх студентів коледжів є спортсменами, приблизно та ж сама частина репрезентативної вибірки студентів коледжів повинна припадати на спортсменів. Іншимисловами, репрезентативна вибірка представляє собою мікрокосм, меншу за розміром, але точну модель генеральної сукупності, яку вона повинна відображати. У тій мірі, в якій вибірка є репрезентативною, висновки, засновані на вивченні цієї вибірки, можна без всяких побоювань вважати застосовними до вихідної сукупності. Це поширення результатів і є те, що ми називаємо генералізуемостью.
Можливо, пояснити це допоможе графічна ілюстрація. Припустимо, ми хочемо вивчати моделі членства в політичних групах серед дорослого населення США. На рис.5.1 зображено три кола, розділених на шість рівних секторів. Рис.5.1 представляє всю розглянуту сукупність. Члени сукупності расклассіфіціровани відповідно до політичними групами (такими, як партії і групи інтересів), до яких вони належать. У цьому прикладі кожен дорослий належить щонайменше до однієї і не більше ніж до шести політичних груп; і ці шість рівнів членства в однаковій мірі поширені в сукупності (звідси рівні сектора). Припустимо, ми хочемо дослідити мотиви вступу людей в групу, вибір групи і моделі участі, проте через обмеженість ресурсів ми в змозі обстежити тільки одного з кожних шести членів сукупності. Кого ж відібрати для аналізу?
Мал. 5.1. Формування вибірки з генеральної сукупності
Одну з можливих вибірок заданого обсягу ілюструє заштрихованная область на ріс.5.1б, однак вона явно не відображає структуру сукупності. Якби ми робили узагальнення на основі цієї вибірки, ми прийшли б до висновку: (1) що всі дорослі американці належать до п'яти політичних груп і (2) що все групове поведінка американців збігається з поведінкою тих, хто належить саме до п'яти групам. Однак ми знаємо, що перший висновок не вірний, і це може зародити в нас сумнів щодо валідності другого. Таким чином, вибірка, зображена на ріс.5.1б, нерепрезентативна, оскільки вона не відображає розподіл цієї ознаки сукупності (часто званого параметром ) Відповідно до його реальним поширенням. Про таку вибірку кажуть, що вона зміщена в напрямку до членам п'яти груп або зміщена в напрямку від всіх інших моделей членства в групах. Спираючись на таку зміщену вибірку, ми зазвичай приходимо до помилкових висновків щодо генеральної сукупності.
Найяскравіше це може бути продемонстровано на прикладі катастрофи, яка спіткала в 30-і роки журнал "Літерарі дайджест", який організував опитування громадської думки щодо результатів виборів. "Літерарі дайджест" представляв собою періодичне видання, в якому передруковувалися редакційні статті з газет та інші матеріали, що відображали общественноемненіе; цей журнал був дуже популярний на початку століття. Починаючи з 1920 р журнал проводив широкомасштабний загальнонаціональне опитування, в ході якого більше ніж мільйону чоловік поштою розсилалися виборчі бюлетені з проханням відзначити, чия кандидатура на майбутніх президентських виборах для них краще. Протягом ряду років результати опитування, що проводилися журналом, виявлялися настільки точними, що опитування, проведене у вересні, здавалося, робив листопадові вибори малоістотними. Та й як прітакой великій вибірці могла статися помилка? Однак в 1936 р саме це і сталося: з великою перевагою голосів (60:40) перемога була передбачена кандидату від республіканської партії Альфу ЛАНДОН. На виборах Ландон програв інваліду - Франкліну Д. Рузвельту - практично з тим же результатом, з яким повинен був перемогти. Довіра до "Літерарі дайджест" було настільки сильно підірвано, що незабаром після цього журнал перестав виходити. Що ж сталося? Все дуже просто: в голосуванні, проведеному "Дайджест", використовувалася зміщена вибірка. Поштові листівки розсилалися людям, чиї імена були вилучені з двох джерел: телефонних довідників і списків реєстрації автомобілів. І хоча раніше цей метод відбору не надто відрізнявся від інших методів, зовсім по-іншому було тепер, під час Великої депресії 1936 р коли менш заможні виборці, найбільш ймовірна опора Рузвельта, не могли дозволити собі мати телефон, не кажучи вже про автомобілі. Таким чином, фактично вибірка, що використовувалась в опитуванні, організованому "Дайджест", була зміщена в бік тих, хто, швидше за все, повинен був виступати за республіканців, і при цьому ще дивно, що у Рузвельта був такий хороший результат.
Як же вирішити цю проблему? Повертаючись до нашого прикладу, порівняємо вибірку на ріс.5.1б з вибіркою на ріс.5.1в. В останньому випадку для аналізу також відібрана шоста частина сукупності, проте кожен з основних типів сукупності представлений у вибірці в тій пропорції, в якій він представлений у всій сукупності. Така вибірка демонструє, що один з кожних шести дорослих американців належить до однієї політичної групи, один з шести - до двох і т.д. Така вибірка дозволить також виявити інші відмінності між її членами, які могли б співвідноситися з участю в різному числі груп. Таким чином, вибірка, представлена \u200b\u200bна ріс.5.1в, є репрезентативною вибіркою для даної сукупності.
Звичайно, даний приклад є спрощеним принаймні з двох надзвичайно важливих точок зору. По-перше, більшість сукупностей, що цікавлять політологів, більш різноманітно, ніж та, що наведена в прикладі. Люди, документи, уряду, організації, рішення і т.п. відрізняються один від одного не по одному, а по набагато більшій кількості ознак. Таким чином, репрезентативна вибірка повинна бути такою, щоб кожна з основних, відмінна від інших область була представлена \u200b\u200bпропорційно її частці в сукупності. По-друге, ситуація, коли реальний розподіл змінних, або ознак, які ми хочемо виміряти, заздалегідь невідомо, зустрічається набагато частіше, ніж протилежна, - можливо, воно не вимірювалося в попередньої перепису населення. Таким чином, репрезентативна вибірка повинна бути побудована так, щоб вона могла точно відображати існуючий розподіл навіть тоді, коли ми не в змозі прямо оцінити її валідність. Процедура формування вибірки повинна мати внутрішню логіку, здатну переконати нас, що, якби ми були в змозі порівняти вибірку з переписом, вона дійсно виявилася б репрезентативною.
Щоб забезпечити можливість точного відображення складної організації даної сукупності і певний ступінь впевненості в тому, що пропоновані процедури здатні зробити це, дослідники звертаються до методів статистики. При цьому вони діють за двома напрямками. По-перше, використовуючи певні правила (внутрішню логіку), дослідники вирішують питання про те, які саме конкретні об'ектиім вивчати, що саме включати в конкретну вибірку. По-друге, використовуючи зовсім інші правила, вони вирішують, скільки об'єктів вибрати. Ми не будемо детально вивчати ці численні правила, розглянемо лише їх роль в політологічному дослідженні. Почнемо розгляд з стратегій вибору об'єктів, що утворюють репрезентативну вибірку.
Елементів, яка охоплюється експериментом (наглядом, опитуванням).
Характеристики вибірки:
- Якісна характеристика вибірки - що саме ми вибираємо і які способи побудови вибірки ми для цього використовуємо.
- Кількісна характеристика вибірки - скільки випадків вибираємо, іншими словами обсяг вибірки.
Необхідність вибірки:
- Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії - величезна кількість територіально розкиданих ринків.
- Існує необхідність в зборі первинної інформації.
енциклопедичний YouTube
1 / 5
✪ Вибірка: розрахунок обсягу. Достовірність і потужність дослідження. Біостатистика.
✪ 02 - Мат. статистика. Виборка.Виборочное простір. приклади
✪ Основи SQL для початківців | Вибірка значень з бази даних
✪ SQL для початківців (DML): Вибірка з таблиці (MySql), Урок 4!
✪ Виробництво SIP панелей. Частина 2. Розкрій і фігурне різання. Вибірка пазів. Все по розуму
субтитри
обсяг вибірки
обсяг вибірки - число випадків, включених до вибіркової сукупності.
Вибірки можна умовно розділити на великі і малі, так як в математичній статистиці використовуються різні підходи в залежності від обсягу вибірки. Вважається, що вибірки обсягу більше 30 можна віднести до великих.
Залежні і незалежні вибірки
При порівнянні двох (і більше) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфності пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку в двох вибірках (і це підстава взаємозв'язку є важливим для вимірюваного на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:
- пари близнюків,
- два виміри якої-небудь ознаки до і після експериментального впливу,
- чоловіки і дружини
- і т.п.
У разі, якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, Наприклад:
- чоловіки та жінки ,
- психологи і математики.
Відповідно, залежні вибірки завжди мають однаковий обсяг, а обсяг незалежних може відрізнятися.
Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:
- Критерій Пірсона (χ 2)
- Критерій Стьюдента ( t )
- Критерій Вілкоксона ( T )
- Критерій Манна - Уїтні ( U )
- Критерій знаків ( G )
- та ін.
репрезентативність
Вибірка може розглядатися в якості репрезентативної або репрезентативної. Вибірка буде репрезентативною при обстеженні великої групи людей, якщо всередині цієї групи є представники різних підгруп, тільки так можна зробити вірні висновки.
Приклад репрезентативної вибірки
- Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
- Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору
- Дослідження з використанням тільки однієї групи - експериментальної.
- Дослідження з використанням змішаного (факторного) плану - все групи ставляться в різні умови.
типи вибірок
Вибірки діляться на два типи:
- імовірнісні
- невероятностной
імовірнісні вибірки
- Проста імовірнісна вибірка:
- Проста повторна вибірка. Використання такої вибірки грунтується на припущенні, що кожен респондент з рівною часткою ймовірності може потрапити до вибірки. На основі списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і з них навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки раз, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.
Процедура побудови простої випадкової вибірки включає в себе наступні кроки:
1) необхідно отримати повний список членів генеральної сукупності і пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;
2) визначити передбачуваний обсяг вибірки, тобто очікуване число опитаних;
3) отримати з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має виявитися 100 осіб, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватися комп'ютерною програмою.
4) вибрати зі списку-основи ті спостереження, номери яких відповідають виписаним випадковим числах
- Проста випадкова вибірка має очевидні переваги. Цей метод вкрай простий для розуміння. Результати дослідження можна поширювати на досліджувану сукупність. Більшість підходів до отримання статистичних висновків передбачають збір інформації за допомогою простої випадкової вибірки. Однак метод простий випадкової вибірки має як мінімум чотири істотні обмеження:
1) нерідко складно створити основу виборочногo спостереження, яка дозволила б провести просту випадкову вибірку.
2) результатом застосування простий випадкової вибірки може стати велика сукупність, або сукупність, розподілена по великій географічній території, що значно збільшує час і вартість збору даних.
3) результати застосування простий випадкової вибірки часто характеризуються низькою точністю і більшою стандартною помилкою, ніж результати застосування інших імовірнісних методів.
4) в результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють досліджувану сукупність. Така ймовірність особливо велика при невеликому обсязі вибірки.
- Проста бесповторная вибірка. Процедура побудови вибірки така ж, тільки картки з номерами респондентів не повертаються назад в колоду.
- Систематична імовірнісна вибірка. Є спрощеним варіантом простий ймовірнісної вибірки. На основі списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Величина До визначається випадково. Найбільш достовірний результат досягається при однорідної генеральної сукупності, інакше можливі збіг величини кроку і якихось внутрішніх циклічних закономірностей вибірки (змішання вибірки). Мінуси: такі ж як і в простій ймовірнісної вибіркою.
- Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада і т. П.). Відібрані елементи піддаються суцільного обстеження. Відбір статистичних одиниць може бути організований за типом випадкової або систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.
- Районована вибірка. У разі неоднорідної генеральної сукупності, перш, ніж використовувати вірогідну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районированной. Групами районування можуть виступати як природні утворення (наприклад, райони міста), так і будь-яка ознака, закладений в основу дослідження. Ознака, на основі якого здійснюється поділ, називається ознакою розшарування і районування.
- «Зручна» вибірка. Процедура «зручною» вибірки полягає у встановленні контактів з «зручними» одиницями вибірки - з групою студентів, спортивною командою, з друзями і сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обгрунтована. «Зручний» вибірку часто використовують для попереднього тестування анкет.
невероятностной вибірки
Відбір в такій вибірці здійснюється не за принципами випадковості, а за суб'єктивними критеріями - доступності, типовості, рівного представництва і т. Д.
- Квотна вибірка - вибірка будується як модель, яка відтворює структуру генеральної сукупності у вигляді квот (пропорцій) досліджуваних ознак. Число елементів вибірки з різним поєднанням досліджуваних ознак визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена \u200b\u200b5000 осіб, з них 2000 жінок та 3000 чоловіків, тоді в квотною вибіркою у нас будуть 20 жінок і 30 чоловіків, або 200 жінок і 300 чоловіків. Квотувати вибірки найчастіше грунтуються на демографічних критеріях: стать, вік, регіон, дохід, освіту та інших. Мінуси: зазвичай такі вибірки нерепрезентативним, так як не можна врахувати відразу кілька соціальних параметрів. Плюси: легкодоступний матеріал.
- Метод сніжної грудки. Вибірка будується наступним чином. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які підходили б під умови відбору і могли б взяти участь в дослідженні. Таким чином, за винятком першого кроку, вибірка формується за участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти і опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, які належать до однієї професійної групи, респондентів, що мають будь-які схожі хобі / захоплення і т. Д.)
- Стихійна вибірка - вибірка так званого «першого зустрічного». Часто використовується в теле- і радіоопросах. Розмір і склад стихійних вибірок заздалегідь не відомий, і визначається тільки одним параметром - активністю респондентів. Мінуси: неможливо встановити яку генеральну сукупність являють опитані, і як наслідок - неможливість визначити репрезентативність.
- Маршрутний опитування - часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому буде проводитися опитування, нумеруються всі вулиці. За допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як що складається з 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 - це номер вулиці на карті, 8 - номер будинку, 32 - номер квартири.
- Районована вибірка з відбором типових об'єктів. Якщо після районування з кожної групи відбирається типовий об'єкт, тобто об'єкт, який за більшістю досліджуваних в дослідженні характеристик наближається до середніх показників, така вибірка називається районированной з відбором типових об'єктів.
- Модальна вибірка.
- Експертна вибірка.
- Гетерогенна вибірка.
Стратегії побудови груп
Відбір груп для їх участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності.
рандомизация
рандомизация, або випадковий відбір, Використовується для створення простих випадкових вибірок. Використання такої вибірки грунтується на припущенні, що кожен член популяції з однаковою ймовірністю може потрапити до вибірки. Наприклад, щоб зробити випадкову вибірку з 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців - це буде випадковим відбором (Гудвін Дж., С. 147) ......
попарний відбір
попарний відбір - стратегія побудови груп вибірки, при якому групи випробовуваних складаються із суб'єктів, еквівалентних по значущим для експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом - залученням блізнецових пар (моно - і дизиготних).
стратометріческая відбір
стратометріческая відбір - рандомізація з виділенням страт (або кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (стать, вік, політичні уподобання, освіта, рівень доходів тощо.), І відбираються випробовувані з відповідними характеристиками.
наближене моделювання
наближене моделювання - складання обмежених вибірок і узагальнення висновків про цю вибірці на ширшу популяцію. Наприклад, за участю в дослідженні студентів 2-го курсу університету, дані цього дослідження поширюються на «людей у \u200b\u200bвіці від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.
Наближене моделювання - формування моделі, яка для чітко визначеного класу систем (процесів) описує його поведінку (або потрібні явища) з прийнятною точністю.