Меню
Головна
 
Головна arrow Маркетинг arrow Маркетингові дослідження
< Попередня   ЗМІСТ   Наступна >

Потенційні джерела помилок в описових дослідженнях

Ми розглянули різні методи проведення описових досліджень. Ці методи, як вже зазначалося, спрямовані на вимірювання тих чи інших маркетингових показників. Але всякі вимірювання мають похибкою. В залежності від того, як організовано дослідження, ті чи інші складові загальної похибки змінюються і це впливає на її загальну величину. При розгляді цих питань будемо вважати, що метою дослідження є вимір характеристик деякої сукупності елементів, яку прийнято називати генеральної або досліджуваною сукупністю. Зібрати інформацію про всіх цих елементах не представляється можливим, тому випадковим чином відбираються і включаються у вибірку певні елементи досліджуваної сукупності. Це перше джерело помилки. Другий джерело - той факт, що зібрати інформацію найчастіше вдається не всім, а тільки в частині складових вибірку елементів. Нарешті, третє джерело помилки, що навіть та інформація, яку вдається зібрати, зазвичай не повністю відповідає істині. Поговоримо тепер більш докладно про змісті й структурі загальної похибки, або, користуючись прийнятою в літературі по маркетинговим дослідженням термінологією, загальною помилки (рис. 5.5).

Припустимо, що нам треба розрахувати середнє значення деякої величини за ідеально певним даними про всіх без винятку елементи досліджуваної сукупності. Позначимо це абсолютно точне середнє через . Насправді ж у нашому розпорядженні - реальні, в чомусь помилкові дані тільки щодо тієї частини потрапили в заплановану нами вибірку елементів, від яких вдалося отримати інформацію.

Загальна помилка являє собою різницю між істинним середнім в досліджуваній сукупності, яке нас цікавить, і середнім, розрахованим за даними, отриманими в ході дослідження.

Рис. 5.5. Структура загальної помилки

Перетворимо наведене вище вираз, додавши до нього і відразу віднявши з нього одну і ту ж величину: - середня, розрахована за ідеальним даними про елементи ідеальної, ще не спотвореної вибірки. Отримаємо:

Ми бачимо, що, спеціальним чином групуючи елементи отриманого виразу, ми розбили загальну похибку на дві різниці. Перший вираз в дужках відображає випадкову похибку вибірки. Вона пов'язана з тим, що замість збору даних про всі елементи досліджуваної сукупності ми будуємо випадкову вибірку з цих елементів. Другий вираз в дужках відповідає помилок, не пов'язаних з вибіркою. Вони є результатом, по-перше, неможливість точно реалізувати побудовану нами вибірку (наприклад, із-за відмови деяких респондентів брати участь в опитуванні) і, по-друге, неточності даних про частину або навіть про всіх охоплених дослідженням елементах.

Отже, випадкова помилка вибірки - це різниця між істинним середнім по всій досліджуваній сукупності і ідеальним вибірковим середнім. Це сама "чудова" складова загальної похибки дослідження, оскільки її розміри можна оцінити.

Ідею такої оцінки пояснимо на прикладі. Нехай ми хочемо дізнатися середній місячний дохід громадян Росії. Відповідно до нашої досліджуваної (генеральної) сукупності є N - кількість громадян нашої країни. Якщо б ми попросили всіх без винятку громадян країни назвати свій місячний дохід, а кожен громадянин не тільки знав правильну відповідь на це питання, але і повідомив його інтерв'юеру, то за умови безпомилкового введення даних в комп'ютер ми отримали б істинне середнє значення досліджуваного показника (доходу).

Розрахувати цю величину із зрозумілих причин неможливо. Як ми чинимо? Ми намагаємося оцінити її наступним чином: будуємо вибірку з цієї сукупності розміру n, випадковим чином, незалежно один від одного відібравши п громадян країни. Процедуру побудови випадкової вибірки можна уявити собі так: в гігантський обертовий барабан складені N згорнутих в трубочку папірців з координатами всіх громадян країни. Після перемішування з барабана одну за одною витягують n таких трубочок.

Уявімо собі, що від усіх без винятку відібраних респондентів вдалося отримати абсолютно точну інформацію про дохід. Усереднивши зібрані дані, ми отримаємо величину. Вона називається вибірковим середнім значенням доходу і, як відомо з математичної статистики, є оцінкою його дійсного середнього значення.

Оскільки ввійшли в дану вибірку респонденти відібрані нами випадковим чином, середнє - це одна з реалізацій послідовності випадкових чисел. Проведемо уявний експеримент. Давайте уявимо собі, що ми побудували не одну, а дуже велике число вибірок. Кожна вибірка дала нам нове, взагалі кажучи, іншу вибіркове середнє. У цих вибіркових середніх є два чудових властивості. Вони випадковим чином розподілені близько істинного середнього доходу, причому ймовірність появи вибіркового середнього тим вище, чим ближче воно до істинного середнього.

За яким же статистичному закону розподілені ці вибіркові середні? Якщо розмір вибірки досить великий, то чим більше вибірок ми побудуємо, тим ближче гістограма розподілу вибіркових середніх до класичного "колокольчику" кривої нормального розподілу (рис. 5.6). Це чудова властивість! Адже доходи жителів нашої країни розподілені далеко не нормально (у всіх сенсах!). Тим не менш усереднені по всім представникам вибірки доходи мають нормальний розподіл. Те ж можна сказати не тільки про доходи, але і практично про будь маркетингової характеристиці.

В реальності ніхто, звичайно, не будує багато вибірок, щоб з'ясувати, біля якого числа коливаються вибіркові середні. Однак побудувавши всього одну вибірку і розрахувавши всього один вибірковий середній дохід, ми можемо сказати, в якому діапазоні майже напевно знаходиться справжній середній дохід громадян країни. Але перш за все треба уточнити, який зміст ми вкладаємо в поняття "майже напевно".

В елементарній, "шкільної" математики багато теореми доводяться методом "від противного". Формулюється твердження, протилежне тому, яке потрібно довести, і шляхом логічних міркувань приходять до протиріччя. Протиріччям при цьому називається абсолютно неможлива ситуація, тобто така, ймовірність виникнення якої дорівнює нулю. Після цього робиться висновок, що протилежне твердження хибне, отже, вірно твердження, яке потрібно довести.

Рис. 5.6. Крива нормального розподілу вибіркових середніх значень

У статистиці пішли далі. Тут прийнято вважати практично неможливою ситуацію, ймовірність виникнення якої хоча і не нульова, але дуже маленька: менше певного, заздалегідь обраного порога. Зокрема, у маркетингових дослідженнях зазвичай вважаються практично неможливими події, ймовірність виникнення яких не перевищує 0,05, тобто які можуть відбутися в середньому не частіше ніж у п'яти випадках із ста.

Повернемося тепер до рис. 5.6. З властивостей нормального розподілу випливає, що якщо б ми побудували дуже багато вибірок, те лише приблизно 95 вибіркових середніх з кожних 100 потрапляли б в діапазон, пофарбований на малюнку в сірий колір, а виходили б за межі цього діапазону в середньому 5 вибірок з 100. Відхилення від істинного значення, яке може виникати настільки рідко, зазвичай визнається практично неможливим. Після цього робиться висновок, що з довірчою ймовірністю 0,95 вибіркові середні відхиляються від істинного середнього доходу населення не більш ніж на цю величину середньоквадратичного відхилення вибіркових середніх значень, помноженого на 1,96 (або приблизно на 2).

Виявляється, щоб визначити, в якому діапазоні знаходиться істинне середнє значення доходу, досить побудувати одну вибірку. Адже ми тепер знаємо, не більше ніж на яку величину наш замір може бути віддалений від істинного середнього доходу!

Залишилося розібратися, як розрахувати середньоквадратичне відхилення вибіркових середніх. Відомо, що воно разів менше середньоквадратичного відхилення самої випадкової величини, середнє значення якої ми хочемо визначити (у нашому випадку - доходу громадян Росії):

(5.1)

де σ - середньоквадратичне відхилення розподілу самої вимірюваної випадкової величини; - середньоквадратичне відхилення розподілу вибіркових середніх; n - розмір вибірки.

Однак дізнатися середньоквадратичне відхилення самої вимірюваної випадкової величини (в нашому випадку доходу) далеко не просто. По-перше, треба знати середній дохід в країні. (Нагадаємо, в його визначенні і полягає мета дослідження!) По-друге, треба знати відхилення доходу кожного громадянина країни від цього дійсного середнього значення. По-третє, кожне з цих відхилень потрібно звести в квадрат, отримані результати скласти і розділити на число громадян країни. По-четверте, потрібно витягти з отриманого результату квадратний корінь:

(5.2)

де σ - середньоквадратичне відхилення розподілу випадкової величини вимірюваної; хі - значення досліджуваного показника (доходу) i-го елемента досліджуваної сукупності; - істинне середнє значення досліджуваного показника (доходу); N - розмір досліджуваної сукупності (кількість громадян Росії).

Виходить, що для знаходження випадкової похибки вимірювання середнього доходу треба вже знати не тільки істинний середній дохід громадян країни, але і дохід кожного окремого громадянина! Замкнене коло!

Отже, ми ніяк не можемо дізнатися похибка вимірювання доходу, але ми можемо її оцінити. Якщо всі представники вибіркової сукупності опитані, оцінка середньоквадратичного відхилення ЗІ розраховується за формулою

(5.3)

де σ - середньоквадратичне відхилення розподілу випадкової величини вимірюваної; s - вибіркова оцінка середньоквадратичного відхилення розподілу випадкової величини вимірюваної; хі - значення досліджуваного показника (доходу) i-го елемента вибірки; - середнє значення досліджуваного показника (доходу); т - розмір вибірки.

Якщо опитування ще не проведено, для середньоквадратичного відхилення доводиться шукати оцінку зверху. Можливо, подібні дослідження колись вже проводилися, і можна скористатися їх результатами. Якщо немає, доводиться "закладатися на гірше".

Приклад 5.6

Розрахунок середнього значення

Найгіршим випадком з точки зору точності вимірювання доходу є ситуація, коли половина громадян не має доходу, а половина має дуже великий для середнього росіянина дохід, наприклад 50 000 руб. в місяць. Як середнє значення та середньоквадратичне відхилення доходу в цьому випадку дорівнює 25 000 руб. Якщо, наприклад, розмір вибірки становитиме 10 000 респондентів, отримаємо наступну оцінку випадкової помилки опитування Δ при рівні довірчої ймовірності 0,95:

(5.4)

Таким чином, якщо наше обережне припущення про розподіл доходів населення дає не надто завищену оцінку середньоквадратичного відхилення, то опитавши 10 000 респондентів за випадковою вибіркою, можна дізнатися середній дохід громадян країни з помилкою вибірки ±500 руб. в місяць.

Розглянемо тепер приватний випадок розглянутої ситуації: коли в результаті опитування потрібно визначити середнє значення деякої величини, а частку представників досліджуваної сукупності, що володіють деяким властивістю, наприклад дають певний відповідь на будь-яке питання анкети. (Це дійсно окремий випадок розрахунку середнього значення, так як частка нас цікавлять респондентів являє собою середнє значення, розраховане по набору з одиниць і нулів, за умови, що респондентам, які вибрали даний відповідь, приписується одиниця, а не вибрали - нуль.)

Введемо деякі позначення. Нехай π - частка від числа всіх представників досліджуваної сукупності, які дали б нас цікавить відповідь на питання. Якщо провести опитування випадкової вибірки респондентів розміром п, ця відповідь вибере, взагалі кажучи, інша частка представників вибірки. Позначимо її р Ясно, що р - одна з реалізацій послідовності випадкових чисел, яка виникла б, якби ми будували багато вибірок. Середньоквадратичне відхилення вибіркових часток розраховується за формулою

(5.5)

Зауважимо, що тут ми стикаємося з тією ж проблемою, що і при розрахунку середньоквадратичного відхилення вибіркових середніх за формулою (5.1): для розрахунку нам треба знати π - справжню частку обрали нас цікавить відповідь на питання, чого ми, звичайно, не знаємо не тільки до, але і після опитування. Як і в першому випадку, нам доведеться скористатися оцінкою. Однак у випадку часткою це зробити набагато простіше. Можна прийняти в розрахунках, що π = 0,5, оскільки в цьому випадку помилка вибірки максимальна.

Приклад 5.7

Розрахунок частки досліджуваної сукупності

Нехай нас цікавить частка громадян країни, які на певний запитання відповіли б "так". Нехай розмір побудованої нами вибірки становить 10 000 респондентів. Тоді похибку вибірки можна оцінити величиною:

(5.6)

Таким чином, частка громадян країни, які дали позитивну відповідь на питання, що цікавить нас при довірчій імовірності 0,95 буде визначена з помилкою вибірки ±0,5%.

Зауважимо, що якщо б в ході опитування частка таких відповідей склала б, наприклад, 10%, ми могли б перерахувати величину помилки, поставивши в підкореневий вираз не 0,5, а 0,1. З урахуванням цих нових знань ми оцінили б похибка вибірки величиною 0,3%.

Зробимо ще одне зауваження. У формулах (5.4) і (5.6) ми розраховували помилку вибірки, помноживши середньоквадратичне відхилення на 2. Нагадаємо, що таким чином ми округляли число 1,96, що відповідає довірчій імовірності 0,95. Якщо б ми хотіли отримати більш високі гарантії потрапляння вибіркових середніх і вибіркових часток у знайдені за цими формулами інтервали, ми могли б віддати перевагу довірчу ймовірність 0,99. Тоді нам потрібно було б замість коефіцієнта 1,96 використовувати коефіцієнт 2,58, а якщо, навпаки, ми вважали б достатньою довірчу ймовірність 0,9, - коефіцієнт 1,64.

У загальному випадку використовуються відповідно формули:

(5.7)

де r - коефіцієнт, що залежить від обраного рівня довірчої імовірності.

Зауважимо, що наведені вище формули (5.7) вірні для випадку, коли розмір вибірки пренебрежимо мала в порівнянні з числом елементів досліджуваної сукупності. Якщо ці розміри можна порівняти, помилка вибірки буде менше: праві частини формул слід помножити на понижувальний коефіцієнт k:

(5.8)

де N - число елементів досліджуваної сукупності; п - кількість елементів у вибірці.

Легко бачити, що коефіцієнт до наближається до одиниці, якщо N стає багато більше n, і зменшується при близьких між собою N і п, стаючи рівним нулю, коли вони рівні. Це й не дивно: при п = N опитані всі представники досліджуваної сукупності, тобто помилка вибірки відсутня.

Зазначимо ще, що наведені вище формули для розрахунку випадкової помилки побудови вибірки вірні лише для випадку, коли одиниці відбору витягуються з досліджуваної сукупності випадковим чином і незалежно один від одного. Якщо ж це не так, наприклад, якщо спочатку випадковим чином вибираються населені пункти, а потім в кожному з них відбирається по кілька респондентів, то помилка може збільшитися. Уявімо собі, що ми запитуємо респондентів про те, скільки коштує певний сорт масла в найближчому до них магазині. Тоді, скільки б респондентів, наприклад, у селі ми опитали, всі вони назвуть одну і ту ж ціну. Тоді помилка вибірки фактично буде визначатися не виходячи з числа респондентів, а виходячи із числа охоплених опитуванням сіл. У даному випадку число сіл буде "ефективним розміром вибірки".

Збільшення випадкової помилки вибірки за рахунок цього фактора називається дизайн-ефектом. Для його обліку визначена за наведеними вище формулами похибка множиться на спеціальний коефіцієнт, для розрахунку якого існують спеціальні комп'ютерні програми.

Для розрахунку цього коефіцієнта необхідно ввести в програму докладні дані про структуру вибірки. Програма оцінює, якою мірою розходяться між собою в думках жителі кожного з населених пунктів у порівнянні з розходженням в думках жителів різних населених пунктів. Складність полягає в тому, що для кожної відповіді на питання анкети цей розрахунок буде своїм і результати відповідно теж. Наприклад, улюблена марка автомобіля у кожного жителя села може бути своєю.

Перейдемо до розгляду помилок, не пов'язаних з вибіркою. Вони можуть виникати з різних причин: через дефектів постановки проблем, вибору підходу, шкалювання, розробки анкети, методів проведення інтерв'ю, підготовки даних і аналізу даних. Їх прийнято розділяти на помилки через відсутність відповідей і помилки відповідей.

Помилки із-за відсутності відповідей пов'язані з тим, що деякі з включених у вибірку респондентів відсутні удома або відмовляються дати інтерв'ю. З-за цього результуюча вибірка за розміром і, головне, за складом відрізняється від запланованої. Відповідно помилка через відсутність відповідей визначається як різниця між ідеальним вибірковим середнім і гіпотетичним середнім, ідеально правильно визначеним реально отриманій вибірці.

Помилки відповідей визначаються як різниця між середнім, ідеально правильно визначеним реально отриманій вибірці, і середнім, реально отриманих за результатами опитування. Ці помилки можуть робитися дослідником, інтерв'юером або респондентом.

Помилки дослідника - це такі види помилок.

1. Помилки вибору показники температурного інформації. Відмінність між інформацією, дійсно необхідної для розв'язання проблеми, і тієї, яку одержав дослідник. Наприклад, замість збору інформації про споживчому виборі нового продукту дослідник отримує інформацію про споживчих перевагах, так як процес вибору йому неможливо або, у всякому разі, дуже складно вивчати.

Але, як вже зазначалося, можна віддавати перевагу "Альфа-Ромео", а купувати "ВАЗ"!

2. Помилки вимірювання інформації. Відмінності між інформацією, яку можна було б спостерігати, та інформацією, фактично спостерігається в результаті застосованого способу вимірювання. Наприклад, у процесі відстеження споживчих переваг дослідник застосовує шкалу для вимірювання сприйняття, а не уподобань. (Це різні речі. Згадаймо хоча б прислів'я: "Хоч поганенький, та свій".)

3. Помилки визначення досліджуваної сукупності. Уявіть собі, наприклад, що потрібно вивчити купівельну поведінку заможних людей. Хто вони такі? У різних дослідженнях використовувалися принаймні три різних визначення цього поняття. Перше - сім'ї з середнім доходом понад 70 тис. руб. в місяць. Друге - верхні 20% домогосподарств з доходу. Третє - домогосподарства, здатні вільно витратити більше певної суми. Ясно, що результати дослідження багато в чому залежать від того, яке визначення буде прийнято. Іноді дослідник змушений замінювати одне - теоретично правильне - визначення досліджуваної сукупності іншим, яким можна користуватися практично. Так, в одному з опитувань, що проводився під керівництвом автора, досліджувану сукупність повинні були складати москвичі, які мають матеріальну можливість купувати побутову техніку та електроніку. Замовник вважав необхідним опитувати тільки осіб з доходом понад 200 дол. на члена сім'ї в місяць. Однак, якщо б інтерв'ю починалося з такого делікатного питання, як дохід сім'ї, можна було б заздалегідь припустити, що частка відмовилися дати інтерв'ю була б дуже великою. Це призвело б до різкого зростання помилок із-за відсутності відповіді. Тому було прийнято рішення, що досліджувану сукупність становлять ті, у кого вже є вдома якась побутова техніка, наприклад електричний чайник або праска. Зрозуміло, що така досліджувана сукупність дещо відрізняється від цільової групи, але, думається, в даній ситуації це - "найменше зло".

4. Помилки основи вибірок. Відмінність між досліджуваною сукупністю, яку дослідник вирішив вивчати, і тією сукупністю, з якою він буде мати справу в реальності, враховуючи наявний у нього список. Наприклад, список телефонних номерів, з якого робиться вибірка, зазвичай неточний: частина телефонів в ньому відсутній, а з частиною телефонів не відбувається з'єднання.

5. Помилки аналізу даних. Помилки, що виникають в процесі перетворення вихідних даних опитування в дослідницькі висновки. Зокрема, використання статистичної процедури, теоретичні передумови якої в даному випадку відсутні, може привести до невірної інтерпретації (наприклад, для обробки номінальних ознак використаний факторний аналіз).

Помилки інтерв'юера - це такі види помилок.

1. Помилки при виборі респондента виникають, коли інструкція по вибору респондентів суперечить плану вибірки або інтерв'юер відхиляється від інструкції. Наприклад, потрібно опитати читачів якоїсь газети, а інтерв'юер опитує юнака, який цю газету не читає, зареєструвавши його як читача. І це відбувається тільки тому, що інтерв'юеру треба опитати певну кількість 15-19-річних читачів газети, яких знайти вкрай складно.

2. Помилки при постановці питань робляться, коли питання в анкеті формулюються неправильно, наприклад звучать двозначно. Таке часто буває, якщо не проводиться пілотаж анкети. Пілотаж може показати, де потрібні додаткові пояснення. Буває і по-іншому: інтерв'юер допускає вольності при поводженні з наведеними в анкеті текстами. У цьому випадку неможливо зрозуміти, чи дійсно два респонденти по-різному відповіли на запитання чи їх по-різному питали.

3. Помилки запису виникають, якщо інтерв'юер неправильно расслышит, інтерпретує або запише відповіді респондента.

4. Помилки обману - сама "сумна річ. Деякі інтерв'юери підробляють окремі відповіді або навіть всю анкету. Наприклад, інтерв'юер не задає респондентові деякі чутливі питання, а потім придумує відповіді на свій розсуд.

Помилки респондента - це помилки із-за неможливості або небажання дати вірну відповідь.

1. Респондент іноді не може дати точної відповіді не знає предмета, забув правильну відповідь, втомився, йому нудно. Іноді винна невдала форма питання або його утримання. Наприклад, респондента просять пригадати сорт йогурту, який він купував в останній раз, а це було три місяці тому.

2. Респондент іноді не хоче давати точної відповіді, а дає соціально допустимі, соціально схвалювані відповіді. Наприклад, каже, ніби читає журнал "Підсумки", щоб створити про себе сприятливе враження.

Отже, є багато джерел помилок. Найважливіший принцип маркетингових досліджень - дбати про зниження загальної помилки, а не окремих її складових. Наприклад, недосвідчені дослідники часто збільшують вибірку, щоб зменшити пов'язані з нею помилки. При цьому нерідко збільшуються інші помилки. Наприклад, із-за поспіху, підвищеної навантаження ростуть помилки інтерв'юерів. Такі помилки "гірше", ніж помилки вибірки: їх не можна оцінити. Більш того, помилка вибірки зазвичай відносно невелика порівняно з іншими. Досвідчений дослідник іноді навмисно збільшує якусь помилку, щоб зменшити сумарну. Наприклад, проводиться поштове дослідження споживчих переваг щодо модного одягу. Якщо просто надіслати анкету за багатьма адресами, її заповнять і пришлють, як вже зазначалося, не більше 30% респондентів, причому особливих, які погодилися відповісти, на думку яких навряд чи можна судити про погляди всіх представників досліджуваної сукупності. А оскільки бюджет проекту вже буде витрачений на широку розсилку, нічого зробити не можна. У той же час досвід показує, що повернення анкет можна довести до 45%, якщо ще раз написати тим же респондентам, і до 55% - якщо їм написати двічі. Тому краще спочатку розіслати істотно менше анкет, а зекономлені кошти направити на листи-нагадування. Хоча це може підвищити випадкову помилку вибірки, але оцінка стане менше зміщеною, так як скоротяться помилки, пов'язані з відсутністю відповідей.

Інший приклад: досить поширене прагнення знайти варіант з найменшою питомою (тобто в розрахунку на одне інтерв'ю) вартістю опитування. Не секрет, що компанії з більш низькою питомою вартістю опитування економлять на всьому, починаючи з оплати інтерв'юерам і витрат на контроль їх роботи. При цьому, швидше за все, будуть найняті некваліфіковані інтерв'юери, робота яких не буде перевірятися. В результаті сильно зростуть помилки, не пов'язані з вибіркою.

 
< Попередня   ЗМІСТ   Наступна >

Схожі тими

Описові дослідження
Описові дослідження
Помилка (омана)
Загальна характеристика методів проведення описових досліджень. Кількісні методи досліджень
Переваги і недоліки причинних досліджень порівняно з описовими
Аналіз кадрового потенціалу організації
Пошукові дослідження
Поняття судової помилки
Приклади формування інтелектуального потенціалу організації
Управління розвитком людського потенціалу
 
Предмети
Банківська справа
БЖД
Бухоблік і аудит
Документознавство
Екологія
Економіка
Етика і естетика
Інвестування
Інформатика
Історія
Культурологія
Література
Логістика
Маркетинг
Медицина
Менеджмент
Політологія
Політекономія
Право
Психологія
Соціологія
Страхова справа
Товарознавство
Філософія
Фінанси