36. Разработка выборочного плана и определение объема выборки. Основные понятия
Маркетинговые исследования часто требуют оценки некоторой характеристики определенной интересующей совокупности. Исследование всей совокупности, т. е. всего списка ее представителей, неоправданно с точки зрения соотношения затрат и выгод. Это не только дорого, но и является бессмысленным. Далее, такой подход привел бы к менее точным результатам из-за ошибок, не связанных с выборкой. Совокупность можно определить как набор объектов, которые обладают некоторым совместным набором характеристик в соответствии с задачей маркетингового исследования.
На предоставленной стадии маркетинговых решений появляется необходимость приобрести данные о параметрах группы, среди членов которой будет проводиться маркетинговое исследование.
Исследователя обычно интересуют характеристики совокупности. Если всех респондентов совокупности просят предоставить информацию, такое исследование называется сплошным обследованием, или переписью. Сплошное обследование следует использовать в случае, если размеры самой совокупности невелики.
Сплошное обследование также проводится в связи с получением информации от каждого объекта совокупности. Далее, если затраты неверного решения велики или если велики ошибки выборки, то сплошное обследование может быть более целесообразным, нежели выборка. Процент телезрителей, полученный в результате переписи, называется параметром. С другой стороны, для статистики можно выбрать подмножество всех домохозяйств и получить от них требуемую информацию. Далее исследователи, зная соответствующую выборочную статистику, могут уже сделать заключение относительно параметра совокупности. Критичным для этого процесса является допущение о том, что сформулированная выборка является репрезентативной по отношению к совокупности. Процедуры оценки и проверки гипотез связывают выборочную статистику с соответствующими параметрами совокупности. Часто использование выборки может оказаться достаточным. Если совокупность, с которой приходится работать, является однородной, то вполне можно ограничиться выборкой.
Проводится изучение только части совокупности, которая называется выборкой и является частью изучаемой совокупности, приобретенные от выборки сведения, скорее всего, не будут в точности соответствовать сведениям, которые можно было бы приобрести от всех единиц совокупности. Разница между подлинными предоставленными и данными, приобретенными от выборки, называется ошибкой выборки. Ошибка выборки обусловливается парой факторов: методикой создания выборки и размером выборки.
37. Выбор соответствующей единицы выборки
Целевая совокупность состоит из единиц выборки, которыми могут быть люди, магазины, домохозяйства, трансакции организаций, продукты и т. д. Одна из задач состоит в определении того, какую единицу выборки можно считать соответствующей. При исследовании привычек населения следует использовать индивидуумов или домохозяйства? Выбор будет зависеть от целей исследования, а также и от некоторых суждений исследователя относительно потребительского поведения. Если исследователь считает, что решения в плане банковских операций или отдыха принимаются на уровне семьи, то соответствующей единицей выборки может оказаться домохозяйство. Однако если исследователь считает, что соответствующие решения принимаются членами домохозяйства сравнительно независимо друг от друга, то единицами выборки станут индивидуумы.
Необходимо четко определить, что не входит в целевую совокупность. Определение целевой совокупности должно четко показывать, что остается за ее пределами. Исследование намерений относительно голосования по определенным кандидатам или вопросам должно ограничить целевую совокупность людьми, которые достигли соответствующего возраста, а также теми, кто намеревается принять участие в голосовании, либо теми, кто участвовал в прошлых выборах.
Известно, что совокупность должна соответствовать целям исследования и его вопросам, однако исследователь не может по собственному желанию "переопределить" совокупность, так как она должна быть воспроизводимой. Определение совокупности не должно быть строгим до такой степени, что она окажется невоспроизводимой в будущем.
Когда есть выбор, предпочтительнее та совокупность, из которой удобнее производить выборку. Предположим, что совокупность должна включать тех, кого беспокоит шум самолетов. Сюда входят те, кто проживает в радиусе одной мили от аэропорта. Производить выборку из такой совокупности легко и удобно. Таким образом, удобное формирование выборки не должно приводить к искажению совокупности. Совокупность подписчиков "Sports IIIustrated" может быть удобной с точки зрения выборки, однако может не соответствовать целям исследования.
Важно провести различие между совокупностью и основой выборки, которая обычно является списком членов совокупности, используемым для формирования выборки. Это может быть список подписчиков журнала, список различных магазинов компьютерного оборудования или список студентов колледжа. Описание основы выборки не обязательно должно включать всех членов совокупности. Достаточно определить процедуру, при помощи которой можно будет найти любую единицу для включения в выборку.
38. Формирование списков
Самой большой проблемой при формировании простой случайной выборки является получение соответствующих списков.
Проблема состоит в том, что для специализированных совокупностей списков не существует. Не составлено списков людей с высоким доходом, матерей, игроков в теннис или велосипедистов. Использование просто удобного списка в подобной ситуации является решением, которое обычно нельзя назвать приемлемым. Если вас интересуют игроки в теннис, то, возможно, вам удастся получить список подписчиков журнала "Tennis World" либо список людей, являющихся членами того или иного теннисного клуба. Следовательно, ни один из этих списков не будет репрезентативным по отношению ко всей совокупности; тем не менее для некоторых целей они могут оказаться полезными. Если используются списки, которые не соответствуют совокупности, в исследование вносятся изменения, которые необходимо учитывать.
Главная проблема со списками состоит в том, чтобы не дать им устареть. Многие компании – производители товаров производственного назначения – поддерживают списки тех, кто проявил интерес к их продукции; эти списки используются для рассылки рекламных материалов. Такие организации, как благотворительные фонды, филармонии и художественные галереи, также имеют подобные списки, однако они быстро устаревают.
Многие специфические совокупности (такие как этические и религиозные группы, домохозяйства с высоким доходом) распределены по территории Соединенных Штатов неравномерно или сконцентрированы в ограниченном числе географических районов. Если в подобных случаях использовать традиционные методы формирования выборки, во многих районах попытки установить контакт с респондентом окончатся выводом, что данный респондент не подходит для исследования. Если такие районы (в которых отсутствуют члены интересующей совокупности) удастся выявить заранее при помощи данных переписей или других источников, можно сэкономить существенные средства. Если же заранее эти районы не известны, то возможность обеспечить экономию затрат все равно существует: для этого нужно использовать модифицированную процедуру Уоксберга.
Согласно этой процедуре сначала устанавливается контакт с одним респондентом (обычно по телефону) из каждого географического района. Если данный респондент принадлежит к интересующей совокупности, отбор в данном географическом районе продолжается до тех пор, пока не будет набрано заранее определенное число элементов выборки. Если же первый респондент не принадлежит к интересующей совокупности, то отбор далее не проводится. Таким образом, уже после первого звонка удается исключить все географические районы, в которых представители интересующей совокупности отсутствуют.
39. Решения при наличии различий совокупности и основы выборки
Если основа выборки не совпадает с определением совокупности, возникают три типа проблем :
1) проблема подмножества;
2) проблема супермножества;
3) проблема пересечения.
Проблема подмножества имеет место в том случае, когда основа выборки меньше совокупности. Другими словами, некоторые элементы совокупности не будут представлены в выборке. Если для выявления всех компаний с численностью персонала менее 1 тыс. сотрудников исследователь использует указатель предприятий малого бизнеса "Dun & Bradstreet", возникает проблема подмножества, поскольку в данном справочнике содержатся наименования компаний, в которых менее 500 сотрудников. Чтобы решить проблему подмножества, исследователю придется заново определить совокупность в терминах основы выборки либо найти другие источники данных.
Проблема супермножества имеет место, если основа выборки больше совокупности, однако при этом содержит все ее элементы. Исследователя интересует совокупность покупателей губной помады "Revlon".
Однако основа выборки представляет собой список покупателей всех косметических продуктов данной марки.
Чтобы решить эту проблему, исследователь может использовать фильтрующий вопрос "Покупаете ли вы губную помаду "Revlon?" – и в случае положительного ответа включать респондента в выборку.
Наиболее серьезная из подобного рода проблем – проблема пересечения – имеет место, если некоторые элементы совокупности отсутствуют в основе выборки, а сама основа содержит больше элементов, нежели целевая совокупность. Предположим, что исследователя интересуют владельцы небольших компаний с объемом продаж не менее 4 млн долл. Если исследователь будет использовать справочник "American Business", который содержит все компании (не обязательно небольшие) с продажами более 5 млн долл., возникнет проблема пересечения. Для решения подобных проблем исследователю придется не только заново определить совокупность, но и лучше сформулировать вопрос.
40. Выбор процедуры формирования выборки
Существует много способов формирования выборки и много решений, которые применяются при этом. Прежде всего исследователь должен выбрать между байесовским подходом и традиционной процедурой формирования выборки. Далее следует принять решение о том, будет ли это выборка с замещением или без него.
В большинстве случаев используют традиционную процедуру формирования выборки без замещения, поскольку с респондентом не устанавливают контакт дважды с целью получения одной и той же информации. Среди традиционных процедур формирования выборки некоторые являются неформальными. Можно опрашивать прохожих. Если ответы всех представителей совокупности одинаковы – продукт либо нравится всем, либо не нравится никому, – подобного рода подход можно считать удовлетворительным. Если необходимо определить, не слишком ли холодна вода в бассейне, брать случайную выборку не обязательно – достаточно измерить температуру в одном месте, поскольку она одинакова по всему бассейну.
Однако в большинстве случаев ситуация сложнее. Вопросов, на которые следует получить ответы, несколько, а сами ответы сильно различаются между собой. Возникает необходимость формирование репрезентативной по отношению к совокупности выборки, которая будет состоять более чем из сотни единиц. Наиболее предпочтительным подходом является использование случайной выборки (в ходе формирования которой используется некоторая процедура рандомизации). Для случайной выборки вероятность попадания каждого элемента совокупности в выборку известна. В большинстве случаев при формировании случайной выборки информацию как по основе выборки, так и по объектам (единицам) выборки нужно получить до начала самого процесса ее формирования.
Случайные выборки имеют ряд преимуществ перед неслучайными выборками. Во-первых, они позволяют исследователю продемонстрировать репрезентативность выборки. Во-вторых, можно четко определить погрешность, возникающую из-за того, что вместо сплошного обследования совокупности используется выборка. В-третьих, случайная выборка позволяет более четко определить возможные искажения.
При формировании случайной выборки следует учесть четыре момента :
1) должна быть определена целевая совокупность – группа, информацию о которой стремимся получить;
2) должен быть разработан метод отбора элементов выборки;
3) принять решение по размеру выборки, которая будет зависеть от требуемой точности, дисперсии совокупности и затрат;
4) принять меры по решению проблемы неполучения ответа.
Методы формирования неслучайных выборок включают:
1) отбор на основе принципа удобства;
2) отбор на основе суждений;
3) формирование выборки в процессе обследования;
4) формирование выборки на основе квот.
41. Выбор метода формирования случайной выборки
Для формирования случайной выборки можно использовать различные методы. Простой случайный отбор осуществляется с помощью следующих методов :
1) формирование выборки вслепую;
2) с помощью таблицы случайных чисел.
Чаще других применяется простая случайная выборка . Она имеет не только практическую ценность – это хороший способ для понимания логики и силы случайной выборки. Простая случайная выборка – подход, при котором каждый член совокупности, и следовательно, каждая из возможных выборок имеет одинаковую вероятность быть выбранной. Сам процесс формирования прост. Необходимо написать имя каждого человека, входящего в совокупность, на бумажке и положить их в большую чашу. Тщательно перемешать, после чего вытащить определенное число элементов.
Использование таблиц случайных чисел обычно является более практичным подходом, нежели применение чаши. Они составляются путем включения чисел случайным образом, единицы совокупности находятся под порядковыми номерами. Таблица случайных чисел – это длинный список чисел, каждое их которых генерируется компьютером, и он случайным образом выбирает цифры от 0 до 9. Такая таблица обладает характерным свойством: знание строки из 10 чисел не дает никакой информации относительно того, каким окажется 11-е число Пример: необходимо сформировать выборку из 5 тыс. владельцев абонементов на оперный сезон. Из случайных чисел, представленных в таблице, можно взять следующую последовательность:
7659/0783/4710/3749/7741/2960/0016/9347 -
и сформировать выборку из пяти элементов, в которую войдут следующие владельцы абонементов:
0783/4710/3749/2960/0016.
Числа больше 5000 отбрасываются.
В качестве отправной точки исследователь может использовать любую ячейку таблицы – при условии, что он делает этот выбор перед тем, как посмотреть на цифры. Не следует исключать некоторые цифры как из-за того, что они "не выглядят случайными", так и из-за того, что они по той или иной причине являются "неудобными".
Если первоначально список владельцев сезонных билетов упорядочен случайным образом, то вместо использования сгенерированной компьютером таблицы случайных чисел можно взять первых владельцев абонементов из списка. Однако всегда существует опасность того, что список может иметь некоторые очевидные отличия от случайного порядка. Возможно, он был подготовлен согласно последовательности, в которой покупались абонементы, таким образом, более заинтересованные и более организованные клиенты будут находиться в начале списка. Использование таблицы случайных чисел устраняет подобные вопросы.
42. Компромисс "точность-стоимость"
Компромисс между стоимостью использования процедуры случайной выборки и получаемой в результате точностью лучше всего описывается термином "эффективность выборки" , которая определяется как соотношение точности и стоимости. Следовательно, чем выше стоимость, тем большая точность будет обеспечена. Исследователи всегда стремились к повышению эффективности выборок, и эти попытки привели к разработке различных методов их формирования.
Среди реальных способов повышения эффективности выборки можно перечислить следующие :
1) поддержание точности на постоянном уровне и снижение стоимости;
2) поддержание стоимости на постоянном уровне и повышение точности;
3) повышение точности более высокими темпами, чем повышение стоимости;
4) уменьшение точности более низкими темпами, нежели уменьшение стоимости.
Решение в объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации, прежде всего имеются в виду затраты на проведение опроса.
Сбор данных может быть реализован силами сотрудников маркетинговой службы, силами специально созданной группы или с привлечением компаний, специализирующихся на сборе данных. Самым дорогостоящим этапом исследования является сам процесс сбора информации. Реализуя данный процесс, можно совершить очень большое количество вневыборочных ошибок. Это такие ошибки, которые могут включать выбор неверных элементов выборки для взятия интервью, ложные оценки, даваемые интервьюируемыми преднамеренно, возможна даже фальсификация полученных данных со стороны интервьюера. Ошибки могут совершаться также при переписывании собранной информации из анкет. В отличие от ошибок выборки вневыборчные ошибки не могут быть измерены.
Таким образом, чтобы предотвратить появление вневыборочных ошибок, необходимо заранее предпринимать соответствующие меры по их предотвращению.
Анализ данных начинается с преобразования исходных данных (введение в компьютер, проверка на наличие ошибок, кодирование и др.).
Данные действия необходимо проводить для того, чтобы перевести массу необработанных данных в правильную информацию. Далее проводится статистический анализ (рассчитываются средние величины, частоты, коэффициенты регрессии и корреляции, осуществляется анализ трендов и т. д.).
После проведенного отчета готовится заключительный отчет. Вся структура заключительного отчета должна соответствовать особым требованиям заказчика, однако отчет можно разделить на три части: вводную, основную, заключительную.