Общая теория статистики: конспект лекции - Коник Нина Владимировна 5 стр.


Интервалы групп могут быть замкнутыми, когда указаны нижняя и верхняя границы, и открытыми, когда указана лишь одна из границ групп. Открытые интервалы применяются только для крайних групп. При группировке с неравными интервалами желательно образование групп с замкнутыми интервалами. Это способствует точности статистических вычислений.

Одна из целей статистического наблюдения – выявление связей и зависимостей между общественными явлениями. Важной задачей статистического анализа, проводимого на основе типологической группировки, т. е. в пределах однокачественных совокупностей, является задача изучения и измерения связи между отдельными признаками. Установить факт наличия такой связи позволяет аналитическая группировка.

Аналитическая группировка – распространенный прием статистического изучения связей, которые обнаруживаются при параллельном сопоставлении обобщенных значений признаков по группам. Различают признаки зависимые, значения которых изменяются под влиянием других признаков (их обычно в статистике называют результативными), и факторные признаки, оказывающие влияние на другие. Обычно в основе аналитической группировки лежит признак-фактор, а по результативным признакам производится расчет групповых средних, по изменению величины которых определяют наличие связи между признаками.

Таким образом, аналитическими можно назвать такие группировки, которые позволяют установить и изучить связь между результативными и факторными признаками единиц однотипной совокупности.

Важная проблема аналитических группировок – правильный выбор числа групп и определение их границ, что в последующем обеспечивает объективность характеристик связи. Поскольку анализ ведется в однокачественных совокупностях, теоретических оснований для дробления определенного типа нет. Поэтому допустима разбивка совокупности на любое число групп, удовлетворяющее определенным требованиям и условиям конкретного анализа. В процессе аналитических группировок следует соблюдать общие правила группировки, т. е. единицы в образованных группах должны быть существенно различны, количество единиц в группах должно быть достаточным для расчета надежных статистических характеристик. Кроме того, групповые средние должны подчиняться определенной закономерности: последовательно увеличиваться или уменьшаться.

Непосредственная группировка данных статистического наблюдения – это первичная группировка. Вторичная группировка – это перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:

1) если ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;

2) для сравнения данных, относящихся к различным периодам времени или к различным территориям, если первичная группировка была произведена по разным группировочным признакам или по разным интервалам. Существует два способа вторичной группировки:

1) объединение мелких групп в более крупные;

2) выделение определенной доли единиц совокупности.

В научно обоснованной группировке общественных явлений необходимо учитывать взаимозависимость явлений и возможность перехода постепенных количественных изменений в явлениях к коренным качественным изменениям. Группировка может быть научной лишь в том случае, если не только определены познавательные цели группировки, но и правильно выбрано основание группировки – группировочный признак. Если группировка – это распределение на однородные группы по какому-либо признаку, объединение отдельных единиц совокупности в группы, однородные по какому-либо признаку, то группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы.

При выборе группировочного признака важным является не способ выражения признака, а его значение для изучаемого явления. С этой точки зрения для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.

Самая простая группировка – ряд распределения. Рядами распределения называются ряды чисел (цифр), характеризующие состав или структуру какого-либо явления после группировки статистических данных об этом явлении. Ряд распределения – это группировка, в которой для характеристики групп применяется один показатель – численность группы, т. е. это ряд чисел, показывающий, как распределяются единицы совокупности по изучаемому признаку.

Ряды, построенные по атрибутивному признаку, называют атрибутивными рядами. Приведенный ряд распределения содержит три элемента: разновидности атрибутивного признака (мужчины, женщины); численности единиц в каждой группе, называемые частотами ряда распределения; численности групп, выраженные в долях (процентах) от общей численности единиц, называемые частостями. Сумма частостей равна 1, если они выражены в долях единицы, и 100%, если они выражены в процентах.

Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Числовые значения количественного признака в вариационном ряду распределения называются вариантами и располагаются в определенной последовательности. Варианты могут выражаться числами положительными и отрицательными, абсолютными и относительными. Вариационные ряды делятся на дискретные и интервальные.

Дискретные вариационные ряды характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т. е. принимающему целые значения. При построении ряда распределения с дискретной вариацией признака все варианты выписываются в порядке возрастания их величины, подсчитыва-ется, сколько раз повторяется одна и та же величина варианта, т. е. частота, и записывается в одной строке с соответствующим значением варианта (например, распределение семей по числу детей). Частоты в дискретном вариационном ряду, как и в атрибутивном, могут быть заменены частостями.

В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале, например распределение работников фирмы по уровню дохода.

При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Оптимальное число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Чаще всего число групп устанавливается по формуле:

k = 1 + 3,32lgN = 1,441lgN + 1

где k – число групп;

N – численность совокупности.

Например, предположим, что необходимо построить вариационный ряд сельскохозяйственных предприятий по урожайности зерновых культур. Число сельскохозяйственных предприятий 143. Как определить число групп?

k = 1 + 3,321lgN = 1 + 3,321lg143 = 8,16

Число групп может быть только целым числом, в данном случае – 8 или 9.

Если полученная группировка не удовлетворяет требованиям анализа, то можно произвести перегруппировку. Не следует стремиться к очень большому количеству групп, так как в такой группировке нередко исчезают различия между группами. Также надо избегать образования и слишком малочисленных групп, включающих несколько единиц совокупности, потому что в таких группах перестает действовать закон больших чисел и возможно проявление случайности. Когда не удается сразу наметить возможные группы, собранный материал сначала разбивают на значительное количество групп, а затем укрупняют их, уменьшая количество групп и создавая качественно однородные группы.

Таким образом, во всех случаях группировки должны быть построены так, чтобы образованные в них группы как можно полнее отвечали действительности, были бы видны различия между группами и не объединялись бы в одну группу существенно различающиеся между собой явления.

3. Статистические таблицы

После того как данные статистического наблюдения собраны и даже сгруппированы, их трудно воспринимать и анализировать без определенной, наглядной систематизации. Результаты статистических сводок и группировок получают оформление в виде статистических таблиц.

Статистическая таблица – таблица, которая дает количественную характеристику статистической совокупности и представляет собой форму наглядного изложения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду она представляет собой комбинацию вертикальных и горизонтальных строк. В ней обязательно должны быть общие боковые и верхние заголовки. Еще одной особенностью статистической таблицы является наличие в ней подлежащего (характеристика статистической совокупности) и сказуемого (показателя, характеризующего совокупности). Статистические таблицы являются формой наиболее рационального изложения результатов сводки или группировки.

Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк.

Сказуемое таблицы – это те показатели, с помощью которых дается характеристика явления, отображаемого в таблице.

Подлежащее и сказуемое таблицы могут располагаться по-разному. Это технический вопрос, главное, чтобы таблица была легко читаемой, компактной и легко воспринималась.

В статистической практике и исследовательских работах используются таблицы различной сложности. Это зависит от характера изучаемой совокупности, объема имеющейся информации, задач анализа. Если в подлежащем таблицы содержится простой перечень каких-либо объектов или территориальных единиц, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Простые таблицы имеют самое широкое применение в статистической практике. Характеристика городов Российской Федерации по численности населения, средней зарплате и иному представляется простой таблицей. Если подлежащее простой таблицы содержит перечень территорий (например, областей, краев, автономных округов, республик и т. д.), то такая таблица называется территориальной.

Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц – групповых и комбинационных.

Групповые таблицы в отличие от простых содержат в подлежащем не простой перечень единиц объекта наблюдения, а их группировку по одному существенному признаку. Простейшим видом групповой таблицы являются таблицы, в которых представлены ряды распределения. Групповая таблица может быть более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других важных показателей, количественно и качественно характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет сделать определенные практические выводы. Более широкими аналитическими возможностями располагают комбинационные таблицы.

Комбинационными называются статистические таблицы, в подлежащем которых группы единиц, образованные по одному признаку, подразделяются на подгруппы по одному или нескольким признакам. В отличие от простых и групповых таблиц комбинационные позволяют проследить зависимость показателей сказуемого от нескольких признаков, которые легли в основу комбинационной группировки в подлежащем.

Наряду с перечисленными выше таблицами в статистической практике применяют таблицы сопряженности (или таблицы частот). В основе построения таких таблиц лежит группировка единиц совокупности по двум или более признакам, которые называются уровнями. Например, население делится по полу (мужской, женский) и т. п. Таким образом, признак А имеет n градаций (или уровней) A1 A2, An (в примере n = 2). Далее изучается взаимодействие признака А с другим признаком – В, который подразделяется на k градаций (факторов) B1, B2, Bк. В нашем примере признак В – принадлежность к какой-либо профессии, а B1, B2,., Bk принимают конкретные значения (доктор, водитель, учитель, строитель и т. д.). Группировка по двум и более признакам используется для оценки взаимосвязей между признаками А и В.

В «свернутом» виде результаты наблюдений можно представить таблицей сопряженности, состоящей из n строк и k столбцов, в ячейках которых проставлены частоты событий nij, т. е. количество объектов выборки, обладающих комбинацией уровней Аi и Bj. Если между переменными A и B имеется взаимно-однозначная прямая или обратная функциональная связь, то все частоты nij концентрируются по одной из диагоналей таблицы. При связи не столь сильной некоторое число наблюдений попадает и на недиагональные элементы. В этих условиях перед исследователем стоит задача выяснить, насколько точно можно предсказать значение одного признака по величине другого. Таблица частот называется одномерной, если в ней табулирована только одна переменная. Таблица, в основе которой лежит группировка по двум признакам (уровням), которые табулируются по двум признакам (факторам), называется таблицей с двумя входами. Таблицы частот, в которых табулируются значения двух или более признаков, называются таблицами сопряженности.

Из всех видов статистических таблиц наиболее широкое применение имеют простые таблицы, реже применяются групповые и особенно комбинационные статистические таблицы, а таблицы сопряженности строят для проведения специальных видов анализа. Статистические таблицы служат одним из важных способов выражения и изучения массовых общественных явлений, но лишь при условии их правильного построения.

Форма любой статистической таблицы должна наилучшим образом отвечать сущности выражаемого ею явления и целям его изучения. Это достигается путем соответствующей разработки подлежащего и сказуемого таблицы. Внешне таблица должна быть небольшой и компактной, иметь название, указание единиц измерения, а также времени и места, к которым относятся сведения. Заголовки строк и граф в таблице даются кратко, но точно и ясно. Чрезмерное загромождение таблицы цифровыми данными, неряшливое оформление затрудняют ее чтение и анализ. Перечислим основные правила построения статистических таблиц.

1. Статистическая таблица должна быть компактной и отражать только те исходные данные, которые прямо отражают исследуемое социально-экономическое явление в статике и динамике.

2. Заголовок статистической таблицы и название граф и строк должны быть четкими, краткими, лаконичными. В заголовке должны быть отражены объект, признак, время и место совершения события.

3. Графы и строки следует нумеровать.

4. Графы и строки должны содержать единицы измерения, для которых существуют общепринятые сокращения.

5. Лучше всего располагать сопоставляемую в ходе анализа информацию в соседних графах (либо одну под другой). Это облегчает процесс ее сравнения.

6. Для удобства чтения и работы числа в статистической таблице следует проставлять в середине граф, строго одно под другим: единицы под единицами, запятая под запятой.

7. Числа целесообразно округлять с одинаковой степенью точности (до целого знака, до десятой доли).

8. Отсутствие данных обозначается знаком умножения «ч», если данная позиция не подлежит заполнению, отсутствие сведений обозначается многоточием (…), либо н. д., либо н. св., при отсутствии явления ставится знак тире (-).

9. Для отображения очень малых чисел используют обозначение 0.0 или 0.00.

10. Если число получено на основании условных расчетов, то его берут в скобки, сомнительные числа сопровождают вопросительным знаком, а предварительные – знаком «!».

В случае необходимости дополнительной информации статистические таблицы сопровождаются сносками и примечаниями, в которых разъясняются, например, сущность специфического показателя, примененной методологии и т. д. Сносками пользуются для того, чтобы указать на ограничивающие обстоятельства, которые надо принять во внимание при чтении таблицы.

При соблюдении этих правил статистическая таблица становятся основным средством представления, обработки и обобщения статистической информации о состоянии и развитии изучаемых социально-экономических явлений.

4. Графические представления статистической информации

Полученные в результате сводки или статистического анализа в целом числовые показатели могут быть представлены не только в табличной, но и в графической форме. Использование графиков для представления статистической информации позволяет придать статистическим данным наглядность и выразительность, облегчить их восприятие, а во многих случаях и анализ. Многообразие графических представлений статистических показателей дает огромные возможности для наиболее выразительной демонстрации явления или процесса.

Графиками в статистике называются условные изображения числовых величин и их соотношений в виде различных геометрических образов – точек, линий, плоских фигур и т. п.

Статистический график позволяет сразу оценить характер изучаемого явления, присущие ему закономерности и особенности, тенденции развития, взаимосвязь характеризующих его показателей.

Каждый график состоит из графического образа и вспомогательных элементов. Графический образ – это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Вспомогательные элементы графика включают общее название графика, оси координат, шкалы, числовые сетки и числовые данные, дополняющие и уточняющие изображаемые показатели. Вспомогательные элементы облегчают чтение графика и его истолкование.

Назад Дальше