Стадии статистического исследования. Этапы статистического исследования

  • 12.10.2019

Введение

1. Методика получения исходных данных

2. Статистическая сводка и группировка первичных данных

2.1 Группировка

2.2 Определение средней арифметической и структурных средних

2.3 Гистограмма и кумулята

2.4 Стоимость основных фондов

2.5 Объем продукции

3. Корреляционный анализ

3.1 Исследование связи между факторным и результативным признаками. Построение корреляционной таблицы

3.2 Определение степени тесноты связи

4. Регрессионный анализ

4.1 Моделирование

4.2 Прогнозирование

Заключение

Использованная литература и программы

Введение

Статистическое исследование явлений общественной жизни начинается с этапа статистического наблюдения, в ходе которого, в соответствии с познавательными целями и задачами, формируется массив исходных данных об изучаемом объекте, т.е. формируется информационная база исследования, на которой осуществляется учет и контроль, планирование, статистический анализ и управление. На этом этапе используются методы массового наблюдения, основанные на "законе больших чисел", т.к. количественные закономерности массовых явлений отчетливо проявляются при изучении лишь достаточно большого числа социально-экономических явлений и процессов.

Любое статистическое наблюдение должно подготавливаться и проводится по четко разработанному плану, который включает вопросы методологии, организации и техники сбора данных, контроля её качества и достоверности. Таким образом, статистическое наблюдение должно иметь программу и организационный план проведения. При этом необходимо решить вопросы о способе, форме, виде, средствах, сроках, месте организации и проведения наблюдения и т.д., чем, в свою очередь, и определяется его планомерность.

Статистическое наблюдение должно проводиться не стихийно, от случая к случаю, а систематически: либо непрерывно, либо периодически - через равные промежутки времени. Это обуславливается пространственно-временной вариацией изучаемых социально-экономических явлений и процессов.

Статистическое наблюдение может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими и аналитическими службами различных организационных структур.

Вторым этапом статистического исследования является статистическая сводка и группировка данных статистического наблюдения. В результате статистического наблюдения получают сведения о каждой единице совокупности, которая обладает многочисленными признаками, изменяющимися во времени и пространстве. В этих условиях возникает необходимость в систематизации и обобщении результатов статистического наблюдения и получении на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, с тем чтобы стало возможным выявить характерные особенности, специфические черты статистической совокупности в целом и отдельных её составляющих и обнаружить закономерности изучаемых социально-экономических явлений и процессов. Из сказанного следует необходимость сводки первичного статистического материала.

Статистическая сводка проводится по специально разработанной программе, обеспечивающей полноту и достоверность получаемых результатов. Эта программа содержит перечень групп, на которые может быть разбита совокупность единиц наблюдения по отдельным признакам, а также систему показателей, характеризующих изучаемую совокупность явлений в целом и отдельных её частей.

Третий этап статистического исследования - анализ статистической информации. На данном этапе по результатам статистического исследования получаются выводы, полезные для практических действий, а также проводится прогнозирование исследуемого явления или процесса.

1. Методика получения исходных данных

С целью изучения зависимости объема продукции от стоимости основных фондов за период 2006-2007гг. территориальным органом государственной статистики по Челябинской области организовано статистическое исследование приборостроительных предприятий.

Произведена 20-ти процентная типическая выборка.

Объект статистического наблюдения - совокупность приборостроительных предприятий г. Челябинск и Челябинской области. Отчетной единицей статистического наблюдения является приборостроительное предприятие.

С целью совершенствования системы выборочных обследований приборостроительных предприятий Госкомстатом РФ разработана целевая Программа.

Согласно Программе с целью экономии ресурсов будут исследованы 20% от общего числа предприятий Челябинской области, действующих на дату проведения работ. В состав мероприятий Программы включен ряд организационно-методологических и программно-технологических работ, обеспечивающих подготовку и проведение выборочных обследований приборостроительных предприятий, тематика которых охватывает такой вопрос как зависимость объема продукции от стоимости основных фондов. В целях обеспечения надлежащих процедур подготовки выборочных обследований предприятий в состав мероприятий Программы включены также вопросы обучения персонала по обследованию и проведению информационно-разъяснительной работы. Реализацию Программы предполагается осуществить в течение 2008-2009 гг. Результаты выборочного наблюдения приборостроительных предприятий г. Челябинск и Челябинской области по двум показателям (объем продукции и стоимость основных фондов) приведены в таблице 1.

Таблица 1 . Основные показатели деятельности приборостроительных предприятий г. Челябинск и Челябинской области за период 2006 - 2007 гг.

№ завода

Стоимость основных фондов,

Объем продукции, млн. руб.

№ завода

Стоимость основных фондов,

Объем продукции, млн. руб.

2. Статистическая сводка и группировка первичных данных

2.1 Группировка

По данным статистического наблюдения видно, что вариация признаков проявляется в сравнительно узких границах и распределение носит равномерный характер. В этом случае строят группировку с равными интервалами. Количество групп зависит в первую очередь от степени колеблемости признака: чем больше колеблемость признака (размах вариации), тем больше можно образовать групп. Ниже приведены формулы для построения статистической группировки.

Т. к. объем выборочной совокупности не большой, то для определения числа групп воспользуемся формулой:

Величина интервала h по формуле:

Полученную по формуле (1.2) величину, которая будет являться шагом интервала, округляют (округление не должно отличаться от исходного значения более, чем на 10-15%). При этом для первого интервала нижней границей будет являться , а верхней - (+ h ) и т.д. Таким образом, нижняя граница i -го интервала равна верхней границе (i -1) - го интервала.Реферат >> Философия

... этапов . 1.Основные этапы развития социологии 1.1Первый этап ... , "Основные вопросы марксизма", "Искусство и общественная жизнь" , "К... натуралистические трактовки общественных явлений . Суть... достоверности статистической информации в социологических исследованиях" . ...

  • Маркетинговые исследования в сфере туризма

    Шпаргалка >> Физкультура и спорт

    Туризма региона, научные и статистические исследования в сфере туризма, подготовка... (член комиссии). 3. Основной этап : организация работы аттестационной... т.д.). Метод - способ познания, исследования явлений общественной жизни , прием или система приемов в...

  • Методы статистического исследования (2)

    Контрольная работа >> Экономика

    Стоимости жизни . Индекс... статистического исследования Статистическое исследование состоит из трех основных стадий: статистического ... этапе исследования ; составляется организационный план его проведения; определяются объект (совокупность общественных явлений ...

  • Статистические методы анализа макроэкономических показателей (1)

    Реферат >> Маркетинг

    ... статистического изучения………………………………………………………………………..4 2.2.Система статистических показателей макроэкономики………………..6 2.3.Основные ... уровня жизни населения... этапе статистического исследования применяют метод статистического ... общественных явлений отражаются...

  • В основе любого статистического исследования лежат три взаимосвязанных этапа работы:

    1) статистическое наблюдение;

    2) сводка и группировка данных наблюдения;

    3) научная обработка и анализ результатов сводки. Каждая последующая стадия статистического исследования может быть проведена при условии, что были осуществлены предшествующие (предшествующая) ей стадии работы.

    Статистическое наблюдение – это первая стадия статистического исследования.

    Статистическое наблюдение – это планомерное, научно организованное собирание сведений о той или иной совокупности общественных и, в частности, экономических явлений или процессов.

    Статистические наблюдения весьма многообразны и различаются характером исследуемых явлений, формой организации, временем наблюдения, полнотой охвата изучаемых явлений. В связи с этим была проведена классификация статистических наблюдений по отдельным признакам .

    1. По форме организации статистические наблюдения делятся на отчетность и специально организованные статистические наблюдения.

    Отчетность – это основная организационная форма статистического наблюдения, которая сводится к собиранию сведений от предприятий, учреждений и организаций о различных сторонах их деятельности на специальных бланках, называемых отчетами. Отчетность носит обязательный характер. Отчетность делится на основную и текущую в зависимости от продолжительности периода, относительно которого она составляется.

    Основная отчетность также называется годовой и содержит наиболее широкий круг показателей, охватывающих все стороны деятельности предприятия.

    Текущая отчетность представляется в течение года за различные по продолжительности промежутки времени.

    Однако существуют данные, которые принципиально невозможно получить на основе отчетности и данные, которые нецелесообразно включать в нее. Именно для получения этих двух видов данных используются специально организованные статистические наблюдения – различного рода обследования и переписи.

    Статистические обследования – это такие специально организованные наблюдения, при которых исследуемая совокупность явлений подвергается наблюдению в течение определенного периода времени.

    Перепись – это такая форма специально организованного статистического наблюдения, при котором исследуемая совокупность явлений наблюдается на какую‑либо дату (на некоторый момент).

    2. По признаку времени все статистические наблю дения делятся на непрерывные и прерывные.

    Непрерывное (текущее) статистическое наблюдение – это наблюдение, которое осуществляется во времени непрерывно. При данном виде наблюдения отдельные явления, факты, события регистрируются по мере их возникновения.


    Прерывное статистическое наблюдение – это наблюдение, при котором наблюдаемые явления, факты, события регистрируются не непрерывно, а через периоды времени равной или неравной продолжительности. Различают две разновидности прерывного наблюдения – периодическое и единовременное. Периодическим называется прерывное наблюдение, которое проводится через периоды времени равной продолжительности. Единовременным называется наблюдение, которое проводится через периоды времени неравной продолжительности или имеющие разовый характер.

    3. По признаку полноты охвата изучаемой массы явлений, фактов, событий статистические наблюдения делятся на сплошные и несплошные, или частичные.

    Сплошное наблюдение имеет целью учет всех без исключения явлений, фактов, событий, образующих исследуемую совокупность.

    Несплошное наблюдение имеет целью учет лишь некоторой части явлений, фактов, событий, образующих исследуемую совокупность.

    Статистическое наблюдение заключается в сборе первич­ного статистического материала, в научно организованной регистрации всех существенных фактов, относящихся к рассмат­риваемому объекту. Это первый этап всякого статистического исследования.

    Метод группировок дает возможность все собранные в результате массового статистического наблюдения факты подвергать систематизации и классификации. Это второй этап статистического исследования.

    Метод обобщающих показателей позволяет харак­теризовать изучаемые явления и процессы при помощи статистических величин - абсолютных, относительных и средних. На этом этапе статистического исследования выявляются взаимосвязи и масштабы явлений, определяются законо­мерности их развития, даются прогнозные оценки.

    На первом этапе статистического исследования форми­руются первичные статистические данные, или исходная статистическая информация, которая является фундаментом будущего статистического здания. Чтобы здание было прочным, добротной и качественной должна быть его основа. Если при сборе первичных статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов. Поэтому, статистическое наблюдение от начальной до завершающей стадии - получения итоговых материалов - должно быть тщательно продуманным и четко ооганизованным. Статистическое наблюдение дает исходный материал для обобщения, началом которого служит сводка. Если при статистическом наблюдении о каждой его единице получают сведения, характеризующие ее с многих сторон, то данные сводки характеризуют всю статистическую совокупность и отдельные ее части. На этой стадии совокупность делится по признакам различия и объединяется по признакам сходства, подсчитываются суммарные показатели по группам и в целом. С помощью метода группировок изучаемые явления делятся на важнейшие типы, характерные группы и подгруппы по существенным признакам. С помощью группировок ограничивают качественно однородные в существенном отношении совокупности, что является предпосылкой для определения и применения обобщающих показателей.

    На заключительном этапе анализа с помощью обобщающих показателей рассчитываются относительные и средние величины, дается сводная оценка вариации признаков, характеризуется динамика явлений, применяются индексы, балансовые построения, рассчитываются показатели, характеризующие тесноту связей в изменении признаков. С целью наиболее рационального и наглядного изложения цифрового материала он представляется в виде таблиц и графиков.

    Статистическое наблюдение - первый этап статистического исследования

    Статистическое наблюдение - это первая стадия всякого статистического исследования, представляющая собой научно организованный по единой программе учет фактов, характе­ризующих явления и процессы общественной жизни, и сбор полученных на основе этого учета массовых данных.

    Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности. Поэтому статистическое наблюдение должно быть планомерным, массовым и систематическим.

    Планомерность статистического наблюдения заключается в том, что оно готовится и проводится по разработанному плану, который включает вопросы методологии, организации, техники сбора информации, контроля за качеством собранного материала, его достоверности, оформления итоговых результатов. Массовый характер статистического наблюдения предполагает, что оно охватывает большое число случаев проявления данного процесса, достаточное для того, чтобы получить правдивые статистическиеданные, характеризующие не только отдельные единицы, но и всю совокупность в целом.

    Наконец, систематичность статистического наблюдения определяется тем, что оно должно проводиться либо система­тически, либо непрерывно, либо регулярно. Изучение тенденций и закономерностей социально-экономических процессов, характеризующихся количественными и качественными изменениями, возможно лишь на этой основе. Из сказанного следует, что к статистическому наблюдению предъявляются следующие требования:

    • 1) полноты статистических данных (полноты охвата единиц изучаемой совокупности, сторон того или иного явления, а также полноты охвата во времени);
    • 2) достоверности и точности данных;
    • 3) их единообразия и сопоставимости.

    Программно-методологические и организационные вопросы статистического наблюдения

    Любое статистическое исследование необходимо начинать с точной формулировки его цели и конкретных задач, а тем самым и тех сведений, которые могут быть получены в процессе наблюдения. После этого определяются объект и единица наблюдения, разрабатывается программа, выбираются вид и способ наблюдения.

    2.1 Схема проведения статистического исследования

    Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

    Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

    На рисунке 2.1 представлена схема проведения статистического исследования.

    Рис.2.1 - Принципиальная схема статистического исследования

    Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

    Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

      определен объект исследования;

      перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

      описано то, как будут использоваться результаты исследования;

      сроки, в которые исследование должно быть проведено и бюджет исследования.

    На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

    Основной этап статистического исследования включает сбор необходимых данных и их анализ.

    Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

    На рис. 2.2 представлена схема статистического анализа данных.

    Рис.2.2 – Основные этапы статистического анализа

    2.2 Сбор статистической информации

    Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

    Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

    Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

    Вторичные данные делят на внутренние и внешние.

    Примеры источников внутренних вторичных данных:

      информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

      ранее проведенные исследования;

      письменные отчеты сотрудников.

    Примеры источников внешних вторичных данных:

      отчеты органов статистики и других государственных учреждений;

      отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

      электронные базы данных (адресные справочники, ГИС и т.п.);

      библиотеки;

      средства массовой информации.

    Основными выходными данными на этапе сбора данных являются:

      планируемый объем выборки;

      структура выборки (наличие и размер квот);

      вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

      информация о параметрах опроса (например, возможность факта фальсификации анкет);

      схема кодировки переменных в базе данных программы, выбранной для обработки;

      план-схема преобразования данных;

      план-схема используемых статистических процедур.

    Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

    Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

    2.3 Определение характеристик выборки

    Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

    Рис 2.3 Схема преобразования статистических данных

    Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

    Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

      определение реального количества респондентов,

      определение структуры выборки,

      распределение по месту опроса,

      установление доверительного уровня статистической надежности выборки,

      расчет статистической ошибки и определение репрезентативности выборки.

    Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

    Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

    Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

    или
    ,

    где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
    - дисперсия признака.

    В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

    Таблица 2.4

    2.5 Обработка данных на компьютере

    Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

    1. Определение структуры исходных данных.

    2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

    3. Задание метода обработки данных в соответствии с задачами исследования.

    4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

    5. Интерпретация результата обработки.

    Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

    2.6 Выбор стратегии анализа данных

    Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

    Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

    Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

    Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

    Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

    Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

    Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

    Классификация одномерных статистических методов представлена на рис.2.4.

    Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

    Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

    С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

    Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

    Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

    Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

    Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

    Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

    С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

    Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

    Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

    Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

    Рис.2.5 – Классификация многомерных статистических методов

    1. ЭТАПЫ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ

    Процесс изучения социально-экономических явлений посредством системы статистических методов и количественных характеристик – системы показателей, называется статистическим исследованием.

    Основными этапами проведения статистического исследования являются:

    1) статистическое наблюдение;

    2) сводка полученных данных;

    3) статистический анализ.

    В случае необходимости статистическое исследование может содержать дополнительный этап – статистический прогноз.

    Статистическое наблюдение – научно организованный сбор данных о явлениях и процессах общественной жизни посредством регистрации по заранее разработанной программе наблюдения их существенных признаков. Данные наблюдения представляют собой первичную статистическую информацию о наблюдаемых объектах, которая является основой для получения их обобщающих характеристик. Наблюдение выступает как один из главных методов статистики и как одна из важнейших стадий статистического исследования.

    Проведение статистического исследования невозможно без качественной информационной базы, получаемой в ходе статистического наблюдения. Поэтому, с момента изменения представлений о статистике как о науке описательной, разрабатываются особые правила проведения наблюдения и специальные требования к его результатам – статистическим данным. То есть, наблюдение является одним из основных методов статистики.

    Наблюдение является первым этапом статистического исследования, от качества которого зависит достижение конечных задач исследования.

    1.1. Наблюдение осуществляется по специально подготовленной программе.

    Программа включает в себя перечень характеристик объекта исследования, данные о которых необходимо получить в результате наблюдения.

    При подготовке наблюдения необходимо заранее определить:

    1. Программу наблюдения, в которой:

    а) определен объект наблюдения, т.е. то множество единиц явления, которое необходимо исследовать. Причем, необходимо отличать единицу наблюдения от отчетной единицы. Отчетная единица – единица предоставляющая статистические данные, может состоять из нескольких единиц совокупности, а может совпадать с единицей совокупности. Например, при обследовании населения единицей может быть член домохозяйства, а отчетной единицей – домохозяйство.

    б) определены границы объекта наблюдения.

    в) определены признаки объекта наблюдения, сведения о которых необходимо получить в результате наблюдения.

    2. Время наблюдения объекта – время по состоянию на которое или за которое регистрируются сведения об изучаемом объекте.

    3. Сроки проведения наблюдения. То есть, определяются период времени сбора данных и дата завершения наблюдения. Сроки наблюдения влияют на время окончания в целом статистического исследования и на своевременность его выводов.

    4. Средства и ресурсы, необходимые для проведения наблюдения: количество квалифицированных специалистов; материальные ресурсы; средства обработки результатов наблюдения.

    5. Требования к статистическим данным. Основными требованиями являются: а) достоверность, т.е. сведения об объекте исследования должны отражать реальное его состояние в момент наблюдения; б) сопоставимость данных, т.е. сведения, полученные в результате наблюдения, должны быть сравнимыми, что обеспечивается единой методикой сбора и анализа данных, по единицам измерения и т.д.

    1.2. Выделяют несколько видов статистического наблюдения.

    1. По охвату единиц совокупности:

    а) сплошное;

    б) несплошное (выборочное, монографическое, по методу основного массива)

    2. По времени регистрации фактов: а) текущее (непрерывное); б) прерывное (периодическое, единовременное)

    3. По способу сбора информации: а) непосредственное наблюдение; б) документальное наблюдение; в) опрос (анкетный, корреспондентский и др.)

    Сводка – процесс приведения в систему полученных данных, их обработка и подсчет промежуточных и общих итогов, расчет взаимосвязанных величин аналитического характера.

    Следующим этапом статистического исследования является подготовка полученных в ходе наблюдения сведений к анализу. Этот этап называется сводка.

    Сводка включает в себя:

    — систематизацию полученных в ходе наблюдений сведений;

    — их группировку;

    — разработку системы показателей, характеризующих образованные группы;

    — создание разработочных таблиц для сгруппированных данных;

    — расчет производных величин по разработочным таблицам.

    В литературе по теории статистики часто встречается рассмотрение сводки и группировки как самостоятельных этапов исследования. Однако, следует заметить, что понятие сводки включает в себя действия по группировке статистических данных, поэтому здесь в качестве названия этапа исследования принято понятие «сводка».

    Статистический анализ – исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

    Статистический прогноз – научное выявление состояния и вероятных путей развития явлений и процессов, основанное на системе установленных причинно-следственных связей и закономерностей.

    ЗАДАНИЕ 1

    В результате выборочного обследования заработной платы 60-ти работников предприятия промышленности были получены следующие данные (табл. 1).

    Постройте интервальный ряд распределения по результативному признаку, образовав пять групп с равными интервалами.

    Определите основные показатели вариации (дисперсию, среднее квадратическое отклонение, коэффициент вариации), среднюю степенную величину (среднее значение признака) и структурные средние. Изобразите графически в виде: а) гистограммы; б) кумуляты; в) огивы. Сделайте вывод.

    РЕШЕНИЕ

    1. Определим размах вариации по результативному признаку – по производственному стажу по формуле:

    R = Хmax – Хmin = 36 – 5 = 31

    где Хmax – максимальный размер активов

    Хmin – минимальный размер активов

    2. Определим величину интервала

    i = R/n = 31/5= 6,2

    с учетом полученной величины интервалов производим группировку банков и получаем

    3. Построим вспомогательную таблицу

    Группа призна-ка

    Значение значений в группе

    х i

    Количество частота признака (частота)

    f i

    в % к итогу

    ω

    Накопленная частота

    S i

    Середина интервала

    * f i

    ω

    I

    5 – 11,2

    6,8,7,5,8,6,10,9,9,7, 6,6,9,10,7,9,10,10, 11,8,9,8, 7, 6, 9, 10

    43,3

    43,3

    210,6

    350,73

    46,24

    1202,24

    II

    11,2 – 17,4

    16,15,13,12,14,14, 12,14,17,13,15,17, 14

    21,7

    14,3

    185,9

    310,31

    0,36

    4,68

    III

    17,4 – 23,6

    18,21,20,20,21,18, 19,22,21,21,21,18, 19

    21,7

    86,7

    20,5

    266,5

    444,85

    31,36

    407,68

    IV

    23,6 –29,8

    28,29,25,28, 24

    26,7

    133,5

    221,61

    11,8

    139,24

    696,2

    V

    29,8 – 36

    36,35,33,

    32,9

    98,7

    164,5

    ИТОГО

    895,2

    1492

    541,2

    3282,8

    4. Среднее значение признака в изучаемой совокупности определяется по формуле арифметической взвешенной:

    года

    5. Дисперсия и среднее квадратическое отклонение признака определяется по формуле



    Определение колеблемости


    Таким образом, V>33,3%, следовательно, совокупность неоднородна.

    6. Определение моды

    Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В исследуемом интервальном вариационном ряду мода рассчитывается по формуле:


    где

    x M0
    – нижняя граница модального интервала:

    i M0 – величина модального интервала;

    f M0-1 f M0 f M0+1 – частоты (частости) соответственно модального, домо-дального и послемодального интервалов.

    Модальный интервал – это интервал, имеющий наибольшую частоту (частость). В нашей задаче – это первый интервал.


    7. Рассчитаем медиану.

    Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина– больше, чем медиана.

    В интервальном ряду медиана определяется по формуле:


    где – начало медианного интервала;

    – величина медианного интервала

    – частота медианного интервала;

    – сумма накопленных частот в домедианном интервале.

    Медианный интервал – это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот до числа, превышающего половину совокупности.

    По данным гр. 5 вспомогательной таблицы находим интервал, сумму накопленных часто в котором превышает 50%. Это второй интервал – от 11,6 до 18,4, он и является медианным.

    Тогда


    Следовательно, половина работников имеющих стаж работы меньше 13,25 лет, а половина – больше этой величины.

    6. Изобразим ряд в виде полигона, гистограммы, кумулятивной прямой, огивы.

    Графическое представление играет важную роль в изучении вариационных рядов, так как позволяет в простой и наглядной форме проводить анализ статистических данных.

    Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята, огива), выбор которых зависит от цели исследования и от вида вариационного ряда.

    Полигон распределения в основном используется для изображения дискретного ряда, но можно построить полигон и для интервального ряда, если предварительно привести его к декретному. Полигон распределения представляет собой замкнутую ломаную линию в прямоугольной системе координат с координатами (x i , q i), где x i — значение i-го признака, q i — частота или частость i-ro признака.

    Гистограмма распределения применяется для изображения интервального ряда. Для построения гистограммы на горизонтальной оси откладывают последовательно отрезки, равные интервалам признака, и на этих отрезках, как на основаниях, строят прямоугольники, высоты которых равны частотам или частностям для ряда с равными интервалами, плотностям; для ряда с неравными интервалами.


    Кумулята есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной – значения признака. Кумулята служит для графического представления как дискретных, так и интервальных вариационных рядов.


    Вывод: Таким образом, были рассчитаны основные показатели вариации исследуемого ряда: среднее значение признака – производственного стажа составляет 14,9 лет, рассчитана дисперсия равная 54,713, в свою очередь среднее квадратическое отклонение признака – 7,397. Мода имеет значение 9,13, в модальным интервалом является первый интервал изучаемого ряда. Медиана ряда равная 13,108, делит ряд на две равные части говорит о том что в исследуемой организации половина работников имеет стаж работы меньше 13,108 лет, а половина – больше.

    ЗАДАНИЕ 2

    Имеются следующие исходные данные, характеризующие динамику за 1997 – 2001 г.г. (таблица 2).

    Таблица 2 Исходные данные

    Год

    1997

    1998

    1999

    2000

    2001

    Выпуск сахарного песка, тыс.т.

    1620

    1660

    1700

    1680

    1700

    Определите основные показатели ряда динамики. Расчет представьте в виде таблицы. Рассчитайте среднегодовые значения показателей. В виде графического изображения – полигона, обозначьте динамику анализируемого показателя. Сделайте вывод.

    РЕШЕНИЕ

    Дано

    Год

    Годы

    1997

    1998

    1999

    2000

    2001

    1620

    1660

    1700

    1680

    1700

    1) Средний уровень динамики рассчитывается по формуле


    2) Цепные и базисные темпы роста рассчитываем следующим образом:

    1. Абсолютный прирост определяется по формуле:

    Аiб = yi – y0

    Аiц = yi – yi-1

    2. Темп роста определяется по формуле: (%)

    Трб = (yi / y0) *100

    Трц = (yi / yi-1)*100

    3. Темп прироста определяется по формуле: (%)

    Тnрб = Трб –100%:

    Тnрц = Трц – 100%

    4. Средний абсолютный прирост:


    y n
    – конечный уровень динамического ряда;

    y 0
    – начальный уровень динамического ряда;

    n ц
    – число цепных абсолютных приростов.

    5. Среднегодовой темп роста:


    6. Среднегодовой темп прироста:


    3) Абсолютное содержание 1% прироста:

    А = Хi-1 / 100

    Все рассчитанные показатели сводим в таблицу.

    Показатели

    Годы

    1997

    1998

    1999

    2000

    2001

    Количество хирургических операций за период

    1620

    1660

    1700

    1680

    1700

    2. Абсолютный прирост

    Aiц

    3. Темп роста

    Трib

    102,5

    104,9

    103,7

    104,9

    Трiц

    102,5

    102,4

    98,8

    101,2

    4. Темп прироста

    Тпib

    Тпiц

    5. Значение 1% прироста

    16,2

    16,6

    17,0

    16,8

    5) Среднегодовое значение


    7. Изобразим графически в виде полигона.


    Таким образом, получено следующее. Наибольший абсолютный и относительный прирост хирургических операций за период было в 1999 году и составило 1700, абсолютный прирост по сравнению с базисным годом составил 80 операций, темп роста по отношению к базовому 1997 годом равен 104,9%, а базовый темп прирост был 4,9%. Наибольшие цепные абсолютные приросты были в 1998 и 1999 году – по 40 операций. Наибольший цепной темп роста наблюдался в 1998 году – 102,5%, а наименьший цепной темп прироста количества операций составляет в 2000 году – 98,8%.

    ЗАДАНИЕ 3

    Имеются данные о реализации товаров (см. таблицу 3)

    Таблица 3 Исходные данные о реализации товаров

    Товар

    Базовый год

    Отчетный год

    кол-во

    цена

    кол-во

    цена

    1100

    1000

    1350

    1300

    1650

    1700

    Определить: а) индивидуальные индексы (i p , i q ); б) общие индексы (I p , I q , I pq); в) абсолютное изменение товарооборота за счет: 1) количества товаров; 2) цены.

    На основании исчисленных показателей сделайте вывод.

    РЕШЕНИЕ

    Составим вспомогательную таблицу

    Вид

    Базисное

    Отчетное

    Произведение

    Индексы

    Кол-во, q 0

    Цена, p 0

    Кол-во, q 1

    Цена, p 1

    q 0 * p 0

    q 1 * p 1

    i q =q 1 /q 0

    i p =p 1 /p 0

    q 1 * p 0

    44000

    35000

    0,875

    0,909

    38500

    1100

    1000

    41800

    40000

    0,909

    1,053

    38000

    7500

    8400

    1,200

    0,933

    9000

    1350

    1300

    40500

    26000

    0,667

    0,963

    27000

    45000

    44000

    1,100

    0,889

    49500

    1650

    1700

    26400

    25500

    1,030

    0,938

    27200

    ИТОГО

    205200

    178900

    189200


    Вывод: Как видим общий прирост товарооборота за год составил (-26300) усл.ед., включая влияние изменения количества проданного товара на — 16000 и из-за изменения цены на товар – 10300 усл.ед. Общий прирост товарооборота составил 87,2%. Следует отметить, что согласно рассчитанным индексам количества товара по ассортименту наблюдается незначительный прирост товарооборота по товару «П» на 120% и товару «С» 110%, незначительный рост реализации товара «Т» – всего 103%. Довольно значительно снизилась реализации товара «Р» – всего 66,7% от реализации в базисном году, чуть выше реализация товара «Н» – 87,5% и товара «О» – 90,9% от соответствующего показателя базисного года. Индивидуальный индекс цены показывает, что цена выросла лишь на товар «О» – на 105,3%, в то же время по всем остальным наименованиям товара – «Н», «П», «Р», «С», «Т» индивидуальный индекс цен свидетельствует об отрицательной динамике (снижении) соответственно – 90,9%; 93,3%;, 96,3%, 88,9; 93,8.

    Общий индекс физического объема реализации свидетельствует о незначительном снижении общего объема реализации на 94,6%; общий индекс цены свидетельствует об общем снижении цены на реализуемые товары на 92,2%, а общий индекс товарооборота говорит об общем снижении товарооборота на 87,2%.

    ЗАДАНИЕ 4

    Из исходных данных таблицы № 1 (выбрать строки с 14 до 23) по двум признакам – производственному стажу и размеру заработной платы провести корреляционно-регрессионный анализ, определить параметры корреляции и детерминации. Построить график корреляционной зависимости между двумя признаками (результативным и факторным). Сделать вывод.

    РЕШЕНИЕ

    Исходные данные

    Производственный стаж

    Размер заработной платы

    1800

    2500

    1750

    1580

    1750

    1560

    1210

    1860

    1355

    1480

    Прямолинейная зависимость

    Параметры уравнения определяются по методу наименьших квадратов, по системе нормальных уравнения


    Для решения системы используем метод определителей.

    Параметры рассчитывает по формулам