Компьютерный журнал для новичков и профессионалов / Windows / Обработка статистических данных. Презентация на тему "элементы статистической обработки данных" Закрепление изученного материала

Обработка статистических данных. Презентация на тему "элементы статистической обработки данных" Закрепление изученного материала

11.04.2023

Лекция 12. Методы статистической обработки результатов.

Методами статистической обработки результатов называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в них закономерности. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами.

1. Методы первичной статистической обработки результатов эксперимента

Все методы математико-статистического анализа условно делятся на первичные и вторичные. Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Соответственно под первичными статистическими показателями имеются в виду те, которые применяются в самих психодиагностических методиках и являются итогом начальной статистической обработки результатов психодиагностики. Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности.

К первичным методам статистической обработки относят, например, определение выборочной средней величины, выборочной дисперсии, выборочной моды и выборочной медианы. В число вторичных методов обычно включают корреляционный анализ, регрессионный анализ, методы сравнения первичных статистик у двух или нескольких выборок.

Рассмотрим методы вычисления элементарных математических статистик.

Модой называют количественное значение исследуемого признака, наиболее часто встречающееся в выборке.

Медианой называется значение изучаемого признака, которое делит выборку, упорядоченную по величине данного признака, пополам.

Выборочное среднее (среднее арифметическое) значение как статистический показатель представляет собой среднюю оценку изучаемого в эксперименте психологического качества.

Разброс (иногда эту величину называют размахом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда.

Дисперсия - это среднее арифметическое квадратов отклонений значений переменной от её среднего значения.

2. Методы вторичной статистической обработки результатов эксперимента

С помощью вторичных методов статистической обработки экспериментальных данных непосредственно проверяются, доказываются или опровергаются гипотезы, связанные с экспериментом. Эти методы, как правило, сложнее, чем методы первичной статистической обработки, и требуют от исследователя хорошей подготовки в области элементарной математики и статистики.

Обсуждаемую группу методов можно разделить на несколько подгрупп:

1 Регрессионное исчисление

Регрессионное исчисление - это метод математической статистики, позволяющий свести частные, разрозненные данные к некоторому линейному графику, приблизительно отражающему их внутреннюю взаимосвязь, и получить возможность по значению одной из переменных приблизительно оценивать вероятное значение другой переменной.

2.Корреляция

Следующий метод вторичной статистической обработки, посредством которого выясняется связь или прямая зависимость между двумя рядами экспериментальных данных, носит название метод корреляций. Он показывает, каким образом одно явление влияет на другое или связано с ним в своей динамике. Подобного рода зависимости существуют, к примеру, между величинами, находящимися в причинно-следственных связях друг с другом. Если выясняется, что два явления статистически достоверно коррелируют друг с другом и если при этом есть уверенность в том, что одно из них может выступать в качестве причины другого явления, то отсюда определенно следует вывод о наличии между ними причинно-следственной зависимости.

3 Факторный анализ

Факторный анализ - статистический метод, который используется при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

Вопросы для повторения

1.Что такое методы статистической обработки?

2.На какие подгруппы делят вторичные методы статистической обработки?

3.Объясните сущность метода корреляции?

4.В каких случаях применяют методы статистической обработки?

5.Как Вы считаете, насколько эффективно применение методов статистической обработки в научном исследовании?

2.Рассмотреть особенности методов статистической обработки данных.

Литература

1.. Горбатов Д.С. Практикум по психологическому исследованию: Учеб. пособие. - Самара: "БАХРАХ - М", 2003. - 272 с.

2. Ермолаев А.Ю. Математическая статистика для психологов. - М.: Московский психолого-социальный институт: Флинта, 2003.336с.

3. Корнилова Т.В. Введение в психологический эксперимент. Учебник для ВУЗов. М.: Изд-во ЧеРо, 2001.

Цель урока:
- создание условий для усвоения темы на уровне осмысления и первичного запоминания;
- для формирования математической компетенции личности студента.

Задачи урока
Образовательные: сформировать представление о статистике как науке; ознакомить студентов с понятиями основных статистических характеристик; сформировать умения находить размах, моду ряда, анализировать данные, совершенствовать навыки устного счета.
Развивающие: способствовать владению понятиями и их толкованием; развитию надпредметных навыков анализа, сравнения, систематизации и обобщения; продолжить формирование предметного язык, способствовать формированию ключевых компетенций (познавательной, информационной, коммуникативной) на различных этапах урока, способствовать формированию у учащихся единой научной картины мира путем выявления межпредметных связей статистики и различных наук.
Воспитательные: воспитывать интерес к изучаемому предмету, информационную культуру; готовность к выполнению общепринятых норм и правил, высокой работоспособности и организованности.

Используемые технологии : Технология личностно-ориентированного обучения, информационно-коммуникационные технологии.
Необходимое оборудование , материалы : мультимедийный проектор, компьютер, интерактивная доска.

Ход урока

1.Организационный момент.

Проверка готовности студентов к занятию

Проверка посещаемости

2. Целеполагание.

Обоснование необходимости изучения данной темы

Вовлечение студентов в процесс постановки цели урока

А из каких источников мы получаем, собираем информацию? (Предполагаемые ответы: радио, телевидение, газеты, журналы, телефон, люди, интернет, письма).

А где люди хранят информацию? (Предполагаемые ответы: в памяти и на внешних носителях).
Учеба в техникуме - это получение информации? В школе вы изучали общеобразовательные предметы, а обучаясь в техникуме что вы еще получаете? (Предполагаемый ответ: знания по профессии). Чем больше учимся, тем больше информации содержит наша память.

Сегодня я вам предлагаю ещё порцию информации. Вы обучаетесь по профессии машинист горных работ., вы будете работать на экскаваторах ЭКГ - 8И. Какова производительность этого экскаватора. По моей просьбе с комбината мне предоставили следующую информацию. (Производительность экскаватора - таблица)



По пустой породе (тыс. т)

Ребята, много информации - это хорошо? Вся ли информация может быть полезной, качественной? Что мы должны уметь делать, чтобы не заплутать в лабиринте информации? (Предполагаемый ответ учащихся: «Должны уметь отделять полезную, качественную информацию от некачественной»). Т.е. уметь ее обрабатывать.

ВЫВОД: сегодня на уроке мы будем учиться обрабатывать информацию.

3. Организация деятельности по изучению нового материала. (студенты в процессе объяснения делают записи в тетрадях и выполняют задания)

1. Определение статистики

Что такое статистика? Говорят, что на этот вопрос английский премьер-министр Бенджамин Дизраэли (1804 - 1881) ответил так: «Есть три вида лжи: ложь, наглая ложь и статистика».

Статистика — это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы.

(Зачитывается отрывок из романа Ильфа и Петрова "Двенадцать стульев"

"Статистика знает всё" известно, сколько какой пищи съедает в год средний гражданин республики: известно, сколько в стране охотников, балерин: станков, велосипедов, памятников, маяков и швейных машинок: Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..".

Название ее происходит от латинского слова “status” - состояние, от этого корня возникли слова stato (итал.), statistik (немецк.), statе (англ.) - государство.

Статистика изучает :

Главные цели изучения элементов статистики:

численность отдельных групп населения страны и ее регионов,
производство и потребление разнообразных видов продукции,
перевозку грузов и пассажиров различными видами транспорта,
природные ресурсы и многое другое.

Вы знаете, в какой стране было положено начало статистической практике (в Китае) первые переписи населения страны датируются Vв. II тыс. до н.э.

В 19 веке появилась возможность обрабатывать данные с помощью формул, математических законов и специальных характеристик. Это?.... (мат. статистика ).

2. Математическая статистика

Математическая статистика - это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей.

Так почему Дизраэли сравнивал статистику с ложью? (Не было научной строгой обработки информации, толковали данные кто как хотел).

Математическая статистика обладает универсальными методами обработки информации
Именно это позволило героям фильма «Служебный роман» сказать следующие слова о статистике (фрагмент фильма «Служебный роман» ).
ВЫВОД: статистика приводит информацию в систему.

3. Графическое представление информации

Многоугольник распределения

Гистограмма распределения

Круговая диаграмма

4. Характеристики измерений
1. Ряд данных - это ряд результатов каких-либо измерений.

Например: 1) измерения роста человека

2) Измерения веса человека (животного)

3)Показания счетчика (электроэнергии, воды, тепла…)

4) Результаты в беге на стометровку

2. Объем ряда данных - объемом ряда данных называется количество всех данных.

Например: дан ряд чисел 1; 3; 6; -4; 0

объём его будет равен 5. Почему?

3. Размах ряда данных - эторазность между наибольшим и наименьшим числами из ряда данных.

Например: если дан ряд чисел 1; 3; 6; -4; 0; 2, то размах этого ряда данных будет равен 6 (т.к. 6 - 0 = 6)

4. Мода ряда данных - модой ряда данных называетсячисло ряда, которое встречается в этом ряду наиболее часто.

Например: р яд данных может иметь или не иметь моду.

Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52.

5. Медиана ряда

Медиана с нечётным числом членов - это число, записанное посередине.

Медиана с чётным числом членов - это среднее арифметическое двух чисел, записанных посередине.

Например : определить медиану ряда чисел

1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Ответ: -3

2) -1; 0; 2; 1; -1; 0;2; -1. Ответ: 0

6. Среднее арифметическое - эточастное от деления суммы чисел ряда на их количество.

Например : дан ряд чисел -1; 0; 2; 1; -1; 0; 2; -1. Тогда среднее арифметическоебудет равно: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25

4. Закрепление изученного материала.

Практическая работа

Задание: охарактеризовать успеваемость ученика Иванова Петра по математике за четвертую четверть.

Выполнение работы:

1. Сбор информации:

Выписаны оценки из журнала: 5,4,5,3,3,5,4,4,4.

2. Обработка полученных данных:

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Обработка статистических данных

Введение

статистический дисперсия выборка корреляция

Методами статистической обработки результатов эксперимента называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в них закономерности. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами.

Некоторые из методов математико-статистического анализа позволяют вычислять так называемые элементарные математические статистики, характеризующие выборочное распределение данных, например выборочное среднее, выборочная дисперсия, мода, медиана и ряд других. Иные методы математической статистики, например дисперсионный анализ, регрессионный анализ, позволяют судить о динамике изменения отдельных статистик выборки. С помощью третьей группы методов, скажем, корреляционного анализа, факторного анализа, методов сравнения выборочных данных, можно достоверно судить о статистических связях, существующих между переменными величинами, которые исследуют в данном эксперименте.

1. Методы первичной статистической обработки результатов эксперимента

Рассмотрим методы вычисления элементарных математических статистик.

1.1 Мода

Числовой характеристикой выборки, как правило, не требующей вычислений, является так называемая мода. Модой называют количественное значение исследуемого признака, наиболее часто встречающееся в выборке. Для симметричных распределений признаков, в том числе для нормального распределения, значение моды совпадает со значениями среднего и медианы. Для других типов распределении, несимметричных, это не характерно. К примеру, в последовательности значений признаков 1, 2, 5, 2, 4, 2, 6, 7, 2 модой является значение 2, так как оно встречается чаще других значений - четыре раза.

Моду находят согласно следующим правилам:

1) В том случае, когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды. Например: 5, 5, 6, 6, 7, 7 - в этой выборке моды нет.

2) Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значений. Например, в выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. Эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Следовательно, модой этого ряда будет величина =3,5

3) Если два несмежных (не соседних) значения в выборке имеют равные частоты, которые больше частот любого другого значения, то выделяют две моды. Например, в ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются значения 11 и 14. В таком случае говорят, что выборка является бимодальной.

Могут существовать и так называемые мультимодальные распределения, имеющие более двух вершин (мод).

4) Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной группой.

1.2 Медиана

Медианой называется значение изучаемого признака, которое делит выборку, упорядоченную по величине данного признака, пополам. Справа и слева от медианы в упорядоченном ряду остается по одинаковому количеству признаков. Например, для выборки 2, 3, 4, 4, 5, 6, 8, 7, 9 медианой будет значение 5, так как слева и справа от него остается по четыре показателя. Если ряд включает в себя четное число признаков, то медианой будет среднее, взятое как полусумма величин двух центральных значений ряда. Для следующего ряда 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 медиана будет равна 3,5.

Знание медианы полезно для того, чтобы установить, является ли распределение частных значений изученного признака симметричным и приближающимся к так называемому нормальному распределению. Средняя и медиана для нормального распределения обычно совпадают или очень мало отличаются друг от друга. Если выборочное распределение признаков нормально, то к нему можно применять методы вторичных статистических расчетов, основанные на нормальном распределении данных. В противном случае этого делать нельзя, так как в расчеты могут вкрасться серьезные ошибки.

1.3 Выборочное среднее

Выборочное среднее (среднее арифметическое) значение как статистический показатель представляет собой среднюю оценку изучаемого в эксперименте психологического качества. Эта оценка характеризует степень его развития в целом у той группы испытуемых, которая была подвергнута психодиагностическому обследованию. Сравнивая непосредственно средние значения двух или нескольких выборок, мы можем судить об относительной степени развития у людей, составляющих эти выборки, оцениваемого качества.

1.4 Разброс выборки

Разброс (иногда эту величину называют размахом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

R= хmax - хmin

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот. Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

Х = 10 15 20 25 30 35 40 45 50X = 30 R = 40

Y = 10 28 28 30 30 30 32 32 50 Y=30 R = 40

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

1.5 Дисперсия

Дисперсия - это среднее арифметическое квадратов отклонений значений переменной от её среднего значения.

Дисперсия как статистическая величина характеризует, насколько частные значения отклоняются от средней величины в данной выборке. Чем больше дисперсия, тем больше отклонения или разброс данных.

Из суммы квадратов, делённых на число членв ряда извлекаеся квадратный корень.

Иногда исходных частных первичных данных, которые подлежат статистической обработке, бывает довольно много, и они требуют проведения огромного количества элементарных арифметических операций. Для того чтобы сократить их число и вместе с тем сохранить нужную точность расчетов, иногда прибегают к замене исходной выборки частных эмпирических данных на интервалы. Интервалом называется группа упорядоченных по величине значений признака, заменяемая в процессе расчетов средним значением.

2. Методы вторичной статистической обработки результатов эксперимента

Обсуждаемую группу методов можно разделить на несколько подгрупп:

1. Регрессионное исчисление.

2. Методы сравнения между собой двух или нескольких элементарных статистик (средних, дисперсий и т.п.), относящихся к разным выборкам.

3. Методы установления статистических взаимосвязей между переменными, например их корреляции друг с другом.

4. Методы выявления внутренней статистической структуры эмпирических данных (например, факторный анализ). Рассмотрим каждую из выделенных подгрупп методов вторичной статистической обработки на примерах.

2.1 Регрессионное исчисление

Графическое выражение регрессионного уравнения называют линией регрессии. Линия регрессии выражает наилучшие предсказания зависимой переменой (Y) по независимым переменным (X).

Регрессию выражают с помощью двух уравнений регрессии, которые в самом прямом случае выглядят, как уравнения прямой.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

В уравнении (1) Y - зависимая переменная, X - независимая переменная, a 0 - свободный член, a 1 - коэффициент регрессии, или угловой коэффициент, определяющий наклон линии регрессии по отношению к осям координат.

В уравнении (2) X - зависимая переменная, Y - независимая переменная, b 0 - свободный член, b 1 - коэффициент регрессии, или угловой коэффициент, определяющий наклон линии регрессии по отношению к осям координат.

Количественное представление связи (зависимости) между Х и Y (между Y и X) называется регрессионным анализом. Главная задача регрессионного анализа заключается в нахождении коэффициентов a 0, b 0, a1и b 1 и определении уровня значимости полученных аналитических выражений, связывающих между собой переменные Х и У.

Для применения метода линейного регрессионного анализа необходимо соблюдать следующие условия:

1. Сравниваемые переменные Х и Y должны быть измерены в шкале интервалов или отношений.

2. Предполагается, что переменные Х и Y имеют нормальный закон распределения.

3. Число варьирующих признаков в сравниваемых переменных должно быть одинаковым. (5).

2.2 Корреляция

Когда повышение уровня одной переменной сопровождается повышением уровня другой, то речь идёт о положительной корреляции. Если же рост одной переменной происходит при снижении уровня другой, то говорят об отрицательной корреляции. При отсутствии связи переменных мы имеем дело с нулевой корреляцией. (1)

Имеется несколько разновидностей данного метода: линейный, ранговый, парный и множественный. Линейный корреляционный анализ позволяет устанавливать прямые связи между переменными величинами по их абсолютным значениям. Эти связи графически выражаются прямой линией, отсюда название «линейный». Ранговая корреляция определяет зависимость не между абсолютными значениями переменных, а между порядковыми местами, или рангами, занимаемыми ими в упорядоченном по величине ряду. Парный корреляционный анализ включает изучение корреляционных зависимостей только между парами переменных, а множественный, или многомерный, - между многими переменными одновременно. Распространенной в прикладной статистике формой многомерного корреляционного анализа является факторный анализ. (5)

К коэффициенту ранговой корреляции в психолого-педагогических исследованиях обращаются в том случае, когда признаки, между которыми устанавливается зависимость, являются качественно различными и не могут быть достаточно точно оценены при помощи так называемой интервальной измерительной шкалы. Интервальной называют такую шкалу, которая позволяет оценивать расстояния между ее значениями и судить о том, какое из них больше и насколько больше другого. Например, линейка, с помощью которой оцениваются и сравниваются длины объектов, является интервальной шкалой, так как, пользуясь ею, мы можем утверждать, что расстояние между двумя и шестью сантиметрами в два раза больше, чем расстояние между шестью и восемью сантиметрами. Если же, пользуясь некоторым измерительным инструментом, мы можем только утверждать, что одни показатели больше других, но не в состоянии сказать на сколько, то такой измерительный инструмент называется не интервальным, а порядковым.

Большинство показателей, которые получают в психолого-педагогических исследованиях, относятся к порядковым, а не к интервальным шкалам (например, оценки типа «да», «нет», «скорее нет, чем да» и другие, которые можно переводить в баллы), поэтому коэффициент линейной корреляции к ним неприменим.

Метод множественных корреляций в отличие от метода парных корреляций позволяет выявить общую структуру корреляционных зависимостей, существующих внутри многомерного экспериментального материала, включающего более двух переменных, и представить эти корреляционные зависимости в виде некоторой системы.

Для применения частного коэффициента корреляции необходимо соблюдать следующие условия:

1. Сравниваемые переменные должны быть измерены в шкале интервалов или отношений.

2. Предполагается, что все переменные имеют нормальный закон распределения.

3. Число варьирующих признаков в сравниваемых переменных должно быть одинаковым.

4. Для оценки уровня достоверности корреляционного отношения Пирсона следует пользоваться формулой (11.9) и таблицей критических значений для t-критерия Стьюдента при k = n - 2. (5)

2.3 Факторный анализ

Важное отличие факторного анализа от всех описанных выше методов заключается в том, что его нельзя применять для обработки первичных, или, как говорят, «сырых», экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее - коэффициенты корреляции Пирсона, которые вычисляются между переменными (т.е. психологическими признаками), включенными в обследование. Иными словами, факторному анализу подвергают корреляционные матрицы, или, как их иначе называют, матрицы интеркорреляций. Наименования столбцов и строк в этих матрицах одинаковы, так как они представляют собой перечень переменных, включенных в анализ. По этой причине матрицы интеркорреляций всегда квадратные, т.е. число строк в них равно числу столбцов, и симметричные, т.е. на симметричных местах относительно главной диагонали стоят одни и те же коэффициенты корреляции.

Главное понятие факторного анализа - фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению. (5)

С помощью выявленных факторов объясняют взаимозависимость психологических явлений. (7)

Чаще всего в итоге факторного анализа определяется не один, а несколько факторов, по-разному объясняющих матрицу интеркорреляций переменных. В таком случае факторы делят на генеральные, общие и единичные. Генеральными называются факторы, все факторные нагрузки которых значительно отличаются от нуля (нуль нагрузки свидетельствует о том, что данная переменная никак не связана с остальными и не оказывает на них никакого влияния в жизни). Общие - это факторы, у которых часть факторных нагрузок отлична от нуля. Единичные - это факторы, в которых существенно отличается от нуля только одна из нагрузок. (7)

Факторный анализ может быть уместен, если выполняются следующие критерии.

1. Нельзя факторизовать качественные данные, полученные по шкале наименований, например, такие, как цвет волос (черный / каштановый / рыжий) и т.п.

2. Все переменные должны быть независимыми, а их распределение должно приближаться к нормальному.

3. Связи между переменными должны быть приблизительно линейны или, по крайней мере, не иметь явно криволинейного характера.

4. В исходной корреляционной матрице должно быть несколько корреляций по модулю выше 0,3. В противном случае достаточно трудно извлечь из матрицы какие-либо факторы.

5. Выборка испытуемых должна быть достаточно большой. Рекомендации экспертов варьируют. Наиболее жесткая точка зрения рекомендует не применять факторный анализ, если число испытуемых меньше 100, поскольку стандартные ошибки корреляции в этом случае окажутся слишком велики.

Однако если факторы хорошо определены (например, с нагрузками 0,7, а не 0,3), экспериментатору нужна меньшая выборка, чтобы выделить их. Кроме того, если известно, что полученные данные отличаются высокой надежностью (например, используются валидные тесты), то можно анализировать данные и по меньшему числу испытуемых. (5).

2.4 И спользование факторного анализа

Факторный анализ широко используется в психологии в разных направлениях, связанных с решением как теоретических, так и практических проблем.

В теоретическом плане использование факторного анализа связано с разработкой так называемого факторно-аналитического подхода к изучению структуры личности, темперамента и способностей. Использование факторного анализа в этих сферах основано на широко принятом допущении, согласно которому наблюдаемые и доступные для прямого измерения показатели являются лишь косвенными и / или частными внешними проявлениями более общих характеристик. Эти характеристики, в отличие от первых, являются скрытыми, так называемыми латентными переменными, поскольку они представляют собой понятия или конструкты, которые не доступны для прямого измерения. Однако они могут быть установлены путем факторизации корреляционных связей между наблюдаемыми чертами и выделением факторов, которые (при условии хорошей структуры) можно интерпретировать как статистическое выражение искомой латентной переменной.

Хотя факторы имеют чисто математический характер, предполагается, что они репрезентируют скрытые переменные (теоретически постулируемые конструкты или понятия), поэтому названия факторов нередко отражают сущность изучаемого гипотетического конструкта.

В настоящее время факторный анализ широко используется в дифференциальной психологии и психодиагностике. С его помощью можно разрабатывать тесты, устанавливать структуру связей между отдельными психологическими характеристиками, измеряемыми набором тестов или заданиями теста.

Факторный анализ используется также для стандартизации тестовых методик, которая проводится на репрезентативной выборке испытуемых.

Заключение

Если данные, полученные в эксперименте, качественного характера, то правильность делаемых на основе их выводов полностью зависит от интуиции, эрудиции и профессионализма исследователя, а также от логики его рассуждений. Если же эти данные количественного типа, то сначала проводят их первичную, а затем вторичную статистическую обработку. Первичная статистическая обработка заключается в определении необходимого числа элементарных математических статистик. Такая обработка почти всегда предполагает как минимум определение выборочного среднего значения. В тех случаях, когда информативным показателем для экспериментальной проверки предложенных гипотез является разброс данных относительного среднего, вычисляется дисперсия или квадратическое отклонение. Значение медианы рекомендуется вычислять тогда, когда предполагается использовать методы вторичной статистической обработки, рассчитанные на нормальное распределение, Для такого рода распределения выборочных данных медиана, а также мода совпадают или достаточно близки к средней величине. Этим критерием можно воспользоваться для того, чтобы приблизительно судить о характере полученного распределения первичных данных.

Вторичная статистическая обработка (сравнение средних, дисперсий, распределений данных, регрессионный анализ, корреляционный анализ, факторный анализ и др.) проводится в том случае, если для решения задач или доказательства предложенных гипотез необходимо определить статистические закономерности, скрытые в первичных экспериментальных данных. Приступая к вторичной статистической обработке, исследователь прежде всего должен решить, какие из различных вторичных статистик ему следует применить для обработки первичных экспериментальных данных. Решение принимается на основе учета характера проверяемой гипотезы и природы первичного материала, полученного в результате проведения эксперимента. Приведем несколько рекомендаций на этот счет.

Рекомендация 1. Если экспериментальная гипотеза содержит предположение о том, что в результате проводимого психолого-педагогического исследования возрастут (или уменьшатся) показатели какого-либо качества, то для сравнения до - и постэкспериментальных данных рекомендуется использовать критерий Стъюдента или ч2-критерий. К последнему обращаются в том случае, если первичные экспериментальные данные относительны и выражены, например, в процентах.

Рекомендация 2. Если экспериментально проверяемая гипотеза включает в себя утверждение о причинно-следственной зависимости между некоторыми переменными, то её целесообразно проверять, обращаясь к коэффициентам линейной или ранговой корреляции. Линейная корреляция используется в том случае, когда измерения независимой и зависимой переменных производятся при помощи интервальной шкалы, а изменения этих переменных до и после эксперимента небольшие. К ранговой корреляции обращаются тогда, когда достаточно оценить изменения, касающиеся порядка следования друг за другом по величине независимых и зависимых переменных, или когда их изменения достаточно велики, или когда измерительный инструмент был порядковым, а не интервальным.

Рекомендация 3. Иногда гипотеза включает предположение о том, что в результате эксперимента возрастут или уменьшатся индивидуальные различия между испытуемыми. Такое предположение хорошо проверяется с помощью критерия Фишера, позволяющего сравнить дисперсии до и после эксперимента. Заметим, что, пользуясь критерием Фишера, можно работать только с абсолютными значениями показателей, но не с их рангами.

Размещено на Allbest.ru

...

Подобные документы

Основные приемы и методы обработки и анализа статистических данных. Исчисление арифметической, гармонической и геометрической средних величин. Ряды распределения, их основные характеристики. Методы выравнивания рядом динамики. Система национальных счетов.

курсовая работа , добавлен 24.10.2014

Понятие экономического анализа как науки, его сущность, предмет, общая характеристика методов и социально-экономическая эффективность. Основные группы эконометрических методов анализа и обработки данных. Факторный анализ экономических данных предприятия.

реферат , добавлен 04.03.2010

Среднее арифметическое выборки, дисперсия, среднеквадратическое отклонение. Отбраковка по критерию Шовене. Правило "трех сигм". Оценка значимости различия средних значений двух выборок. Парный, множественные регрессионные анализы. Полный факторный анализ.

курсовая работа , добавлен 05.12.2012

Применение различных способов представления и обработки статистических данных. Пространственные статистические выборки. Парная регрессия и корреляция. Временные ряды. Построение тренда. Практические примеры и методика их решения, формулы и их значение.

курс лекций , добавлен 26.02.2009

Статистическая обработка результатов измерений; среднее арифметическое, квадратичное, дисперсия. Определение параметров выборки: закон трех сигм, гистограмма, контрольные карты, диаграмма Исикавы. Применение инструментов качества при изготовлении диванов.

курсовая работа , добавлен 17.10.2014

Средняя величина в статистике, ее сущность и условия применения. Виды и формы средних: по наличию признака-веса, по форме расчета, по охвату совокупности. Мода, медиана. Статистическое изучение динамики прибыли и рентабельности на примере ОАО "Башмебель".

контрольная работа , добавлен 14.06.2008

Принципы статистической обработки данных, используемые в данном процессе методы и приемы. Методика и основные этапы построения контрольных карт, их классификация и типы, функциональные особенности, определение преимуществ и недостатков применения.

курсовая работа , добавлен 23.08.2014

Расчет числовых характеристик и обработка результатов выборочных наблюдений. Исчисление и анализ статистических показателей в экономике. Национальное богатство: элементы, оценка; баланс активов и пассивов; основные фонды, показатели оборотных средств.

курсовая работа , добавлен 25.12.2012

Дескриптивная статистика и статистический вывод. Способы отбора, обеспечивающие репрезентативность выборки. Влияние вида выборки на величину ошибки. Задачи при применении выборочного метода. Распространение данных наблюдения на генеральную совокупность.

контрольная работа , добавлен 27.02.2011

Раскрытие понятия: интервальной шкалы, среднего арифметического, уровня статистической значимости. Как интерпретировать моду, медиану и среднее. Решение задач с использованием критерия Фридмана, Розенбаума. Расчет коэффициента корреляции Спримена.

Cлайд 1

Cлайд 2

Статистика - это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы Математическая статистика – это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей.

Cлайд 3

Статистика изучает: численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и многое другое. Результаты статистических исследований широко используются для практических и научных выводов. В настоящее время статистика начинает изучаться уже в средней школе, в ВУЗах это обязательный предмет, потому что связан со многими науками и отраслями. Чтобы увеличить количество продаж в магазине, чтобы улучшить качество знаний в школе, чтобы двигать страну по экономическому росту, надо проводить статистические исследования и делать соответствующие выводы. И это должен уметь каждый.

Cлайд 4

Главные цели изучения элементов статистики Формирование умений первичной обработки статистических данных; изображение и анализ количественной информации, представленной в разных формах (в виде таблиц, диаграмм, графиков реальной зависимостей); формирование представлений о важных статистических идеях, а именно: идее оценивания и идее проверки статистических гипотез; формирование умений сравнивать вероятности наступления случайных событий с результатами конкретных экспериментов.

Cлайд 5

Содержание Ряд данных Объем ряда данных Размах ряда данных Мода ряда данных Медиана ряда Среднее арифметическое Упорядоченные ряды данных Таблица распределения данных Подведём итоги Номинативный ряд данных Частота результата Процентная частота Группировка данных Способы обработки данных Подведём итоги

Cлайд 6

Определение Ряд данных – это ряд результатов каких-либо измерений. Например:1) измерения роста человека 2) Измерения веса человека (животного) 3)Показания счетчика (электроэнергии, воды, тепла…) 4) Результаты в беге на стометровку И т.д.

Cлайд 7

Определение Объемом ряда данных называется количество всех данных. Например: дан ряд чисел 1; 3; 6; -4; 0 объём его будет равен 5. Почему?

Cлайд 8

Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите объём данного ряда. Ответ: 10

Cлайд 9

Определение Размах – это разность между наибольшим и наименьшим числами из ряда данных. Например: если дан ряд чисел 1; 3; 6; -4; 0; 2, то размах этого ряда данных будет равен 6 (т.к. 6 – 0 = 6)

Cлайд 10

Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите размах данного ряда. Ответ: 3

Cлайд 11

Определение Модой ряда данных называется число ряда, которое встречается в этом ряду наиболее часто. Ряд данных может иметь или не иметь моду. Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52.

Cлайд 12

Выполни задание: Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52. В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите моду данного ряда. Ответ: 4

Cлайд 13

Определение Медиана с нечётным числом членов – это число, записанное посередине. Медиана с чётным числом членов - это среднее арифметическое двух чисел, записанных посередине. Например: определить медиану ряда чисел 1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Ответ: -3 2) -1; 0; 2; 1; -1; 0;2; -1. Ответ: 0

Cлайд 14

Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите медиану данного ряда. Ответ: 4

Cлайд 15

Определение Среднее арифметическое - ЭТО частное от деления суммы чисел ряда на их количество. Например: дан ряд чисел -1; 0; 2; 1; -1; 0; 2; -1. Тогда среднее арифметическое будет равно: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25

Cлайд 16

Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите среднее арифметическое данного ряда. Ответ: 3,9

Cлайд 17

ПРАКТИЧЕСКАЯ РАБОТА Задание: охарактеризовать успеваемость ученика Иванова по математике за четвертую четверть. ВЫПОЛНЕНИЕ РАБОТЫ: 1.Сбор информации: Выписаны оценки из журнала: 5,4,5,3,3,5,4,4,4. 2.Обработка полученных данных: объём = 9 размах = 5 - 3 = 2 мода = 4 медиана = 3 среднее арифметическое =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4 Характеристика успеваемости: ученик не всегда готов к уроку. В основном учится на «4». За четверть выходит «4».

Cлайд 18

Самостоятельно: Надо найти объём ряда, размах ряда, моду, медиану и среднее арифметическое: Карточка 1. 22,5; 23; 21,5; 22; 23. Карточка 2. 6; -4; 5; -2; -3; 3; 3; -2; 3. Карточка 3. 12,5; 12; 12; 12,5; 13; 12,5; 13. Карточка 4. -1; 0; 2; 1; -1; 0; 2; -1. Карточка 5. 125; 130; 124; 131. Карточка 6. 120; 100; 110.

Cлайд 19

Проверим Карточка 1. объём ряда = 5 размах ряда = 10 мода = 23 медиана = 21,5 среднее арифметическое = 13,3 Карточка 3. объём ряда = 7 размах ряда = 1 мода = 12,5 медиана = 12,5 среднее арифметическое = 12,5 Карточка 2. объём ряда = 9 размах ряда = 10 мода = 3 медиана = -3 среднее арифметическое = 1 Карточка 4. объём ряда = 8 размах ряда = 3 мода = -1 медиана = 0 среднее арифметическое = 0,25

Cлайд 20

Проверим Карточка 5. объём ряда = 4 размах ряда = 7 мода = нет медиана = 127 среднее арифметическое =127,5 Карточка 6. объём ряда = 3 размах ряда = 20 мода = нет медиана = 100 среднее арифметическое = 110

Cлайд 21

Определение Упорядоченными рядами данных называются ряды, в которых данные расположены по какому то правилу Как упорядочить ряд чисел? (Записать числа так, чтобы каждое последующее число было не меньше (не больше) предыдущего); или записать некоторые названия «по алфавиту»…

Cлайд 22

Выполни задание: Дан ряд чисел: -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1 Упорядочить его по возрастанию чисел. Решение: -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3 Получился упорядоченный ряд. Сами данные в нем не изменились, изменился только порядок их следования.

Cлайд 23

Определение Таблица распределения данных – это таблица упорядоченного ряда, в котором вместо повторений одного и того же числа записывается количество повторений. И наоборот, если известна таблица распределения, то можно составить упорядоченный ряд данных. Например: Из нее получается такой упорядоченный ряд: -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8

Cлайд 24

Выполни задание: В женском обувном магазине провели статистические исследования и составили соответствующую таблицу по цене обуви и количества продаж: Цена (руб.): 500 1200 1500 1800 2000 2500 Количество: 8 9 14 15 3 1 Для данных показателей надо найти статистические характеристики: составить упорядоченный ряд данных объем ряда данных размах ряда моду ряда медиану ряда среднее арифметическое ряда данных

Cлайд 25

И ответить на следующие вопросы: Из данных ценовых категорий, обувь за какую цену не следует продавать магазину? Обувь, по какой цене следует распространять? К какой цене лучше стремиться?

Cлайд 26

Подведём итоги: Мы познакомились с начальными понятиями того, как происходит статистическая обработка данных: данные всегда являются результатом какого-либо измерения у ряда некоторых данных можно найти: объём, размах, моду, медиану и среднее арифметическое 3) любой ряд данных можно упорядочить и составить таблицу распределения данных

Cлайд 27

Определение Номинативный ряд данных – это НЕ ЧИСЛОВЫЕ ДАННЫЕ, а например, имена; названия; номинации… Например: список финалистов чемпионатов мира по футболу с 1930 года: Аргентина, Чехословакия, Венгрия, Бразилия, Венгрия, Швеция, Чехословакия, ФРГ, Италия, Нидерланды, Нидерланды, ФРГ, ФРГ, Аргентина, Италия, Бразилия, Германия, Франция

Cлайд 28

Выполни задание: Найти из предыдущего примера: объём ряда 2) моду ряда 3) составьте таблицу распределения Решение: объём =18; мода – немецкая команда.

Cлайд 29

Материалы по теме:

Карта сайта