profil

Miary tendencji centralnej- statystyka

poleca 85% 209 głosów

Treść
Grafika
Filmy
Komentarze

Miary tendencji centralnej i ich podział
Tendencja centralna w zbiorowości, to wskazanie wartości badanej cechy w zbiorowości statystycznej, wokół której skupione są wartości cech wszystkich jednostek wchodzących w skład tej zbiorowości.
Tendencję centralną można określić wykorzystując miary tendencji centralnej (inaczej miary przeciętne lub średnie). Miary te są powszechnie stosowane, ponieważ są bardzo proste do obliczenia. Obliczanie tych miar pozwala na ścisłe scharakteryzowanie poziomu jakiegoś zjawiska występującego w zbiorowości statystycznej, używając tylko jednej lub kilku liczb. Miary tendencji centralnej mają jednak syntetyczny charakter, co wpływa na to, że wyłączenie różnic pomiędzy wartościami cechy poszczególnych jednostek wchodzących w skład zbiorowości statystycznej.
Miary te dzielimy na:
 Miary (średnie) klasyczne – obliczane są na podstawie cechy wszystkich jednostek badanej zbiorowości średnia arytmetyczna, średnimi klasycznymi są średnia:
- arytmetyczna,
- geometryczna,
- potęgowa.
 Miary (średnie) pozycyjne – wartości cechy statystycznej, występujące u konkretnej jednostki statystycznej, jednostka ta wyróżnia się miejscem (pozycja) w uporządkowanym szeregu statystycznym, średnimi pozycyjnymi są:
- wartości skrajne,
- dominanta,
- mediana,
- kwantyle.
Średnie pozycyjne
 Dominanta zwana jest również modą, wartością typową, wartością modalną lub wartością najczęstszą. Jest ona wartością cechy, która najczęściej występuje w zbiorowości badanej. Dominantę wykorzystuje się w przypadku cech niemierzalnych, jest ona jedyną miarą, która do tego służy. Miarę tą ustala się poprzez różne techniki:
 wskazywanie,
 obliczanie
Jest to uzależnione od formy w jakiej przedstawione są informacje o wartości cechy jednostek statystycznych.

1) Indywidualny szereg wartości cechy – w tym przypadku wartość dominanty wskazuje się, czyli tę wartość, która najczęściej występuje w danej zbiorowości statystycznej.
Przykład
Liczba uczniów w
klasach pierwszych liceum ogólnokształcącego

Klasy Liczba klas
I
II
III

RAZEM 3
2
1

6
Źródło: dane umowne

Liczba uczniów wchodząca w skład klasy. Dominanta przedstawiona w tablicy równa się trzem (D = 3). Najczęściej występującą w badanej zbiorowości są klasy pierwsze.

2) Szereg statystyczny z cechą mierzalną ze zmiennością skokową – dominanta jest wskazywana, jest to wartość cechy, dla której liczebność cząstkowa jest największa.

Przykład
Oceny końcowe z języka polskiego
klasy VI b szkoły podstawowej w Nowej Soli
Skala ocen Liczba uczniów
1
2
3
4
5
6

Razem
4
2
4
12
6
6

32
Źródło: dane umowne
Cechą występującą w tej zbiorowości jest 4 w szeregu rozdzielczym, a liczebność cząstkowa wynosi 12, D = 4. Najczęściej występującą oceną jest ocena dobra.

3) Szereg statystyczny rozdzielczy z cechą mierzalną ze zmiennością ciągłą – w tym przypadku obliczamy, tylko przybliżoną wartość dominanty za pomocą wzoru:

D ≈ xo + hd . {(no – n -1): [(no- n -1) +(no – n 1)]}

D – dominanta;
xo – wartość najmniejsza przedziału dominanty;
hd – rozpiętość przedziału liczbowego dominanty;
no – liczebność przedziału dominanty;
n –1 – liczebność przedziału poprzedzającego przedział dominanty;
n1 – liczebność przedziału następującego po przedziale dominanty.
Nie stosuje się tego wzoru, gdy różne są rozpiętości przedziału poprzedzającego i przedziału następującego.

Przykład
Zarobki kobiet w „Europak” Sp. z o.o.
na miesiąc listopad 2003 r.
Wynagrodzenie (zł) Liczba kobiet
800 – 850
850 – 900
900 – 950
950 – 1000
RAZEM 5
8
12
4
29
Źródło: dane umowne
Dominanta zawarta jest w przedziale (900 – 950>
xo – dolna granica przedziału, w którym występuje dominanta wynosi 900
hd – rozpiętość przedziału liczbowego dominanty wynosi 50
no – liczebność podziału dominanty wynosi 12
n –1 – liczebność przedziału poprzedzającego przedział dominanty wynosi 8
n1 – liczebność przedziału następującego po przedziale dominanty 4
Podstawiamy do wzoru i wyznaczamy dominantę.
Metoda graficzna wyznaczania dominanty
1) na wykresie przedstawiamy trzy prostokąty: przedział dominanty D i przedziały sąsiednie A i B
2) następnie w przedziale dominanty wyznaczamy dwa odcinki, których początkiem są wierzchołki przedziałów sąsiednich
3) w miejscu przecięcia dwóch odcinków wyznaczamy prostą, która pozwoli na odczytanie dominanty.



 Mediana nazywana jest również wartością środkową lub też środkiem obszaru zmienności rozpatrywanej zmiennej. Jest to wartość zmiennej, która rozdziela całą populację na takie dwie równe części. W pierwszej częścią są jednostki o wartościach niższych od mediany, a w drugiej są jednostki o wartościach wyższych. Medianę obliczamy w zależności od tego, z jakiego rodzaju szeregiem statystycznym przedstawiającym informacje o wartości cechy statystycznej, mamy do czynienia oraz czy liczba jednostek statystycznych (liczebność zbiorowości) jest parzysta, czy nieparzysta.

1) Szereg indywidualny wartości cechy o nieparzystej liczbie jednostek, czyli ustalenie numeru wyrazu środkowego i odczytanie jego wartości. Ustalony numer dzieli zbiorowość statystyczną na dwie grupy: jednostki posiadające wartości cechy mniejsze od wartości mediany i jednostki posiadające wartości cechy większe od wartości mediany. Ustalamy pozycję wartości środkowej, za pomocą wzoru:

Nm = (N + 1) : 2

Nm – wyraz środkowy
N – ogólna liczba jednostek statystycznych
a ze wzoru M = xNm obliczamy wartość mediany
M – wartość mediany
XNm – wartość cechy jednostki środkowej

Przykład
Spółdzielnia mieszkaniowa „Stokrotka” wystawiła na sprzedaż 9 pomieszczeń mieszkalnych o następujących cenach:
1) 13 000 zł
2) 17 000 zł
3) 20 000 zł
4) 26 000 zł }szereg musi być uporządkowany
5) 30 000 zł
6) 32 000 zł
7) 33 000 zł
8) 39 000 zł
9) 40 000 zł
N – jednostek statystycznych jest 9
czyli, Nm = (9 + 1): 2 =5
wyraz środkowy w powyższym szeregu (jednostka), to piąte mieszkanie, które kosztuje 30 000 zł. Wartość mediany wynosi 30 000 zł.
Cztery mieszkania wystawione na sprzedaż osiągnęły cenę niższą niż 30 000 zł, a pozostały cztery mieszkania osiągnęły cenę wyższą niż 30 000 zł.

2) Szereg indywidualny wartości cechy o parzystej liczbie jednostek, występują tutaj dwa wyrazy środkowe:
Nm1 – pierwszy wyraz środkowy
Nm2 – drugi wyraz środkowy
Pozycję tych wyrazów obliczamy według wzorów
Nm1 = N : 2
Nm2 = (N + 2) : 2
N – liczebność całej zbiorowości
a ze wzoru, gdzie wartość mediany (M) równa się, sumie wyrazu pierwszego i drugiego, dzielonej przez 2 ( średniej arytmetycznej dwóch średnich wyrazów).

Przykład
Liczba pracowników z czterech zakładów pracy w Rzeszowie, którzy pojechali na wycieczkę do Pragi.
1) 6
2) 4
3) 8 } parzysta liczba jednostek
4) 3
Nm1= 2
Nm2 = 3, czyli wartość mediany jest równa średniej arytmetycznej liczbie pracowników z drugiego i trzeciego zakładu.
M = 6
W dwóch zakładach w Rzeszowie, liczba pracowników którzy pojechali na wycieczkę była mniej niż 6, a w dwóch pozostałych była wyższa niż 6.

4) Szereg statystyczny z cechą mierzalną ze zmiennością skokową w szeregu rozdzielczym stosuje się dodatkową kolumnę, która zawiera sumę liczebności klasy i klas które ją poprzedzają. Następnie ustala się numer jednostki mediany przy pomocy wzoru

Nm = (N + 1) : 2
( szereg indywidualny wartości cechy o nieparzystej liczbie jednostek), ustala się także wartość mediany, odczytując ją z kolumny z wartościami cechy statystycznej.

Przykład

Liczba pomieszczeń w lokalu mieszkalnym
przypadająca na rodzinę.
Liczba pomieszczeń Liczba rodzin Szereg skumulowany
2
3
4
5
Razem 18
16
20
15
69 18
34
54
69
X

Źródło: dane umowne

Numer jednostki środkowej Nm = (69 + 1) : 2 = 35
Po ustaleniu numeru jednostki środkowej ustala się na podstawie szeregu skumulowanego, w której klasie szeregu rozdzielczego znajduje się ta jednostka. Ustala się to odszukując wiersz z szeregu skumulowanego, w którym liczebność jest większa niż wyraz środkowy (54). Następnie odczytujemy cechy z szeregu rozdzielczego (4), jest to wartość mediany.
Część rodzin posiada w swoich lokalach cztery pomieszczenia i mniej, a część cztery i więcej pomieszczeń.
- gdy mamy do czynienia z szeregiem indywidualnym wartości cechy wartość mediany oznacza, że połowa jednostek statystycznych posiada wartość cechy niższą niż mediana i połowa posiada wartość cechy wyższą niż mediana.
- W przypadku szeregu rozdzielczego wartość mediany oznacza, że połowa jednostek statystycznych posiada wartość cechy niższą lub równą niż mediana i połowa posiada wartość cechy wyższą lub równą niż mediana.
5) Szereg statystyczny z cechą mierzalną ze zmiennością ciągłą, w tym przypadku medianę można:
- wyznaczyć graficznie
- obliczyć jej przybliżoną wartość
wzór:

M = x0M + (L : nM).[(N : 2) – SsM-1)]
gdzie:
M – mediana,
xoM – dolna granica przedziału liczbowego mediany,
L – rozpiętość przedziału mediany (różnica między górną a dolną granicą przedziału),
nM – liczebność przedziału mediany,
N – liczebność zbiorowości,
SsM-1 – liczebność szeregu skumulowanego w wierszu poprzedzającym wiersz mediany

Przykład
Poziom wynagrodzenia pracowników
w czerwcu 2003 roku w „Europak”
Wynagrodzenie w zł Liczba pracowników Szereg skumulowany
550 –570
570 – 590
590 – 610
610 – 630
630 – 650
Razem 4
6
6
2
8
26 4
10
16
18
26
x
Źródło: dane umowne


1) tworzymy szereg skumulowany,
2) określamy przedział klasowy w którym znajduje się mediana (sprawdzenie w którym wierszu szeregu skumulowanego mieści się wyraz środkowy) – w tabeli mediana zawiera się w przedziale (590 – 610>
3) obliczamy medianę:
xoM – dolna granica przedziału liczbowego mediany - 590
L – rozpiętość przedziału mediany – 20
nM – liczebność przedziału mediany - 6
N – liczebność zbiorowości - 26
SsM-1 – liczebność szeregu skumulowanego w wierszu poprzedzającym wiersz mediany – 10
4) podstawiamy wartości do wzoru:
M = 590 + (20 : 6) . [(26 : 2) – 10] = 599,9 zł
Mediana wynosi 599,9 zł. Połowa pracowników „Europak” w czerwcu 2003 roku zarobiła 599,9 zł lub więcej, a połowa zarabiała 599,9 zł i mniej.
Metoda graficzna wyznaczania mediany w przypadku szeregów statystycznych z cechą mierzalną ze zmiennością ciągłą.
1) w układzie współrzędnych sporządza się wielobok liczebności szeregu skumulowanego
2) na osi y zaznacza się numer jednostki mediany – 13 (punkt A)
3) z punktu A przeprowadza się odcinek równoległy do osi x aż do punktu przecięcie z krzywą liczebności (punkt B)
4) z punktu B prowadzi się prostą do osi y





 Kwantyle definiuje się jako wartości cechy badanej zbiorowości przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek. Części te pozostają do siebie w określonych proporcjach. Do najczęściej stosowanych kwantyli należą kwartyle, a w przypadku analizy struktury zbiorowości bardzo licznych decyle a także percentyle.
Kwartyle dzielą zbiorowość pod względem liczebności na ćwiartki. Kwantyle są wartościami cechy statystycznej dzielącymi badaną zbiorowość na części pod względem liczebności pozostające między sobą w ściśle określonym stosunku. Najprostszym kwartylem jest kwartyl rzędu drugiego - zwany również medianą lub wartością środkową - dzielący zbiorowość na dwie równoliczne części. Kwartyl rzędu pierwszego jest wartością cechy statystycznej dzielącą próbę pod względem liczebności na dwie części pozostające w stosunku 1/3.Czyli jest wartością cechy wydzielającą 1 część stanowiącą 25% elementów. Dla szeregu wyliczającego kwartyl rzędu pierwszego jest to mediana 1 połówki. Dla szeregu rozdzielczego kwartyl rzędu pierwszego wyznaczamy ze wzoru:
QI= xQI + (N/4 - nicum-1)/nQI DxQI
xQI - początek przedziału kwartyla,
N/4 - pozycja miernika,
nicum-I - skumulowana liczebność przedziałów poprzedzających przedział kwartyla,
nQI - liczebność przedziału kwartyla,
DxQI - długość przedziału kwartyla .
Kwartyl rządu trzeciego jest wartością cechy statystycznej dzielącą całą próbę pod względem liczebności na dwie części pozostające w stosunku 3/1 (kwartyl rzędu trzeciego wydziela 3 pierwsze ćwiartki).
Wzór
QIII= xQIII + (3N/4 - nicum-1)/nQIII DxQIII



LITERATURA

K. Romaniuk „Elementy ogólnej teorii statystyki”
B. Szulc „Statystyka dla ekonomistów”
S. Diamond „ Wszechstronna statystyka”

Czy tekst był przydatny? Tak Nie

Czas czytania: 10 minut