KVANTITATIVNE METODE (STATISTIKA) SKRIPTA - Seminarski, Diplomski, Maturski Radovi, Ppt

January 24, 2018 | Author: Tijana Mirić | Category: N/A
Share Embed Donate


Short Description

KVANTITATIVNE METODE...

Description

Statistika

Kvantitativne metode

1

KVANTITATIVNE METODE

STATISTIKA

Prof.dr

Beograd, 2004

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

2

SADRŽAJ 1. Statističko istraživanje Pojam i predmet statistike Statističke zakonitosti Statističke ocene 2. Statističko snimanje i prikazivanje rezultata Statistički skup Metodi prikupljanja podataka Sređivanje i obrada podataka Statističke serije Statističke tabele Grafičko prikazivanje statističkih podataka 3. Obrada i analiza podataka i rezultata Mere centralne tendencije Aritmetička sredina Harmnonijska sredina Geometrijska sredina Modus Medijana Mere varijabiliteta Razmak varijacije Kvartilna devijacija Varijansa i standardna devijacija Srednja devijacija Mere asimetrije i spljoštenosti Koeficijent asimetrije Koeficijent spljoštenosti 4. Indeksni brojevi Vremenske serije i njihova uporedivost Individualni indeks Agregatni (grupni) indeks Obuhvatnost i primena indeksnih brojeva 5. Analiza vremenskih serija Trend komponenta Linearni trend Parabolički (kvadratni) trend Eksponencijalni trend Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

3

Standrdna greška kod trenda 6. Regresiona analiza Regresija-pojam i značenje Linearna regresija Standardna greška regresije Korelacija-pojam i značenje Koeficijent korelacije

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

4

1. STATISTIČKO ISTRAŽIVANJE POJAM I PREDMET STATISTIKE Naziv statistika potiče od latinske reči Status, što znači stanje i italijanskog termina Regione di stato, što znači država, državni interes. Uzmemo li bilo koji od ovih etimoloških izvora u nastanku reči statistika, vidimo da je država kao celina bila područje nastanka i formiranja statistike kao društvene discipline, odnosno da je to bio jedan vid određene prostorne definisanosti predmeta statistike. Predmet proučavanja statistike su varijabilni (promenljive) pojave koje se ispoljavaju u masi slučajeva i zovu se masovne pojave. Varijabilitet je univerzalana karakteristika prirodnih i društvenih zbivanja. Svaka pojava nastaje pod uticajem nekih faktora, pa ponašanje pojave zavisi od prirode, broja i načina kombinovanja tih faktora. Pošto su faktori koji deluju na pojavu varijabilni, to će i pojava pokazivati manje ili više izražen varijabilitet. Elementarne pojave pokazuju najmanji varijabilitet individualnih slučajeva i rezultat su delovanja malog broja faktora. Odnos između ovih pojava i faktora međusobno uslovljenih ponavljaju se na približno isti način u svim konkretnim slučajevima. Kod takvih pojava primenjuje se metod pojedinačnog posmatranja, ispituje se jedan ili nekoliko slučajeva. Kod pojava koje ispoljavaju veću varijabilnost (društveno-ekonomske pojave) tek posmatranjem većeg broja slučajeva dolazio se do određenih zakonitosti u njihovom ponašanju. Zato statistika istaržuje masovne pojave a to istraživanje ima kvantitativni karakter. Pod statistikom se danas podrazumeva, deskriptivna statistika, statistička analiza i statistička teorija. Deskriptivna statistika prikuplja, obrađuje i povezuje podatke. Statistička analiza omogućuje pribavljanje numeričkih informacija, njihovu kvalitativnu interpretaciju, donošenje zaključaka i formiranje zakonitosti ponašanja posmatranih pojava. Statistička teorija iznalazi statističe metode, objašnjava ih, dokazuje i usavršava. Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

5

STATISTIČKE ZAKONITOSTI Masovno posmatranje ponašanja pojava uz odgovarajuću primenu statističke metodologije omogućava nam da uočimo opšte karakteristike varijabilnih pojava i otkrijemo pravilnosti u tendencijama ovakvih pojava. Pravilnosti koje uočvamo nazivaju se statističkim zakonitostima ili masovnim zakoitostima. Ona se ispoljavaju na velikom broju slučajeva jer te pravilnosti važe samo u masi. Ponašanje masovnih pojava u većem skupu pokazuje izvesnu pravilnost, a na malom broju slučajeva ta pravilnost se ne ne ispoljava. Statistika istražuje te pravilnosti i varijacije, i pritom polazi od velikog broja slučajeva koje posmatra, a rezultate grupiše, opisuje, upoređuje i analizira. Statistika se bitno razlikuje od evidencije bilo u preduzeću ili privredi. Pojam statistike je znatno širi. Zadatak evidencije jeste da registruje i prati svaku pojedinu jedinicu i njena individualna svojstva. Evidencija ima za cilj da obuhvati sve pojedinačne slučajeve da bi u svakom momentu mogla da pruži odgovarajuća obaveštenja o pojedinačnim individualnim slučajevima. Statistika ima za zadatak da uoči ono što je zajedničko, karakteristično za sve slučajeve posmatranja a pojedinačna svojstva sluze statistici samo kao polazna osnova za dalji rad, prema tome statistiku interesuju karakteristike skupova. Statistika i evidencija stoje u tesnoj međusobnoj vezi. Evidencija predstavlja osnovni izvor statističkih podataka o velikom broju poslovnih događaja i ekonomskih pojava. Statističko istraživanje se ne svodi na otkrivanje karakteristike skupa već je zadatak statistike merenje i analiza odstupanja individualnih karakteristika elemenata skupa od utvrđenih zajedničkih karakteristika – istarživanje njihovih varijabiliteta posmatranog skupa. Po njihovoj prirodi statistika je induktivni metod. Polazi od izvesnih hipoteza a zaključke donosi na osnovu iskustava, događaja, činjenica i statističkih eksperimenata. Dobijene rezultate podvrgava matematičkoj obradi u cilju pribavljanja novih informacija. STATISTIČKE OCENE Teorija verovatnoće omogućava statistici istraživanje karakteristike skupova na bazi objektivnih kvatitativnih ocena, koje se donose na osnovu posmatranja samo nekih odabranih slučajeva. Tako se obezbeđuje nepristrasnost izbora sa jedne i reprezentativnost odabranih slučajeva sa druge strane. Posmatraju se i istražuju slučajevi na kojima se osobine posmatrane pojave ispoljavaju približno isto kao i na celom skupu. Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

6

Rezultati koji se dobijau posmatrnjem odabranih reprezentativnih slučajeva nazivaju se statističkim uzorcima. Oni omogućuju objektivnu ocenu osnovnih karakteristika skupova, ocenu stepena njihovog varijabiliteta, kao i ocenu pouzdanosti zaključaka do kojih dolazimo. Procesi koji nisu ni sasvim slučajni ni strogo determinisani nazivaju se stohastičkim procesima. Ovi procesi ne odvijaju se po nekom određenom nepromenljivom zakonu. Na njih u velikoj meri utiču brojni faktori i njihove raznovrsne kombinacije i ne dešavaju se haotično. Primenom odgovarajućih kvantitativnih metoda mogu se, uz određeni rizik, vršiti izvesna predviđanja njihove dinamike. Statistička teorija eksperimenata omogućuje izvođenje eksperimenata na jako varijabilnim pojavama u cilju otkrivanja statističkih zakonitosti. Statistički eksperiment ne zahteva konstantnost ni jednog faktora, niti podudarnost uslova pri ponavljanju opita. Naprotiv, potrbno je da svi faktori što je moguće više variraju. Analizom tog varijabiliteta statistika proverava hipoteze o uzročnim vezama i zakonitostima i otkriva pravilnosti u ponašanju masovnih pojava. Statistički eksperiment pokazuje srednji odgovor, srednju reakciju skupa na dati eksperimentalni postupak.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

7

2. STATISTIČKO SNIMANJE I PRIKAZIVANJE REZULTATA 2.1. STATISTIČKI SKUP

Statistički skup, osnovni skup ili populacija je skup svih elemenata na kojima se izvesna pojava statistički posmatra. Statistički skup treba da ima osobinu da je relativno homogen, diferenciran i celovit. Statistički skup je relativno homogen kada su jedinice koje on obuhvata slične odnosno kad imaju bar jedno zajedničko svojstvo. Skup je homogeniji ukoliko imaju bar jedno zajedničko svojstvo. Skup je homogeniji ukoliko imaju više zajedničkih osobina. Na primer: nezaposleni na nekom području razlikuju se po mnogim osobinama ali imaju zajedničku osobinu da su nezaposleni. Statistički skup je diferenciran kada su jedinice na kojima se vrši posmatranje istovrsne ali ne i istovetne. Svrha statističkog posmatranja je

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

8

ispitivanje diferenciranosti skupa u pogledu nekih osobina i njihovo kvantitativno određivanje. Statistički skup je celovit ako obuhvata sve individualne slučajeve posmatrane pojave u vremenu i prostoru. Da bi se statistički skup mogao proučavati on se mora definisati prostorno, vremenski i pojmovno. Prostorno odrediti statistički skup znači odrediti prostor – teritoriju na koji se odnose ili kojem pripadaju statističke jedinice. Vremenski odrediti skup znači odrediti momenat ili razdoblje vremena u kojem će se obuhvatiti sve jedinice koje ulaze u statistički skup. Kako će se vremenski odrediti skup zavisiće od prirode pojave koju ispitujemo, od jedinice skupa i njihovih karakteristika. Sadržinsko – suštinsko određenje statističkog skupa iziskuje određivanje osobine koje mora da ima svaka jedinica da bi bila uključena u skup. Pojedinačni element ili jedinica na kome se vrši statističko posmatranje predstavlja statističku jedinicu, a ona je osnovni nosilac karakteristika tog skupa. Osobine po kojima se statističke jedinice međusobno razlikuju ili ne, nazivaju se statističkim obeležjima.Različiti vidovi u kojima se obeležje može javiti nazivaju se modalitetima tog obeležja. Sa aspekta obrade podataka obeležja mogu biti numerička i atibutivna. Numerička obeležja brojčano izražavaju kvantitativne razlike jedinica posmatranja a do njih se dolazi merenjem ili prebrojavanjem (godine starosti, težina, visina...). Atributivna obeležja opisno izražavaju kvalitativne razlike jedinica posmatranja (pol, zanimaje..) i imaju određene modalitete ( Pol ima dva modaliteta: muško i žensko). Ovi modaliteti ne odražavaju intezitet obeležja već samo njene različite oblike pojavljivanja. Numerička obeležja mgu biti neprekidna ili kontinuirana i prekidna ili diskontinuirana. Neprekidna obeležja imaju ma koju vrednost unutar jednog intervala (visina, težina...). Do vrednosti ovih obeležja dolazi se merenjem. Prekidna obeležja najčešće uzimaju cele brojeve (broj dece, broj zaposlenih...) iz mogućeg skupa vrednosti. Do ovih numeričkih vrednosti dolazi se prebrojavanjem. 2.2. METODI PRIKUPLJANJA PODATAKA Za svaku statističku akciju potrebno je izabrati najefikasniji metod posmatranja (prikuplljanja podataka). Pojava koja se posmatra može se Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

9

obuhvatiti na svim jedinicama statističkog skupa to je potpuno posmatranje ili samo jednom njegovom delu – delimično posmatranje. Postoje dva osnovna metoda potpunog statističkog posmatranja i to: statistički popis i izveštajni metod. Statistički popis obuhvata sve jedinice posmatranja jednog statističkog skupa u određenom momentu (“kritički momenat”). Tako se dobija potpun uvid u stanje i strukturu skupa po raznim obeležjima. Ovakav oblik statističkog posmatranja je veoma skup, pa se organizuje u dužim vremenskim intervalima (popis stanovništva obavlja se svake pete ili desete godine, a kritični momenat je 31. mart). Izveštajni metod prati kontinuirano događaje čiji je varijabilitet tokom vremena jače izražen. Sprovode ga lica ili institucije sistema radi svojih poslovnih potreba. Statističkim organima u određenim vremenskim intervalima šalju se redovno popunjeni statistički upitnici. Statističkim izveštajem u sukcesivnim vremenskim momentima (stanje novca u blagajni u mesecu...) ili intervalima vremena (prirodno kretanje stanovništva...) vrši se posmatranje promena statističkog skupa. Kada je nemoguće sprovesti potpuno posmatranje koristi se delimično posmatranje statističkog skupa. Ono se sprovodi na osnovu uzorka. Statistički uzorak je reprezentativni deo osnovnog skupa na osnovu koga se donose zaključci o karakteristikama osnovnog skupa. Uzorak će biti reprezentativan ako je dovoljno veliki i ako je po svojoj strukturi sličan statističkom skupu. Kvalitet prikupljenih podataka zavisi od specifikacije istraživanja, instrumenata istarživanja, uslova istraživanja kao i od stava i ponašanja davalaca podataka. Neminovni pratilac statističkih istaživanja su i greške koje mogu biti slučajne i sistematske. Slučajne greške nemaju poseban uticaj na kvalitet podataka, dok sistematske uvek utiču na podatke. 2.3. SREĐIVANJE I OBRADA PODATAKA Prikupljeni podaci, jednim od metoda, predstavljaju sirov materijal koji treba srediti i obraditi. Individualne podatke treba pretvoriti u brojčane informacije putem grupisanja jedinica po modalitetima posmatranih obeležja i njihovih zbrajanja u svakoj grupi. Sređivanje predstavlja tehničko – metodološki deo poslova u kome se, prema šemi grupisanja i cilju istarživanja, prikupljeni statistički materijal svrstava u serije i tabele koje predstavljaju statistički način istraživanja. Zato serije i tabele moraju da budu precizno i jasno sastavljene, kako bi ono što je u njima sadržano bilo dovoljno vidljivo i podesno za analizu. Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

10

Prema mestu, sređivanje podataka može biti cenralizovano kada se sav prikupljeni statistički materijal šalje u jedan centar gde se sređivanje obavlja jedinstveno i u celosti. Decentralozovano se sastoji u tome da se ovi poslovi vrše na više mesta, najčešće po regionalnim centrima. Mešovito sređivanje sastoji se u tome da se do određene faze poslovi obave u raznim regionalnim centrima a zatim se sve prikuplja u jedan centar da bi se završili svi ostali poslovi do konačnog sređivanja. U tehničkom pogledu poslovi sređivanja mogu da budu izvedeni ručno koji predstavlja primitivan način sređivanja gde nema sredstava i opreme. To je spor način i ne daje mogućnosti za složenije analize. Mašinsko sređivanje predstavlja savremen i brz način obavljanja poslova sređivanja. Takvim sređivanjem obezbeđena je maksimalno moguća tačnost i svedeno na minimum pravljenja grešaka. Uvođenje savremenih računara omogućilo je da se značajno skrati vreme obrade statističkih podataka a time i istraživanje u celini. Tačnost u radu i brzo dobijanje rezultata imaju za statistiku poseban značaj. 2.4. STATISTIČKE SERIJE Kao rezultat sređivanja statističkog materijala dobijamo statističke serije. Statistička serija predstavlja niz brojčanih podataka o jednom ili više obeležja neke pojave. Statističke serije su brojčani pokazatelji kako kvantitativnih tako valitativnih varijacija obeležja kod masovnih pojava. Statisičku seriju čine dve kolone. U prvoj je dato obeležje po kojem je izvršeno grupisanje ( atributivno ili numeričko obeležje, mesto ili vreme). Druga kolona pokazuje broj jedinica pojedinih grupa u seriji. Zavisno od broja obeležja postoje proste i složene serije. Proste serije su one kod kojih se iskazuju podaci samo po jednom obeležju ili karakteristici posmatrane pojave. Složene serije su one kod kojih se izražavaju podaci o više obeležja posmatrane pojave. Prema vrsti obeležja kako su uređene i zavisno od toga šta pokazuju dele se na: - serije strukture - vremenske (hronološke) serije - geografske serije Serije strukture pokazuju raspored statističkih jedinica prema modalitetima ili prema vrednostima obeležja. Sastoji se iz dva reda obaveštenja. U jednom su modaliteti a u drugom broj jedinica, odnosno frekvencije koje pokazuju koliko se puta pojedini modaliteti javljaju unutar posmatranog statističkog skupa. Tip obeležja čini seriju strukture sa numeričkim obeležjem. Atributivna obeležja se iskazuju opisno i za njihovo grupisanje potrebno je imati jasnu šemu klasifikacije. Serije Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

11

strukture po numeričkim obeležjima nastaju grupisanjem jedinica po vrednostima numeričkog obeležja. Vremenske (hronološke) serije su nizovi statističkih podataka koje pokazuju varijacije posmatranih pojava tokom vremena. Prema prirodi podataka koje sadrže, dele se na momentne i intervale. Momentne serije pokazuju nivo ili količinu pojave u tačno određenim uzastopnim momentima vremena. Predstavljaju nizove različitih stanja. Zbog toga njihove podatke nema smisla sabirati. Intervalne vremenske serije pokazuju stanje pojave u nizu uzastopnih vremenskih intervala. To su najčešće kalendarski vremenski intervali. Njihovi grupisani podaci mogu se sabirati. Statistički podaci dobijeni na ovaj način omogućavaju dinamičku analizu pojave. Geografske serije pokazuju prostorni (teritorijalni) raspored pojave.Dele se na serije koje pokazuju rasprostranjenost pojave na nacionalnoj teritoriji i na serije koje pokazuju rasprostranjenost pojave u većem broju zemalja,što znači mogu biti nacionalne i međunarodne. Ako je numeričko obeležje prekidno vrednosti obeležja grupišu se po veličini od niže vrednosti ka višoj. Vrednosti neprekidnog obeležja grupišu se u intervale i tako se dobijau intervalne serije distribucije frekvencije. Broj intervala i širina intervala određuju se Stuges-ovim pravilom pomoću formule: K= 1+3,3logN i= Xmax-Xmin / K K- broj intervala N- broj statistističkih jedinica i- širina (veličina) intervala Xmax - najveća vrednost obeležja Xmin - najmanja vrednost obeležja Pri formiranju grupnih intervala preporučljivo je početi sa vrednošću manjom od najmanje u seriji a završiti sa većom od najveće vrednosti u seriji. Interval se sastoji iz donje granice i gornje granice intervala. Radi matematičke obrade ovakvih serija interval se zamenjuje jednom brojkom koja predstavlja razrednu sredinu (sabere se donja i gornja granica intervala i podeli sa dva). Važna veličina je i relativna frekvencija koja se dobija kada se frkvencija vrednosti obeležja (ƒi) stavi u odnos prema ukupnom broju jedinica tog skupa (Σƒi) i pošto se izražava u procentima pomnoži se brojem 100. Pored pomenutih frekvencija upotrebljavaju se i kumulativne frekvencije. Kumuliranje je sabiranje - pridruživanje frekvencija. Tako se dobija rastuća kumulativna frekvencija, pridruživanjem frekvencija prethodnih intervala redom do poslednjeg intervala. Obrnutim redom Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

12

oduzimanjem frekvencija prethodnih intervala od zbirne frekvencije dobija se opadajuća kumulativna frekvencija. PRIMER: Na jednom ispitu 40 studenata dobilo je sledeći broj bodova: 30 13 21 9 19 17 15 23 20 23 24 19 11 15 22 16 17 29 18 19 23 21 19 24 18 17 25 18 26 27 13 26 11 30 20 16 10 23 20 19 a) Grupisati podatke u obliku intervalne numeričke serije b) Izračunati rastuću i opadajuću kumulantu c) Izračunati relativnu frekvenciju u procentima i kumulativnu frekvenciju u procentima REŠENJE: a) Broj intervala: K=1 + 3,3•logN N= 40 K=1+ 3,3•log40 K=1+3,3•log1,60205

Širina intervala i= Xmax - Xmin/K Xmax= 30 Xmin= 9 K= 6 30 − 9 = 3,5 6

K= 6,286

i=

K≈ 6

i≈4

TABELA 1. Raspored studenata po broju bodova grupni intervali(Xi)

frekvencija(fi)

razredna sredina

rastuća kumulanta

Opadajuć a kumulanta

relativna frekvencija%

kumulativna frekvencija%

9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 /

4 6 14 9 4 3 ∑ ƒi=40

10,5 14,5 18,5 22,5 26,5 30,5 /

4 10 24 33 37 40 /

40 36 30 16 7 3 /

10 15 35 22,5 10 7,5 100

10 25 60 82,5 92,5 100 /

9 + 12 13 + 16 = 10,5 ; = 14,5 itd. 2 2 b)rastuća kumulanta: 4; 4+6; 10+14; 24+9 itd. frekvencija • 100 c)relativna frekvencija u procentima = n

Razredna sredina:

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

13

4 • 100 =10% 40 6 • 100 = 15% Za drugi interval 40 kumulativna frekvencija • 100 Kumulativna frekvencija u % = n 4 • 100 = 10% Za prvi interval: 40 10 • 100 = 25% Za drugi interval: 40

Za prvi interval

2.5. STATISTIČKE TABELE Statističke tabele omogućavaju pregledno i racionalno prikazivanje statističkih podataka dobijenih posmatranjem ili eksperimentom. Tabeliranje predstavlja jednu od etapa istraživanja čime započinje analiza podataka i rezultata.U tehničkom smislu statistička tabela predstavlja sistem izukrštenih horizontalnih i vertikalnih linja. Tako se dobijaju redovi između horizontalnih i kolone između vertikalnih linija. Statistička tabela ima još i sledeće elemente: zaglavlje koje u opisnom obliku (tekstom) objašnjava brojeve (podatke) koji se unose; pretkolonu koja tekstom opisuje brojeve (podatke) koji se unose u redove; zbirni red sadrži zbirove svake pojedine kolone a zbirna kolona sadži pojedinačne zbirove svakog reda iz tabele. Svaka tabela ima tekstualni i numerički deo. Investicije u proizvodnim delatnostima u 2000. godini u Srbiji u milionima Tehnička namena Domaća oprema Uvozna oprema Ukupno Mašine i uređaji 6759 7630 14389 Transportna sredstva 3210 1420 4630 Ostala oprema 3120 830 3950 Izvod: SB- 926 , str. 24.

Statistička tabela mora da bude razumljiva, pregledna i jedinstvena. Modaliteti obeležja ne smeju se skraćivati ni u predkoloni ni u zaglavlju a jedinstvenost tabele se obezbeđuje u ustaljenim oznakama. Preglednost se obezbeđuje tako što se izbegavaju obilne tabele. Statističke tabele, zavisno od broja obeležja dele se na: proste tabele; složene tabele; kombinovane tabele.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

14

Proste statističke tabele prikazuju jednu statističku seriju ( seriju strukture, vremensku ili geografsku seriju). Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

15

Složene statističke tabele sadrže više prostih tabela. Podaci su razvrstani prema istom obeležju po određenim kriterijumima. Imaju više redova i kolona koje su u sadržinskoj vezi. Kombinovane statističke tabele daju prikaz statističkih podataka sređenih prema dva ili više obeležja. Oba obeležja u kombinovanoj tabeli mogu da budu numerička, oba atributivna, jedno može da bude atributivno a drugo numeričko. Razlikuju se od ostalih po svojoj formi, Zbog zbirnog reda i zbirne kolone. Stanovništvo Srbije staro 10 godina i više godina po pismenosti i polu po poisu 1991 godine.

Pismenost Pismeni Nepismeni Ukupno Izvor SGS- 2000, str 91.

Pol Muški 4,6 0,5 5,1

Ukupno Ženski 3,9 0,7 4,6

8,5 1,2 9,7

Zavisno od namene tabele se dele na obradne i publikacione. Obradne tabele služe za obradu statističkih podataka. Služe kao statistička obradna dokumentacija. Služe za kontrolu podataka i izvor su detaljnih informacija. Publikacione tabele služe za izučavanje pojava i za njihovu analizu.Namenjene su širokom krugu korisnika. 2.6. GRAFIČKO PRIKAZIVANJE STATISTIČKIH PODATAKA Grafičkim prikazivanjem statističkih podataka uočavaju se osnovne karakteristike posmatrane pojave. Grafičko prikazivanje mora da bude jasno, jednostavno i pregledno i pritom da odgovara brojčanim podacima upisanim u tabeli i da im bude proporcionalno. S obzirom na raznovrsnost masovnih pojava koje mogu biti obuhvaćene statističkim istrživanjima postoji više vrsta statističkih grafikona. Osim sadržaja (pojave koju prikazuje) svaki grafikon mora da ima i sastavne elemente koji objašnjavaju sve ono što je potebno za njegovo potpuno razumevanje a to su: - naslov koji treba ukratko da označava predmet grafikona, šta se njime prikazuje (oznaka predmeta); - teritoriju, ili mesto na kome se nalazi pojava koja se prikazuje(oznaka mesta); - vreme na koje se odnose prikazani podaci (oznaka vremena); - legenda kojom se objašnjavaju simboli koji su upotrbljeni u grafikonu; - oznaka jedinice mere u kojoj su izraženi podaci ili rezultati.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

16

Podela statističkih grafikona prema elementima koje sadrže je na: dijagrame, kartograme i piktograme. Dijagrami, ovi statistički grafikonu konstruišu se uz pomoć geometrijskih pojmova (tačka, linija, slike i likovi iz planimetrije, tela iz sterometrije). Prema grupama ovih geometrijskih pojmova koji se koriste za izradu grafikona, dijagrame delimo na: tačkaste (stigmogrami); linijski (poligoni); površinski (histogrami) i prostorni (stereogrami). Kartogrami su grafikoni na geografskim kartama i prikazuju geografske serije. Na slikovit čin ilustruju statističke podatke. Piktogrami ( sama reč potiče od latinske reči pictur što znači slika ili crtež) na popularan i slikovit način prikazuju pojave. Slike ili figure su srzmerne veličini pojave koja se prikazuje. Oni dobro informišu o obimu, strukturi i promeni posmatranih pojava ali nisu dovoljno precizni. LINIJSKI DIJAGRAMI Linijskim dijagramima moguće je prikazivati sve statističke serije. Koriste se kod serije podataka koji prate pojavu u vremenu, pa se nazivaju hronogramima. Na jednom dijagramu moguće prikazati dve ili više vremenskih serija. za konstrukciju linijskih dijagrama uglavnom se koristi Dekartov pravougli i polarni koordinatni sistem, i to njegov prvi kvadrant jer pojave koje se prikazuju grafički su po pravilu pozitivne. PRIMER: Prikazati na osnovu tabele 1. linijskim dijagramom frekvenciju, rastuću i opadajuću kumulantu. Prikaz frekvencije na bazi tabele br.1 14

frekvencija

12 10 8 6 4 2 0 9

12

16

20

24

28

32

klase

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

17

Prikaz rastuće kumulante (tabela 1.) 45 40

frekvencija

35 30 25 20 15 10 5 0 9

12

16

20

24

28

32

klase

Prikaz opadajuće kumulante (tabela 1.) 45 40 frekvencija

35 30 25 20 15 10 5 0 9

12

16

20

24

28

klase

Linijski dijagram sa aritmetičkom skalom na ordinati zove se aritmetički dijagram, a linijski dijagram sa logaritamskom skalom na ordinati zove se polulogaritamski dijagram najčešće se koristi, omogućava prikazivanje više vremenskih serija čiji su podaci dati u različitim jedinicama mere. Pogodna je za praćenje i za upoređivanje vremenskih serija. PRIMER: Godišnja proizvodnja u jednoj fabrici u 3 pogona u periodu od 1995. do 2002. bila je: Godišnja prozvodnja u pogonima A, B i C u periodu 1995 – 2002. Godine 1995 1996 1997 1998 1999 2000 2001 A 680 720 780 810 920 860 790 B 1400 1350 1210 1280 1410 1520 1580 C 2100 2300 2280 2400 2350 2510 2450

2002 840 1650 2200

Date podatke prikazati pomoću polulogaritamskog dijagrama. Radna tabela Godina Pogon A

Pogon B

Pogon C

log Y1

log Y2

log Y3

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode Y1 680 720 780 810 920 860 790 840

1995 1996 1997 1998 1999 2000 2001 20002

Y2 1400 1350 1210 1280 1410 1520 1580 1650

Y3 2100 2300 2280 2400 2350 2510 2450 2200

18

2,83251 2,85733 2,89209 2,90848 2,96378 2,93449 2,89762 2,92427

3,14612 3,13033 3,08278 3,10721 3,14922 3,18184 3,19865 3,21748

3,32221 3,36173 3,35793 3,38021 3,37106 3,39967 3,38916 3,34242

Grafički prikaz proizvodnje u pogonima A,B i C za period od 1995 do 2002 god. 3.50 3.40 3.30 3.20 3.10 3.00 2.90 2.80 2.70 2.60 2.50

pogon A pogon B pogon C

1995

1996

1997

1998

1999

2000

2001

2002

POVRŠINSKI DIJAGRAMI Dve ili više pojava koje se prate mogu se prikazati pomoću pravougaonika (histograma), kvadrata, krugova, itd. Kod pravougaonika za osnovicu se uzima jedinična vrednost a površina pravougaonika određena je samo njegovom visinom. Širina stubaca kao i rastojanje između njih određuje se proizvoljno ali u jednom grafikonu moraju biti jednaki. Za prikazivanje veličine ili nivoa pojave po modalitatima ili po nivoima jednog obeležja koriste se jednostavni stubići. Ako se na X- osu nanesu vrednosti obeležja, onda se dobija niz spojenih pravougaonika, tzv. histogram frkvencija. Histogram je grafički prikaz distribucije frekvencija. On omogućava upoređivanje frekvencija pojedinih delova statističkog skupa. Površina pojedinačnog prvougaonika je proporcionalna frkvenciji odgovarajućeg grupnog intervala, a ukupna površina svih pravougaonika histograma daje ukupnu frekvenciju. PRIMER: Mesečna potrošnja mesa u kg. po domaćinstvima u jednom regionu bila je: Raspored domaćinstava prema msečnoj potrošnji mesa

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

19

Potrošnja mesa (kg) Xi

2-5

5-8

8 - 11

11 - 14

14 - 17

17 - 20

Broj domaćinstava ƒi

3

4

10

6

4

2

Nacrtati histogram frekvencija i poligon frekvencija: Histogram frekvencija 12 10 8 6 4 2 0

Poligon frekvencija 12 10 8 6 4 2 0 1

U površinske dijagrame spadaju i kvadrati. Površina kvadrata (P=a2) predstavlja obim posmatrane pojave. Za grafičko prikazivanje potrebno je da odredimo stranicu a kvadrata i jedinica mere (mm,cm,itd.) mora biti ista za sve kvadrate, jer se upoređivanje dve ili više pojava. PRIMER: U četiri preduzeća broj zaposlenih bio je 576, 729, 324, i 400. Prikazati grafički (kvadartima) i pravougaonicima sa procentualnom razmerom.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

Broj zaposlenih u 4 preduzeća Preduzeće I Zaposleni 576

II 729

20

III 324

IV 400

Stranice kvadrata izračunavaju se po obrascu: a = P

a a a a

1

= 576

a1=24

2

= 729

a2=27

3

= 324

a3=18

4

= 400

a4=20

a1=24

a2=27

a3=18

a4=20

Procentualna razmera: I preduzeće 576/2029•100% = 28,39% II preduzeće 729/2029•100% = 35,92% III preduzeće 324/2029•100% = 15,97% IV prduzeće 400/2029•100% =19,72%

0

0%

28.39%

10% 20%

35.97%

30% 40%

50% 60%

15.97%

70% 80%

19.72%

90% 100%

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

21

KRUŽNI DIJAGRAMI Površinski dijagrami, krugovi predstavljaju način grafičkog prikazivanja u kome pomoću krugova vršimo upoređivanje dveju ili više statističkih masovnih pojava. U praksi se najviše koriste krugovi strukture. Oni služe da prikažemo strukturu neke pojave po satavnim elementima. Ako želimo da u jednom krugu prikažemo strukturu neke pojave, onda obim kruga predstavlja celu posmatranu pojavu, tj. 100% veličine pojave.Svaki od tih procenata odgovara delu obima kružne frekvencije od 3,6 stepeni, jer je ukupan obim kruga jednak 360 stepeni. PRIMER: Raspored radnika u jednom preduzeću prema školskoj spremi bio je. U strukturi kruga prikazati raspored radnika na bazi date tabele. Školska sprema (X)

Visoka

Viša

Srednja

Niža

Ukupno

Broj zaposlenih f

25

52

105

110

292

REŠENJE: Date frekvencije iskazati u procentima. Za to se koristi obrazac: %=

f • 100% n

25 •100% =8,56% 292 52 Viša sprema •100% = 17,81% 292 105 Srednja sprema •100% = 35,96% 292 110 Niža sprema •100% =37,67% 292

Visoka sprema

Ukupno =100% Date frekvencije iskazati u stepene. Koristi se obrazac: Stepen=

f • 360ْ n

Visoka sprema

25 •360ْ =31ْ 292 Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

22

52 •360ْ = 64ْ 292 105 Srednja sprema •360= 129ْ 292 110 Niža sprema •360= 136ْ 292

Viša sprema

Školska sprema u strukturi kruga

35.96%

37.67%

8.56%

17.81%

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

23

3. OBRADA I ANALIZA PODATAKA I REZULTATA Dinamičku analizu pojave predstavlja ispitivanje promena u jednom skupu tokom vremena. Istraživanje statističkog skupa polazi od pojedinačnih vrednosti obeležja a zaključci o celom skupu ne mogu se izvoditi izolovanim posmatranjem tih podataka. Zato se serija podataka zamenjuje malim brojem novih veličina. Te veličine treba da što bolje informišu o posmatranom skupu i pruže najvažnije informacije o rasporedu vrednosti posmatranog obeležja skupa. Da bi se dobili što precizniji podaci o statističkim serijama koristi se: - srednje vrednosti ili mere centralne tendencije - mere vrijacije ili disperzije - mere asimetrije i spljoštenosti Ovi parametri informišu o vrijaciji, lokaciji i drugim karakteristikam posmatrane statističke serije. U zavisnosti od toga da li je predmet posmatranja uzorak ili statistički skup dobijaju se parametri uzorka ili parametri skupa. MERE CENTRALNE TENDENCIJE Mere centralne tendencije ili srednje vrednosti daju informacije o tome kako su raspoređene vrednosti obeležja posmatranog skupa. Kako nose zajedničke karakteristike svih vrednosti statističkog skupa zovu se reprezentativne. Srednje vrednosti se dele na dve osnovne grupe: - izračunate srednje vrednosti - pozicione srednje vrednosti Izračunate srednje vrednosti se računskim putem dobijaju iz podataka serije. U izračunate srednje vrednosti spadaju: - aritmetička sredina - harmonijska sredina - geometrijska sredina Pozicione srednje vrednosti se određuju pozicijom koju zauzimaju u datoj seriji podataka. U pozicione srednje vrednosti spadaju: - modus ili mod - medijana Srednje vrednosti nalazi primenu u svim oblastima statističke analize.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

24

3.1.1. ARITMETIČKA SREDINA ( X ) Aritmetička sredina se najčešće javlja u primeni. Neophodan uslovza pravilnu primenu aritmetičke sredine jeste da podaci u seriji pokazuju dovoljan stepen homogenosti a kriterijum za određivanje ta homogenosti zavisi od prirode i vrste pojave koja je prikazana u seriji kao i da znamo suštinu i smisao rezultata kojeg želimo da dobijemo. Aritmetička sredina ima dva osnovna načina izračunavanja. Prvi način odnosi se na izraćunavanje iz prostih serija, tj. iz onih serija u kojima se svaki podatak javlja samo po jedanput. Drugi način izračunava aritmetičke sredine primenjuje se kod sređenih serija (serije distribucije frekvencija), tj. kod onih serija u kojima se pojedini podaci( modaliteti) javljaju u nejednakim frekvencijama, i tu se uzima i obzir veličina frekvencije svakog modaliteta. Svaki modalitet se ponderiše, vaga, svojom frekvencijom pa se ova aritmetička sredina naziva ponderisana(vagana) aritmetička sredina. PROSTA ARITMETIČKA SREDINA Prosta aritmetička sredina ( X ) dobija dobija se kada se saberu sve vrednosti članova jedne serije pa taj zbir podeli brojem članova e serije. Ako imamo neku seriju čije su vrednosti članova te serije označeni sa: x1, x2 , x3, x4, ........... xi prosta aritmetička sredina ( X )biće jednaka: X =

x1 + x 2 + x3 + x 4 + ...... + xi ili n n

X =

∑x i =1

i

n

Izražena je u istim mernim jedinicama kao i podaci čiji je prezent. PRIMER: U toku jedne nedelje dnevni ulozi na štednju (u hiljadama) u jednoj banci bili su: Dani Ponedeljak Utorak Sreda Četvrtak Petak Subota

Ulozi u hiljadama 15 10 14 11 18 9

X1 X2 X3 X4 X5 X6

Koliki je bio prosečni ulog u toj nedelji?

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

X=

x1 + x 2 + x3 + x 4 + x5 + x6 6

X=

15 + 10 + 14 + 11 + 18 + 9 77 = 6 6

25

X = 12,83

Prosečan ulog u posmatranoj nedelji bio je 12,83 (hiljada)

PONDERISANA ARITMETIČKA SREDINA Aritmetička sredina grupisanih podataka dobija se tako što se vrednosti obeležja prvo pomnože odgovarajućom frekvencijom (x1f1, x2f2, x3f3,...xifi) zatim se dobijeni proizvodi saberu i podele zbirom frkvencija (f1,f2,f3,...fi). Množenjem pojedinačne vrednosti obeležja sa odgovarajućom frekvencijom zove se ponderisanje vrednosti. Ponder je značaj ili važnost što znači veća frekvencija, veći značaj jači uticaj na aritmetičku sredinu. Važnost se ne menja ako se ponderi proporcionalno povećavaju ili menjaju. Algebarski uzraz za aritmetičku sredinu glasi: X=

x1 ⋅ f 1 + x 2 ⋅ f 2 + x3 ⋅ f 3 + ......xi ⋅ f i f 1 + f 2 + f 3 + ...... f i

ili n

X=

∑x i =1

i

⋅ fi

n

∑f i =1

i

Aritmetička sredina je osetljiva na ekstremne vrednosti a veoma je upotrebljiva ako se pojava ponaša linearno. Najvažnije osobine aritmetičke sredine su: 1. Zbir odstupanja pojedinačnih obeležja od aritmetičke sredine jednak je nuli.(od svake individualne vrednosti obeležja oduzima se vrednost aritmetičke sredine). Za negrupisane podatke: Σ( xi- X )=0 Za grupisane podatke: Σfi( xi- X )=0 2. Aritmetička sredina se uvek nalazi između najmanje i največe vrednosti obeležja. Xmin < X < Xmax

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

26

3. Ako su vrednosti obeležja međusobno jednake, onda je aritmetička

sredina jednaka tim vrednostima: X1=X2=X3=........=Xn X =X1=X2=...........Xn 4. Zbir kvadrata odstupanja podataka od aritmetičke sredine jeste

linijski. ∑(xi- X )2=min PRIMER: U januarskom ispitnom roku 55 studenata dobilo je sledeće ocene: iz statistike: Ocene Broj studenata

5

6

7

8

9

10

14

18

7

5

8

3

Izračunati prosečnu ocenu iz statistike: Radna tabela ocene (xi) 5 6 7 8 9 10 ∑

(x1) (x2) (x3) (x4) (x5) (x6)

broj studenata (fi) 14 18 7 5 8 3 Σfi=55 6

X=

∑x i =1

i

⋅ fi

6

∑f i =1

=

(f1) (f2) (f3) (f4) (f5) (f6)

grupni proizvod (fixi) 70 (x1f1) 108 (x2f2) 49 (x3f3) 40 (x4f4) 72 (x5f5) 30 (x6f6) ∑fixi=2536

369 55

i

X =6,71

Prosečna ocena iz statistike u januarskom ispitnom roku bila je 6,71.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

27

PRIMER:Na kolokvijumu iz statistike 76 studenata osvojili su sledeći broj bodova: Broj 0 -10 11 - 21 22 - 32 33 - 43 44 - 54 55 - 65 bodova Broj studenata

3

16

18

20

11

8

Izračunati prosečan broj bodova: RADNA TABELA Broj bodova (xi) Broj studenata (fi) 0 – 10 11- 21 22 -32 33 - 43 44 - 54 55 - 65 ∑

Razredna sredina(xi)

3 16 18 20 11 8 ∑fi=76

X=

5 16 27 38 49 60 /

∑x ⋅ f ∑f i

i

i

=

(fixi) 15 256 486 760 539 480 ∑xi•fi=3536

2536 76

X = 33,37

Prosečan broj osvojenih bodova bio je 33,37 HARMONIJSKA SREDINA (H) Harmonijska sredina upotrebljava se u onim slučajevima kada numerička vrednost obeležja i obim pojave stoje u obrnutoj srazmeri i kada su vrednosti obeležja za koje treba izračunati sredinu izražene u vidu recipročnih odnosa. Taj odnos reciprociteta sastoji se u tome što se vrednost tih obeležja smanjuje kada se pojava povećava i obrnuto,vrednost njihova se povećava kada pojava opada. Harmonijska sredina je recipročna aritmetička sredina recipročnih vrednosti podataka.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

28

PROSTA HARMONIJSKA SREDINA Ako su nam date vrednosti obeležja x1, x2, x3, ......xi a broj elemenata označimo sa n, onda će prosta harmonijska sredina biti. n

H= 1 + 1 + 1 + .... 1 x1

x2

x3

xi

ili n

H=

n

1

∑x i =1

i

PRIMER: Sedam radnika proizvodi istu vrstu proizvoda i za jedinicu tog proizvoda utroše sledeće radno vreme: I Radnik 12 min

II Radnik 16 min

III Radnik 19 min

IV Radnik 23 min

V Radnik 18 min

VI Radnik 26 min

VII Radnik 20 min

Izračunati prosečno radno vreme za izradu proizvoda: RADNA TABELA Radnici

Utrošeno vreme

Količina proizvoda

I II III IV V VI VII

12 (x1) 16 (x2) 19 (x3) 23 (x4) 18 (x5) 26 (x6) 20 (x7)

1 1 1 1 1 1 1

n

H=

n

1

∑x i =1

i

H= 7 7 = 1 1 1 1 1 1 1 0,083 + 0,0625 + 0,0526 + 0,0435 + 0,0555 + 0,0384 + 0,05 + + + + + + 12 16 19 23 18 26 20 7 H= 0,385

H = 18,18 prosečno radno vreme potrbno za izradu proizvoda je 18,18 minuta.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

29

PONDERISANA HARMONIJSKA SREDINA Kada imamo seriju čiji podaci pokazuju recipročne odnose ali njihove frekvencije nisu iste (jednake) onda upotrebljavamo ponderisanu harmonijsku sredinu. Obrazac za izračunavanje ponderisane harmonijske sredine glasi. f 1 + f 2 + f 3 + ...... f i H= f1 + f 2 + f 3 + .... f i x1 x 2 x3 xi n

H=

∑f i =1 n

fi

∑x i =1

i

i

PRIMER 2. U jednom preduzeću 30 radnika izradi jedan proizvod za sledeće vreme u minutima: 23,28, 38 i 43. Izračunati srednje vreme izrade tog proizvoda. RADNA TABELA Vreme izrade (xi) Broj radnika (fi) fi/xi 23 5 0,217 28 7 0,25 34 9 0,264 38 4 0,105 43 5 o,116 ∑ ∑fi =30 ∑= fi/xi =0,952 n

H=

∑f i =1 n

fi

∑x i =1

i

=

30 0,952

i

H= 31,512 Srednje vreme izrade proizvoda je 31,512 minuta. 3.1.3.

GEOMETRIJSKA SREDINA ( G )

Kada imamo seriju podataka koji pokazuju neke karakteristike geometrijske progresije ili kada imamo seriju relativnih pokazatelja kao što su razni koeficijenti, onda po pravilu primenjujemo metod geometrijske sredine. Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

30

Geometrijska sredina se dobija N- ti koren proizvoda svih vrednosti obeležja koji su pozitivne i različite od nule. GEOMETRIJSKA SREDINA IZ PROSTIH SERIJA Za negrupisane podatke za prostu seriju geometri x1, x2, x3,.....xn geometrijska sredina se računa sledećim obrascem: G= n x1 ⋅ x 2 ⋅ x3 .......x n G= n

n

∏x i =1

Primenom logaritamskog geometrijske sredine: logG=

računa

ili

i

dobija

se

logaritamski

log x1 + log x 2 + log x3 + ..... log x n n n

logG= ∑ i =1

oblik

ili

log xi n

Iz logaritamskog oblika geometrijske sredine.

antilogaritmovanjem dobija se vrednost

PRIMER 1. Data je serija podataka : 5,8,6,13,9. Izračunati geometrijsku sredinu. G=

n

n

∏x

i

= 5 5 ⋅ 8 ⋅ 6 ⋅ 13 ⋅ 9 = 5 28080

i =1

logG=

log 28080 4,44839 = = 0,88968 5 5 G= N 0,88968

G=7,767

GEOMETRIJSKA SREDINA IZ SERIJE DISTRIBUCIJA FREKVENCIJE

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

31

Za grupisane podatke imamo: X: x1, x2 , x3,........... xi f: f1, f2 , f3,..........fi dobija se obrazac: n ∑ fi x 1i⋅ x f 2⋅ x f 3⋅........... x fi fi i = ∑ fi 1 2 3 G= xi ∏ i =1

Primenom logaritamskog računa dobija se: log G=

f1 log x1 + f 2 log x 2 + f 3 log x3 + .... f n log x n f 1 + f 2 + f 3 .... + f n n

log G=

∑f i =1

i

⋅ log xi

n

∑f i =1

i

Antilogaritmovanjem dobijamo vrednost geometrijske sredine. Zbog složenosti izračunavanja geometrijske sredine njena primena i upotreba u statističkim istraživanjima je ograničena.Ona omogućuje praćenje dinamike, srednjeg tempa razvoja, prirodnog priraštaja stanovništva, izračunavanje stope rasta na bazi lančanih indeksa i drugo. Kada se radi o aritmetičkoj harmonijskaoj i geometrijskoj sredini važi sledeće pravilo: H ≤ G ≤ X Geometrijska sredina je manja ili jednaka aritmetičkoj sredini,a veća ili jednala harmonijskoj sredini. PRIMER2: Isplaćene stipendije za studente prve godine na jednom fakultetu tokom 2003. godine bile su: Stipendije u hilj. din.(xi) Broj studenata (fi)

3 23

4 18

5 9

6 7

Izračunati geometrijsku sredinu.

RADNA TABELA Stipendije u hilj. Broj studenata (fi) (xi)

logxi

filogxi

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

3 4 5 6 ∑

23 18 9 7 ∑fi=57

32

0,47712 0,60205 0,69897 0,77815

10,97376 10,8369 6,29073 5,44705 33,54844

/ n

∑ f log x i

i =1

log G =

i

n

∑f i =1

log G=

i

33,54844 57

log G=0,58856 G= N 0,58856 G=3,877 Prosečna stipendija bila je 3,877 dinara PRIMER3: Raspored radnika prema radnom stažu u jednoj fabrici u 2003.godini bio je: Godine staža (xi) Broj zaposlenih (fi)

5 -10

10 - 15

15- 20

20 - 25

25- 30

30- 35

15

20

35

18

11

5

Izračunati geometrijsku sredinu. Godine staža (xi)

Broj zaposlenih (fi)

xi

logxi

filogxi

5-10 10-15 15-20 20-25 25-30 30-35 Σ

15 20 35 18 11 5 Σfi=104

7,5 12,5 17,5 22,5 27,5 32,5 /

0,87506 1,09691 1,24303 1,35218 1,43933 1,51188 /

13,12592 21,93820 43,50633 24,33928 15,83265 7,55941 Σ=126,30179

n

log G=

∑ f log x i =1

i

i

n

∑f i =1

i

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

log G=

33

126,30179 =1,21440 104 G= N1,21440

G=16,38 Prosečan radni staž u fabrici bio je 16,38 godina. POZICIONE SREDNJE VREDNOSTI Naziv pozicione srednje vrednosti dobile su zato što se one uglavnom ne izračunavaju kao sredine, nego se određuje njihova pozicija, mesto u datoj seriji. One se nalaze, po pravilu, na onom mestu koje zauzima bilo dominantan (najznačajniji), bilo centralni (središnji) polođaj u seriji. Pre nego što se pristupi iznalaženju srednjih brojeva brojeva, potrebno je da datu seriju sredimo po veličini modaliteta. U grupu srednjih brojeva spadaju: modus (Mo) i medijana (Me): 3.1.4. MODUS (Mo) To je onaj podatak (modalitet) koji se najčešće javlja tj. koji ima najveću frekvenciju. To je, dakle podatak koji zauzima dominantan položaj i koji na poligonu frekvencija ima najveću ordinatu. Zbog toga se modus često naziva još i dominanta ili normala. To je na primer, najčešća cena, najčešća visina,itd.Zbog toga kažemo da se modus kao srednja vrednost koristi najčešće kada se radi o proceni stanja ili karakteristika neke pojave. U praksi se može tražiti modus kod neintervalnih serija ili kod intervalnih serija. Izračunavanje modusa kod neintervalnih serija PRIMER1:Iz sledeće serije podataka odrediti Mo. 14,19,19,19,24,27,32. Broj koji se najčešće pojavljuje je 19.Znači Mo =19. PRIMER2: Iz sledeće serije podataka odrediti modus.5, 7, 7, 7, 7, 9, 10, 15, 15, 15, 15, 19, 20. U ovom slučaju broj 7 i broj 15 se najčešće pojavljuje pa tako imamo dva modusa. Mo=7 i Mo=15

IZRAČUNAVANJE MODUSA KOD INTERVALNIH SERIJA Kada imamo intervalnu seriju, tada ćemo imati jasno određen broj intervala (razred,klasu) sa najvećom frekvencijom a vrednost modusa Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

34

naći će se u okviru tog intervala. Za izračunavanje modusa u ovakvom slučaju koristi se obrazac koji glasi: f 2 − f1

Mo= x + k • ( f − f ) + ( f − f ) 2 1 2 3 x – donja granica modalnog intervala K – veličina modalnog intervala f1 – frekvencija prethodnog intervala f2 – frekvencija modalnog intervala f3 – frekvencija narednog intervala PRIMER3: Dat je raspored za domaćinstva prema mesečnoj potrošnji jednog pehrambenog artikla Potrošnja u 4-6 6-8 8 - 10 10 – 12 12 - 14 14 – 16 kg. ( xi) Broj domaćinstava (fi)

8 Odrediti modus.

15

27

21

19

6

f −f

2 1 Mo= x + k • ( f − f ) + ( f − f ) 2 1 2 3 x=8 f1=15 k=2 f2=27 f3=21

27 − 15

12

Mo= 8 + 2 • ( 27 − 15) + ( 27 − 21) = 8 + 2 • 12 + 6 = 8 + 2 • 0,66 Mo= 9,333 Najčešća potrošnja prehrambenog proizvoda po domačinstvu je 9,333 kg. 3.1.5.

MEDIJANA (Me)

Medijana je takva poziciona srednja vrednost koja se u sriji nalazi na središnjoj poziciji ukupnog broja frkvencija (slučajeva). To je najveća vrednost modaliteta posmatranog obeležja u nekoj seriji, njena vrednost ne mora da se podudara sa veličinama (vrednostima) modaliteta koji su navedeni u seriji, nego ona predstavlja najvišu (maksimalnu) veličinu posmatranog obležja za prvih 50% svih frekvencija ili slučajeva. Na taj način medijana polovi ukupan broj frekvencija i izražava graničnu vrednost modaliteta obeležja za prvu polovinu serije. Određivanje i izračunavanje medijane vrši se u serijama koje su prethodno sređene po veličini modaliteta, zato se vrednost medijane uvek nalazi oko sredine raspona intervala varijacije između minimalne i maksimalne vrednosti modaliteta. Medijana se koristi za analizu statističkih serija po

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

35

segmentima (delovima) a psebno u komparativnoj analizi istorodnih pojava. Medijana se izračunava iz prostih serija ali se to najčešče vrši kod serija distribucije frekvencija. IZRAČUNAVANJE MEDIJANE KOD PROSTIH SERIJA Kod prostih serija,kada se svaki modalitet javlja samo po jedanput, medijana će zauzimati mestosredišnjeg modaliteta, odnosno medijana će biti upravo onaj modalitet koji se nalazi na središnjoj poziciji. Kod svih prostih serija mesto medijane se nalazi po obascu: n +1 2

Mora se voditi računa da li to prosta serija ima neparan ili paran broj podataka pomoću ovog obrasca neposredno nalazimo mesto i vrednost medijane. PRIMER1: Izračunaj medijanu iz sledeće serije: 15, 25, 27, 31,36. Serija ima n=5 mesto Me =

n +1 5 +1 6 = = =3 n 2 2

to znači da se Me nalazi na trećem mestu u seriji Me = 27 PRIMER2: Izračunaj medijanu za sledeće serije: 14, 26, 28, 33, 37, 38. Serija ima paran broj podataka (n=6) pa se medijana nalazi između dva sedišnja podatka. Mesto Me =

n +1 6 +1 7 = = = 3,5 2 2 2

Medijana se nalzi na sredini između trećeg i četvrtog mesta u seriji. Prostom aritmetičkom sredinom izračunavamo medijanu Me=

28 + 33 61 = 2 2

Me= 30,5

IZRAČUNAVANJE MEDIJANE DIISTRIBUCIJE FREKVENCIJA

KOD

SERIJA

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

36

Za iznalaženje mesta (pozicije) medijane u serij distribucije frekvencije, broj članova serije označava se sa ∑fi, pa se pozicija n

medijane iznalazi po obrascu:

∑f i =1

i

+1

2

Da bi se lakše odrdila pozicija medijane prema ovom obrascu, koristimo kolonu rastuće kumulante pazeći pritom da serija ima paran ili neparan broj podataka. PRIMER3: Iz sledeće serije koja pokazuje broj članova domaćinstva i broj domaćinstva izračunaj medijanu. Brojčlanova domaćinstva Broj domaćinstva fi (xi)

1 2 3 4 6 8 ∑

10 16 24 34 29 13 ∑fi=126 n

Mesto Me= ∑ i =1

Kumulanta

10 26 50 84 113 126 /

f i + 1 126 + 1 = 2 2

Mesto Me =63,5 Me=4 U proseku jedno domaćinstvo ima četiri člana. Za iznalaženje ( izračunavanje) medijane iz intervalnih serija, bez obzira da li su ti intervali ili razredi jednaki ili ne, vrednost medijane nalazi se negde između donje i gornje granice središnjeg(medijalnog) intervala, pa tu vrednost treba precizno i tačno izračunati. U zavisnosti od toga da li serija ima paran il neparan broj podataka primeniće se odgovarajući obrazac i pritom će se koristiti rastuća kumulanta. IZRAĆUNAVANJE Me IZ INTERVALNIH SERIJA BROJEM PODATAKA Izračunavanje Me iz intervalnih serija koje imaju neparan broj podataka (∑fi neparan broj) po obrascu:   x 2 − x1   ∑ f i  •  − W1     W2 − W1   2 

Me= x1 + 

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

37

x1 – donja granica medijalnog inetrvala x2 – gornja granica medijalnog intervala W2 – zbirna frekvencija medijalnog intervala(iz kumulante) W1 – zbirna frekvencija prethodnog intervala PRIMER4: Prinos raži na 69 parcela iznosio je: Prinos u t (xi)

Broj parcela (fi)

Kumulanta

3 – 4,1 8 4,1 – 5,2 12 5,2 – 6,3 16 6,3 – 7,4 22 7,4 – 8,5 11 ∑ ∑fi=69 Medijanski interval odredićemo kao poluzbir frekvencija:

∑f 2

i

=

8 20 36 58 69 /

69 = 34,5 2

a to odgovara intervalu (5,2 – 6,3) x1=5,2 ;x2=6,3; W1=20 ; W2=36  6,3 − 5,2   69   •  − 20   36 − 20   2  1,1 Me= 5,2 + • ( 34,5 − 20) 16 Me=5,2+0,0687•14,5 Me=5,2+0,996

Me = 5,2 + 

Me=6,196 IZRAČUNAVANJE Me IZ INTERVALNIH SERIJA SA PARNIM BROJEM PODATAKA Za izračunavanje Me iz intervalnih serija koje imaju paran broj podataka (∑fi paran broj) primeniće se nešto izmenjen osnovni obrazac koji glasi:   x 2 − x1   ∑ f i  •  − W1     W2 − W1   2 

Me= x1 + 

PRIMER5: U jednoj banci u jednom mesecu 50 radnika primilo je sledeće zarade: Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

Zarade Xi

38

Broj radnika fi

Kumulanta

51 – 52 20 52 – 53 15 53 – 54 7 54 – 55 5 55 – 56 3 ∑ ∑fi=50 Medijanski interval određuje se iz:

∑f

i

2

+1

=

20 35 42 47 50 /

50 + 1 51 = = 25,5 2 2

a to odgovara intervalu (52 – 53) elementi su: x1=52; x2=53; W1=20; W2=35; ∑fi+1=51 55 − 52  51  •  − 20  35 − 20  2  1 Me= 52 + • ( 25,5 − 20) 15 Me=52+0,066•5,5 Me=52+0,363

Me= 52 +

Me=52,363 POLOŽAJ X , Me i Mo U SERIJI (GRAFIČKI) Da bismo jasnije prikazali položaj i mesto nekih srednjih vrednosti u seriji grafički, uzećemo kao primer tri osnovan oblika serije distribucije frekvencije prema simetričnosti njihovih podataka i to: 1. Kod normalne distribucije podudaraju se X , Me i Mo; tj. X =Me=Mo, što se grafički prikazuje kao zajednička ordinata. &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&str4 7 2. Kod serije distribucije sa levom asimetrijom &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&6666str 47 3. Kod serije distribucije sa desnom asimetrijom. &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& str 48 Kod ova dva poslednja primera vidimo da se pozicija Me i X u odnosu na Mo uvek raspoređene suprotno od smera asimetrije.Ovo se može grafički prikazati samo u slučaju kada postoji samo jedan Mo u seriji.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

39

MERE VARIJABILITETA Za merenje i izražavanje varijacije obeležja kao specifičnog oblika kretanja, koriste se posebne statističke jedinice. Te jedinice su specifične ne samo po svojoj nameni nego i po svojim osobinama. Najznačajnija karakteristika je da su one promenljive, varijabilne veličine i da izražavaju mere varijacije ma kako obeležje bilo izraženo. Mere varijabiliteta obeležja pojava vezane su za pojam i primenu srednjih vrednosti, uglavnom za aritmetičku sredinu. Kada govorimo o variajbilitetu obeležja i merama za izražavanje tog varijabiliteta onda tu podrazumevamo posmatranje varijabiliteta u odnosu na jednu određenu veličinu,reprezentativnu veličinu, tj. srednju vrednost koja izražava centralnu tendenciju pojave,odnosno nekog stanja u toj pojavi. Unutrašnji raspored podataka u seriji može se izražavati kroz njihova mežusobna odstojanja odnosno kroz sličnost, jednakost ili različitost njihovih međusobih odstojanja, ali isto tako kroz njihova odstojanja od srednje vrednosti. Ukupnost ovih karakteristika naziva se varijabilitet što predstavlja važnu i značajnu osobinu po kojoj vršimo analizu pojedinih serija ili njihova upoređivanja. U mere varijabiliteta spadaju sledeći parametri: - Razmak varijacije - Kvartilna devijacija - Varijansa i standardna devijacija - Koeficijen varijacije - Srednja devijacija 3.2.1. RAZMAK VARIJACIJE Razmak varijacije je najjednostavnija mera varijabiliteta. To je razmak između najveće i najmanje vrednosti obeležja X na posmatranom statističkom skupu. Ako označimo sa Xmax najveću vrednost obeležja X, a sa Xmin njegovu najmanju vrednost na statističkom skupu. Razmak varijacije jednak je: R=Xmax – Xmin sa R označili smo razmak varijacije. Da bi tačno odredili razmak varijacije moramo pored raspodele znati najmanju vrednost obeležja X u prvom intervalu i najveću vrednost obeležja u poslednjem intervalu. Ako ove vrednosti nisu poznate ne možemo ni odrediti razmak varijacije.Razmak variajcije je pogodna mera varijabiliteta za ona obeležja kod kojih se najveća i najmanja vrednost ne razlikuju mnogo od ostalih vrednosti obeležja X.

Prof. dr Mirjana Šekarić

Statistika

Kvantitativne metode

40

Najveću primenu razmak varijacije ima u kontroli kvaliteta u industrijskoj proizvodnji. 3.2.2. KVARTILNA DEVIJACIJA Ako se serija podataka koja je rangirana po veličini podeli u četiri jednaka dela, vrednost obeležja,koje ih dele mazivaju se kvartilima: prvi kvartil Q1, drugi Q2 (ili medijana) i treći Q3. Obrasci za kvartile su:

∑ fi −

Q1= x1 + 4

f

∑f

1

•i

Q1

x1 – donja granica kvartilnog razreda

∑ fi 4

– mesto kvartila iz kumulanta

∑f1 – frekvencija iznad mesta kvatila iz kumulante f Q – frekvencija kvartilnog razreda i – veličina kvartilnog razreda 1

3∑ fi

Q3 = x1 +

4

f

− ∑ fi

•i

Q3

Prvi kvartil (Q1) je vrednost obeležja od koje 25% elemenata skupa uređenih po veličini ima manju ili jednaku vrednost tog obeležja. Treći kvartil (Q3) se definiše kao ona vrednost obeležja od koje 75% elemenata skupa ima manju ili jednaku vrednost. Donji (Q1) i gornji (Q3) kvartil dele ceo statistički skup na tri dela. Jedna četvrtina elemenata su oni elementi kod kojih je XX0,75 a preostalih 50% elemenata ima vrednost obeležja X koja je X 0,25
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF