Racunarski program za statisticku obradu podataka:
GEOSTAT

Autor:
Mladen Radakovic (1975)

Uradjen je racunarski program za statisticku obradu podataka. Program je prvenstveno osmisljen za koriscenje u geografiji, sto ne iskljucuje njegovu upotrebu i u drugim slucajevima. Matematicki modeli korisceni u ovom programu su u najvecem broju statisticki univerzalni, pa se iz tog razloga mogu primenjivati i u srodnim naukama. Podaci nad kojima se vrse izracunavanja i provere se cuvaju u lokalnoj bazi, a Geostat omogucuje brz pristup i obradu, graficki prikaz i stampanje.

Program je osmisljen tako da obuhvata procedure od unosenja i obrade do stampanja podataka. Na osnovu definisanih potreba obrade jednog niza podataka, od njegovog unosa do konacnog rezultata, glavni meni Geostat-a obuhvata cetiri osnovne grupe:

Svaka od pomenutih opcija ima ulogu da obradu podataka matematicki i metodoloski podrzi od pocetka, pa do kraja njegove obrade, kako bi krajnji rezultat bio primenljiv u naucno-istrazivackom radu. Geostat je modularno uradjen program, tako da svaka od ovih opcija ima mogucnost da radi zasebno, ali su zbog lakseg koriscenja programa medjusobno povezane.

Baza podataka u okviru svakog kreiranog fajla od strane korisnika, cuva vrednosti u obliku teksta, tako da se podaci mogu ispravljati i unositi i iz drugih programa, a ne samo pomocu editora Geostat-a. Ovaj nacin zapisa podataka omogucava i njihovo jednostavno ubacivanje i u druge programe slicnog tipa, kao sto su Excel, DBase, StatGraph,... Ovaj deo programa je zaduzen za unos novih podataka, korekciju vec unetih, testiranje homogenosti podataka, redukovanje nizova kojima fale neki podaci, za racunanje i crtanje verovatnoce, kao i za neke jednostavnije operacije sa fajlovima. Program je pisan tako da korisniku ne dozvoljava greske u radu. Korisnik ne moze u bazu uneti besmislen podatak, jer mu to program ne dozvoljava, tako da je najlakse unositi podatke u bazu iz Geostat-ovog editora (slika 1).

Program ne dozvoljava koriscenje odredjenih statistickih operacija ako prethodno nije izvrsena kontrola tacnosti podataka i provera homogenosti izvornog niza podataka. Homogenost se ispituje Studentovim testom. Ceo proces obrade podataka je osmisljen tako da je pre svakog proracuna neophodno da podaci budu propusteni kroz testove homogenosti i verovatnoce bar jedanput. Propustanjem podataka kroz pomenute testove Geostat cuva informacije o izvornim podacima koje su mu neophodne za njihovu dalju, slozeniju obradu. Ovim sistemom se postize to da pred svaku obradu podataka, program vec ima informacije o homogenosti, raspodeli (slika2) i kompletnosti niza koji obradjuje, pa u zavisnosti od njih primenjuje odredjene matematicke modele. Ovi rezultati se cuvaju u opisnom fajlu, koji pored vec pomenutih parametara, u sebi sadrzi i tip podataka (godisnji, mesecni, dnevni ili nehronoloski), datum od kojeg podaci pocinju (ako su hronoloski), kao i kratak opis fajla koji korisnik unosi, kako bi kasnije lakse raspoznao fajl koji trazi.

Baza podataka omogucuje i neke jednostavnije operacije sa fajlovima, kao i mogucnost izmene teksta u opisnom fajlu. Ova opcija omogucuje korisniku dupliranje, preimenovanje i brisanje fajlova sa podacima, tako da korisniku nije potrebno izlazenje u DOS, jer najcesce koriscene komande Geostat podrzava.

Analiza vremenskih serija se moze vrsiti samo ukoliko za niz koji zelimo da testiramo postoji opisni fajl, sto je dokaz da su podaci validni za obradu. Ukoliko ne postoji opisni fajl, dati niz podataka moramo provuci kroz bazu podataka, kako bi ga Geostat napravio automatski. Opcija za analizu vremenskih serija omogucava odredjivanje trend i ciklicne komponente.

Program racuna trend komponentu provlaceci matematicke modele linearnog trenda, kvadratnog trenda, polinoma i hiperbole do desetog stepena, kao i eksponencijalnog trenda. Pri ovim proracunima korisnik dobija grafik, formulu koriscene funkcije, stepen odstupanja teorijskih vrednosti od empirijskih kao i mogucnost da odstrani trend komponentu. Posto se trend komponenta ukloni iz izvornih podataka, oni su spremni za dalju statisticku obradu.

Ciklicna komponenta se moze izdvojiti pomocu pokretnog proseka (slika 3), kumulante standardizovanih vrednosti, eksponencijalnog izravnanja, polinoma od treceg do desetog stepena i pomocu autokorelacije (slika 4). Za vizuelno utvrdjivanje jacine i oblika veze izvornog i pokretnog niza na odredjenom koraku autokorelacije, koristi se opcija za graficki prikaz rasturanja empirijskih tacaka.

Korelaciona analiza se zasniva na izracunavanju oblika i jacine funkcionalne veze izmedju dve pojave. Po unosenju niza podataka koji ce biti na X-osi, odnosno na Y-osi, korisniku se daje mogucnost da ispita uzoracki koeficijent korelacije ili da kroz dobijeni grafik provuce linearnu funkciju, parabolu, polinom ili hiperbolu do desetog stepena (slika 5). Automatski se proracunava greska, kao i koeficijent korelacije za dati teorijski matematicki model. Ova opcija nam omogucava da matematicki izracunamo zavisnost izmedju dve pojave i da utvrdimo da li je taj stepen zavisnosti zanemarljiv ili ne.

Deskriptivna statistika je deo Geostat-a koji za zadati niz podataka izracunava najcesce koriscene statisticke pokazatelje, kao sto su: Srednja vrednost niza, Standardna greska srednje vrednosti, Varijansa, Standardna devijacija, Najbolji proracun standardne devijacije, Stdandardna greska standardne devijacije, Asimetricnost, Kurtozis, Medijan, Maksimum, Minimum, Opseg, Gornji kvartil, Donji kvartil i Inter-kvartilni opseg. U okviru Deskriptivne statistike postoji mogucnost da se neke od ovih vrednosti direktno ucrtaju na grafik, tako da je provera rezultata olaksana (slika 6). Mogucnost promene nivoa poverenja nam na grafiku omogucuje vecu preglednost podataka.