VILNIAUS PEDAGOGINIS UNIVERSITETAS MATEMATIKOS IR INFORMATIKOS FAKULTETAS INFORMATIKOS
- Slides: 20
VILNIAUS PEDAGOGINIS UNIVERSITETAS MATEMATIKOS IR INFORMATIKOS FAKULTETAS INFORMATIKOS KATEDRA STATISTINIS DUOMENŲ APDOROJIMAS ATVIROJO KODO PROGRAMOMIS STATISTICAL DATA PROCESSING USING OPEN SOURCE SOFTWARE Darbo vadovas: Dr. doc. G. Leonavičius Darbą pristato: magistrantė Kristina Buinovskaja
Darbo tikslai: l Atvirojo kodo matematinės statistikos programos R ištyrimas, aprašymas ir analizė bei jos palyginimas su komercine statistinės analizės sistema SAS. l R paketo eksperimentinis tyrimas - UAB „ Čilija “ statistinė įmonės veiklos analizė, šios įmonės rodiklių kitimo tyrimas ir veiklos prognozės.
Darbo uždaviniai l Išanalizuoti R programos galimybes. l Palyginti ją su SAS programa. l Atlikti įmonės UAB „Čilija“ ekonominę analizę programinio paketo R pagalba.
R raida l 1990 m. , Bell laboratorija, S l S – Plus l 1997 m. , R – laisvai platinamas S-Plus analogas: http: //www. r-project. org
R aplinka ir galimybės
Apie SAS l Paketas SAS siūlo nemažą metodų sąrašą, pradedant paprasčiausiais statistinės analizės metodais ir baigiant daugiamačiu informacijos apdorojimu. l SAS pakete yra integruotos informacijos laikymo ir apdorojimo priemonės, vartotojo taikymų rengimo ir derinimo priemonės. SAS yra gana galingas ir sudėtingas programinis paketas. l Bet paketas eksploatacija. yra brangus, brangi ir jo
Skirtumai tarp R ir SAS l R yra plečiamas; l Vartotojams yra nesudėtinga rašyti savo R funkcijas ; l SAS grafikai reikalauja daug programavimo, yra neinteraktyvūs, nelankstūs ir nevaizdingi; l SAS veiksmingesnis negu R analizuojant labai dideles duomenų bazes, grupuojant duomenis.
Duomenų įrašymas
R grafikos ypatybės
Statistikos funkcijų palyginimas tarp R ir SAS proc means data=kryst. duom n mean /* vidurkis*/ min /*minimali reikšmė*/ var max ; /*maksimali reikšmė*/ by tipas; /*nurodom su kokia grupe dirbti*/ var d 1 d 2 d 3 d 4 d 5 d 6 d 7 d 8 ; /*nurodom kintamuosius, su kuriais procedūra turi atlikti darba*/ output out=kryst. statistik mean=d 1 d 2 d 3 d 4 d 5 d 6 d 7 d 8 ; run;
Tyrimai l Darbuotojų analizė l Lankytojų analizė l Pajamų analizė l Bendrovės apyvartos prognozė l Bendrovės darbuotojų skaičiaus prognozė
R dispersinės analizės taikymas Norėdama R paketo pagalba patvirtinti teiginį, kad penktadienio ir šeštadienio pajamos visada didesnės už kitų savaitės dienų pajamas, kurios maždaug būna vienodos, sudariau hipotezę:
Ir nubrėžiau stačiakampes diagramas.
R regresinės analizės taikymas
Bendrovės apyvartos prognozė
Bendrovės darbuotojų skaičiaus prognozė
IŠVADOS l R yra sudėtinis programų paketas, skirtas duomenų valdymui, skaičiavimams bei grafiniam atvaizdavimui. l Sistema galima spręsti visus pagrindinius statistikos uždavinius. l R rasta ir trūkumų. Pavyzdžiui, labai nepatogu su rodyklėmis „vaikščioti“ po eilutę, nes negalima „atsistoti“ norimoje vietoje su pele. Paketas SAS tokio trūkumo neturi.
l Kadangi R savo galimybėmis mažai skiriasi nuo komercinio paketo SAS, todėl R galėtų pakeisti SAS ir tapti vyresniųjų kursų studentų, magistrantų, doktorantų ir mokslo darbuotojų įrankiu jų moksliniuose tyrimuose. l Programos R pagalba išanalizavus UAB „Čilija“ veiklą, buvo nustatyta, kad šiuo metu bendrovės rinkos dalis siekia 38% ir aplenkia daugelį konkurentų. l Atlikus bendrovės veiklos prognozę, buvo nustatyta, kad jos apyvarta iki 2015 m. turėtų išaugti maždaug iki 300 mln. Lt. , o darbuotojų skaičius iki 3 tūkst.
AČIŪ UŽ DĖMESĮ
- Kauno technologijos universitetas
- Informatikos tevas tiuringas
- Romerio universitetas
- Vilniaus antano vienuolio progimnazija
- Vilniaus oro uostas
- Maironio progimnazija vilnius
- Skaitļa attālums līdz nullei
- Atnaujintos matematikos bendrosios programos
- Nec vertinimo lentele
- Matematikos veiksmu eiliskumas
- Vbe taškai į balus
- Vienasaliu kampu suma
- Dalinys daliklis dalmuo
- Greitosios daugybos formule
- Egzamino tasku konvertavimas i balus