Mis on R-pakett: kasutusjuhend. Statistiline arvutuskeskkond R: õppetöös kasutamise kogemus Keelepaketid r

Programmeerimine R. Tase 1. Põhitõed

R-keel on maailma populaarseim statistilise andmeanalüüsi tööriist. See sisaldab laias valikus võimalusi andmete analüüsimiseks, visualiseerimiseks ning dokumentide ja veebirakenduste loomiseks. Kas soovite seda võimsat keelt kogenud mentori juhendamisel omandada? Kutsume teid kursusele "R-keeles programmeerimine. Tase 1. Algteadmised".

See kursus on mõeldud laiale hulgale spetsialistidele, kes peavad otsima mustreid suures mahus andmehulgast, visualiseerima neid ja tegema statistiliselt õigeid järeldusi: sotsioloogid, kliiniliste uuringute juhid/farmakoloogid, teadlased (astronoomia, füüsika, bioloogia, geneetika, meditsiin, jne), IT-analüütikud, ärianalüütikud, finantsanalüütikud, turundajad. Kursus meeldib ka spetsialistidele, kes ei ole funktsionaalsusega (või tasudega) rahul / .

Tundides omandad baasoskused andmete analüüsimisel ja keskkonnas visualiseerimisel R. Suurem osa ajast kulub ära praktilisi ülesandeid ja reaalsete andmekogumitega töötamine. Õpid kõiki uusi tööriistu andmetega töötamiseks ja õpid, kuidas neid oma töös rakendada.

Pärast kursust väljastatakse keskuse täiendõppe tunnistus.

Räägime veidi programmeerimiskeelest nimega R. Hiljuti Võite lugeda meie ajaveebi artikleid nendest valdkondadest, kus statistika ja graafikutega töötamiseks peab teil lihtsalt olema võimas keel. Ja R on vaid üks neist. Programmeerimismaailma uustulnajal on seda üsna raske uskuda, kuid täna on R juba populaarsem kui SQL, seda kasutatakse aktiivselt kommertsorganisatsioonides, teaduses ja ülikoolides.

Süvenemata reeglitesse, süntaksisse ja konkreetsed valdkonnad rakendusi, vaatame lihtsalt olulisi raamatuid ja ressursse, mis aitavad teil R nullist õppida.

Mis on R-keel, milleks seda vaja on ja kuidas seda targalt kasutada, saab õppida imekaunilt Ruslan Kuptsovilt, mida ta veidi vähem kui aasta tagasi GeekWeek-2015 raames juhatas.

Raamatud

Nüüd, kui peas on kindel kord, võib hakata kirjandust lugema, õnneks on seda enam kui küll. Alustame kodumaistest autoritest:


Interneti-ressursid

Iga inimene, kes soovib õppida mis tahes programmeerimiskeelt, peab teadmiste otsimiseks külastama kahte ressurssi: selle arendajate ametlikku veebisaiti ja suurimat võrgukogukond. Noh. Ärgem tehkem R jaoks erandit:

Aga jällegi läbi imbunud murest nende pärast, kes inglise keel Mul pole veel olnud aega seda õppida, aga ma tõesti tahan õppida R-i, mainigem mõnda venekeelset ressurssi:

Seniks täiendame pilti väikese ingliskeelsete, kuid mitte vähem informatiivsete saitide loendiga:

CRAN on tegelikult koht, kust saab arvutisse laadida R arenduskeskkonda Lisaks juhendeid, näiteid ja muud kasulikku lugemist;

Quick-R - lühidalt ja selgelt statistikast, selle töötlemise meetoditest ja R-keelest;

Burns-Stat - R-i ja selle eelkäija S kohta tohutu hulga näidetega;

R for Data Science on järjekordne Garrett Grolemundi raamat, mis on tõlgitud veebiõpiku vormingusse;

Awesome R – valik ametlikult veebisaidilt parimat koodi, mis on postitatud meie armastatud GitHubi;

Mran - R-keel Microsoftilt;

Tutorial R on veel üks ressurss, mis sisaldab organiseeritud teavet ametlikult veebisaidilt.

Peate selle terminali sisestama.

R-i ilu on järgmine:

  1. See programm on tasuta (levitatakse GPL-i litsentsi alusel),
  2. Selle programmi jaoks on kirjutatud palju pakette paljude probleemide lahendamiseks. Kõik need on ka tasuta.
  3. Programm on väga paindlik: suvaliste vektorite ja maatriksite suurusi saab kasutaja soovil muuta, andmetel puudub jäik struktuur. See omadus osutub äärmiselt kasulikuks prognoosimise puhul, kui uurijal on vaja anda prognoos suvalise perioodi kohta.

Viimane omadus on eriti asjakohane, kuna teised statistikapaketid (nagu SPSS, Eviews, Stata) eeldavad, et oleme huvitatud ainult kindla struktuuriga andmete analüüsimisest (näiteks peavad kõik tööfailis olevad andmed olema sama perioodilisusega). sama alguskuupäeva ja lõpuga).

R ei ole siiski kõige sõbralikum programm. Sellega töötades unustage hiir - peaaegu kõik olulisemad toimingud selles tehakse selle abil käsurida. Kuid selleks, et muuta elu veidi lihtsamaks ja programm ise veidi tervitatavamaks, on olemas esiosa programm ( esiots) nimega RStudio. Saate selle alla laadida siit. See installitakse pärast seda, kui R ise on juba installitud, RStudiol on palju mugavaid tööriistu ja kena liides, kuid analüüs ja prognoosimine toimub selles endiselt käsurea abil.

Proovime heita pilgu sellele imelisele programmile.

RStudioga tutvumine

RStudio liides näeb välja selline järgmisel viisil:

RStudio paremas ülanurgas on näidatud projekti nimi (mis meil praegu on "Puudub" - see tähendab, et see puudub). Kui klõpsame sellel pealdisel ja valime "Uus projekt" (uus projekt), palutakse meil projekt luua. Põhiliste prognooside jaoks valige lihtsalt "Uus kataloog" ( uus kaust projekti jaoks), "Tühi projekt" (tühi projekt) ja seejärel sisestage projekti nimi ja valige kataloog, kuhu see salvestada. Kasutage oma fantaasiat ja proovige ise nimi välja mõelda :).

Ühe projektiga töötades pääsete alati ligi sinna salvestatud andmetele, käskudele ja skriptidele.

RStudio akna vasakus servas on konsool. Siia sisestame erinevad käsud. Kirjutame näiteks järgmise:

x< - rnorm (100 , 0 , 1 )

See käsk genereerib 100 juhuslikku muutujat normaaljaotusest null ootuse ja ühikulise dispersiooniga, seejärel loob vektori nimega "x" ja kirjutab sellesse saadud 100 väärtust. Sümbol "<-» эквивалентен символу «=» и показывает какое значение присвоить нашей переменной, стоящей слева. Иногда вместо него удобней использовать символ «->”, kuigi meie muutuja peaks sel juhul olema paremal. Näiteks loob järgmine kood objekti "y", mis on objektiga "x" absoluutselt identne:

x -> y

Need vektorid ilmuvad nüüd ekraani paremas ülanurgas vahekaardi all, mille pealkirjaks on "Keskkond":

Muudatused vahekaardil "Keskkond".

Selles ekraani osas kuvatakse kõik objektid, mille me seansi ajal salvestame. Näiteks kui loome sellise maatriksi:

\(A = \begin(pmaatriks) 1 & 1 \\ 0 & 1 \end(pmaatriks) \)

selle käsuga:

A< - matrix (c (1 , 0 , 1 , 1 ) , 2 , 2 )

siis kuvatakse see vahekaardil "Keskkond":

Iga funktsioon, mida me kasutame, nõuab teatud parameetrite väärtuste määramist. Funktsioonis maatriks() Siin on järgmised valikud.

  • andmed – vektor andmetega, mis tuleks maatriksisse kirjutada,
  • nrow – ridade arv maatriksis,
  • ncol – veergude arv maatriksis,
  • byrow - loogiline parameeter. Kui “TRUE” (tõene), siis täidetakse maatriks ridade kaupa (vasakult paremale, ridade kaupa). Vaikimisi on selle parameetri väärtuseks FALSE.
  • dimnames – ridade ja veergude nimedega leht.

Mõnel neist parameetritest on vaikeväärtused (näiteks byrow = VÄÄR), samas kui teised võidakse välja jätta (näiteks hämarad nimed).

Üks "R" nippe on see, et mis tahes funktsioon (näiteks meie maatriks()) saab lahendada, määrates väärtused otse:

Teine võimalus on klõpsata vahekaardil "Keskkond" objekti nimel.

Maatriks

kus maatriks on meid huvitava funktsiooni nimi. Sel juhul avab RStudio spetsiaalselt teie jaoks mõeldud paneeli „Abi” koos kirjeldusega:

Funktsiooni kohta saate abi ka siis, kui sisestate vahekaardil "Abi" otsinguaknasse (objektiiviga ikoon) funktsiooni nime.

Kui te ei mäleta täpselt, kuidas funktsiooni nime kirjutada või milliseid parameetreid selles kasutatakse, alustage lihtsalt selle nime kirjutamist konsooli ja vajutage nuppu "Tab":

Lisaks kõigele sellele saab RStudios skripte kirjutada. Teil võib neid vaja minna, kui peate kirjutama programmi või kutsuma funktsioonide jada. Skriptid luuakse vasakus ülanurgas plussmärgiga nupuga (peate rippmenüüst valima "R Script"). Pärast seda avanevas aknas saate kirjutada mis tahes funktsioone ja kommentaare. Näiteks kui tahame joonistada joongraafiku üle seeria x, saame seda teha järgmiselt:

joonis (x)

read (x)

Esimene funktsioon koostab lihtsa hajuvusdiagrammi ja teine ​​funktsioon lisab punkte järjestikku ühendavate punktide peale jooned. Kui valite need kaks käsku ja vajutate klahvikombinatsiooni Ctrl+Enter, käivitatakse need, mille tulemusena avab RStudio paremas alanurgas vahekaardi "Plot" ja kuvab selles joonistatud graafiku.

Kui meil on tulevikus siiski vaja kõiki sisestatud käske, siis saab selle skripti salvestada (diskett vasakus ülanurgas).

Kui teil on vaja viidata käsule, mille olete kunagi varem sisestanud, on ekraani paremas ülanurgas vahekaart Ajalugu. Selles saate leida ja valida mis tahes teid huvitava käsu ning topeltklõpsata selle konsooli kleepimiseks. Konsoolis endas pääsete eelmistele käskudele juurde, kasutades klaviatuuri üles- ja allanuppe. Klahvikombinatsioon Ctrl+Up võimaldab kuvada konsooli kõigi hiljutiste käskude loendit.

Üldiselt on RStudiol palju erinevaid kasulikud kombinatsioonid klahvid, mis muudavad programmiga töötamise palju lihtsamaks. Nende kohta saate rohkem lugeda.

Nagu ma varem mainisin, on R jaoks palju pakette. Kõik need asuvad CRAN-serveris ja nende installimiseks peate teadma selle nime. Pakettide installimine ja värskendamine toimub vahekaardi "Paketid" kaudu. Sellele minnes ja nupul "Install" klõpsates näeme midagi sellist, nagu järgmine menüü:

Sisestame avanevas aknas: prognoos on Rob J. Hyndmani kirjutatud pakett, mis sisaldab hunnikut meie jaoks kasulikke funktsioone. Klõpsake nuppu "Install", mille järel installitakse "prognoosi" pakett.

Teise võimalusena saame installida mis tahes paketi, teades selle nime, kasutades konsooli käsku:

installida. paketid ("sile")

eeldusel, et see on loomulikult CRAN-i hoidlas. sile on pakett, milles arendan ja hooldan funktsioone.

Mõned pakendid on saadaval ainult lähtekoodid sellistel saitidel nagu github.com ja nõuavad nende esmalt kompileerimist. Windowsi all pakettide koostamiseks võib vaja minna programmi Rtools.

Mis tahes installitud paketi kasutamiseks peate selle lubama. Selleks peate selle loendist üles leidma ja selle linnukesega märkima või kasutama konsoolis käsku:

raamatukogu (prognoos)

Windowsis võib ilmneda üks ebameeldiv probleem: mõnda paketti saab hõlpsasti alla laadida ja kokku panna, kuid neid ei installita mingil viisil. R kirjutab sel juhul midagi sellist: "Hoiatus: ajutist paigaldust ei saa teisaldada...". Kõik, mida peate sel juhul tegema, on lisada kaust R-ga viirusetõrje erandite hulka (või pakettide installimise ajal see välja lülitada).

Pärast paketi allalaadimist on kõik selles sisalduvad funktsioonid meile kättesaadavad. Näiteks funktsioon tsdisplay(), mida saab kasutada järgmiselt:

tsdisplay(x)

Ta koostab meile kolm graafikut, mida käsitleme peatükis "Forecaster Toolkit".

Peale pakendi prognoos Kasutan paketti päris tihti erinevate näidete jaoks Mcomp. See sisaldab andmeseeriaid M-Competitioni andmebaasist. Seetõttu soovitan teil ka selle installida.

Väga sageli vajame mitte ainult andmekogumeid, vaid ka ts-klassi andmeid (aegrida). Mis tahes muutujast aegrea loomiseks peate käivitama järgmise käsu:

x< - ts (x , start = c (1984 , 1 ) , frequency = 12 )

Siin on parameeter alustada võimaldab määrata kuupäeva, millest meie aegrida algab, ja sagedus määrake andmesagedus. Meie näites olev number 12 näitab, et tegemist on igakuiste andmetega. Selle käsu täitmise tulemusena teisendame oma vektori “x” igakuiste andmete aegreaks alates 1984. aasta jaanuarist.

Statistiline analüüs on teadusliku uurimistöö lahutamatu osa. Kvaliteetne andmetöötlus suurendab võimalusi avaldada artikkel mainekas ajakirjas ja viia teadustöö rahvusvahelisele tasemele. On palju programme, mis suudavad pakkuda kvaliteetset analüüsi, kuid enamik neist on tasulised ja sageli maksab litsents mitusada dollarit või rohkem. Kuid täna räägime statistikakeskkonnast, mille eest te ei pea maksma ning mille usaldusväärsus ja populaarsus konkureerivad parima kommertsstatistikaga. paketid: tutvustame teile R!

Mis on R?

Enne selge määratluse andmist tuleb märkida, et R on midagi enamat kui lihtsalt programm: see on raamistik, keel ja isegi liikumine! Vaatame R-d erinevate nurkade alt.

R on arvutuskeskkond, mille on välja töötanud andmeteadlased, matemaatiline modelleerimine ja graafikaga töötamine. R-i saab kasutada lihtsa kalkulaatorina, saab teha lihtsaid statistilisi analüüse (näiteks ANOVA või regressioonanalüüs) ja keerukamaid aeganõudvaid arvutusi, testida hüpoteese, koostada vektorgraafikuid ja kaarte. See ei ole täielik loetelu sellest, mida selles keskkonnas teha saab. Väärib märkimist, et seda levitatakse tasuta ja seda saab installida nii Windowsi kui ka OS UNIX klass (Linux ja MacOS X). Teisisõnu, R on tasuta ja platvormideülene.

R on programmeerimiskeel, tänu millele saate kirjutada oma programme ( skriptid) kasutades , samuti kasutada ja luua spetsiaalseid laiendusi ( paketid). Pakett on failide komplekt taustainfo ja näiteid, mis on koondatud ühte arhiivi. mängivad olulist rolli, kuna neid kasutatakse R-il põhinevate lisalaiendustena. Iga pakett on tavaliselt pühendatud konkreetsele teemale, näiteks: paketti "ggplot2" kasutatakse kauni joonise loomiseks vektorgraafika spetsiifiline disain ja pakett "qtl" sobib ideaalselt geneetiliseks kaardistamiseks. R teegis on mitmeid selliseid pakette: Sel hetkelüle 7000! Kõiki neid on vigade suhtes kontrollitud ja need on avalikud.


R on kogukonna/liikumise jaoks.
Kuna R on tasuta ja avatud lähtekoodiga toode, siis selle arenduse, testimise ja silumisega ei tegele mitte eraldi firma palgatud personaliga, vaid kasutajad ise. Kahe aastakümne jooksul on arendajate ja entusiastide tuumikust moodustunud tohutu kogukond. Viimastel andmetel aitas R-i arendada ja edendada vabatahtlikkuse alusel ühel või teisel viisil üle 2 miljoni inimese, alates dokumentatsiooni tõlkimisest, koolituskursuste loomisest ja lõpetades uute rakenduste väljatöötamisega teadusele ja tööstusele. Internetis on tohutult palju foorumeid, kust leiate vastused enamikule R-ga seotud küsimustele.

Kuidas R-keskkond välja näeb?

R jaoks on palju "kestasid", mille välimus ja funktsionaalsus võivad olla väga erinevad. Kuid me vaatame lühidalt ainult kolme kõige populaarsemat valikut: Rgui, Rstudio ja R, mis käivitati Linuxi/UNIXi terminalis käsureana.


R-keel statistikaprogrammide maailmas

Hetkel on valikus kümneid kvaliteetseid statistikapakette, mille hulgas on selged liidrid SPSS, SAS ja MatLab. 2013. aastal sai aga vaatamata suurele konkurentsile kõige enam kasutatavaks R tarkvaratoode aastal statistilise analüüsi jaoks teaduslikud publikatsioonid(http://r4stats.com/articles/popularity/). Lisaks on R viimasel kümnendil muutunud üha populaarsemaks ärisektoris: hiiglaslikud ettevõtted nagu Google, Facebook, Ford ja New York Times kasutavad seda aktiivselt andmete kogumiseks, analüüsimiseks ja visualiseerimiseks (http://www.revolutionanalytics). .com/companies-using-r). R-keele kasvava populaarsuse põhjuste mõistmiseks pöörakem tähelepanu sellele ühiseid jooni ja erinevused teistest statistikatoodetest.

Üldiselt võib enamiku statistikatööriistu jagada kolme tüüpi:

  1. programmid koos graafiline liides , lähtudes põhimõttest “kliki siia, siia ja saad valmis tulemuse”;
  1. statistilised programmeerimiskeeled, mis nõuavad elementaarseid programmeerimisoskusi;
  1. "segatud", millel on ka graafiline liides ( GUI) ja võimalus luua skriptiprogramme (näiteks: SAS, STATA, Rcmdr).

GUI-ga programmide omadused

Graafilise liidesega programmid on tavakasutajale tuttavad ja kergesti õpitavad. Aga lahenduse pärast mittetriviaalsed ülesanded need ei sobi, kuna neil on piiratud hulk statistikat. meetodid ja nendesse pole võimalik oma algoritme kirjutada. Segatüüp ühendab endas GUI kesta mugavuse ja programmeerimiskeelte võimsuse. Siiski, millal üksikasjalik võrdlus Programmeerimiskeelte SAS ja STATA statistilised võimalused on madalamad kui R ja MatLab (statistikameetodite R, MatLab, STATA, SAS, SPSS võrdlus). Lisaks peate nende programmide litsentsimise eest maksma korraliku rahasumma ja ainus tasuta alternatiiv on Rcmdr: kest R jaoks koos GUI-ga (Rcommander).

R-i võrdlus MatLabi, Pythoni ja Julia programmeerimiskeeltega

Statistilistes arvutustes kasutatavate programmeerimiskeelte hulgas on juhtivad positsioonid R ja Matlab. Need on üksteisega sarnased, nagu ka välimus ja funktsionaalsuse osas; kuid neil on erinevad kasutajate lobid, mis määrab nende spetsiifilisuse. Ajalooliselt oli MatLab keskendunud insenerierialade rakendusteadustele, seega tugevused on matid. modelleerimine ja arvutused, lisaks on see palju kiirem kui R! Kuid kuna R töötati välja kitsa profiiliga keelena statistiline töötlemine andmed, seejärel paljud eksperimentaalsed stat. meetodid ilmusid ja kinnistusid selles. See asjaolu ja selle nullkulu on teinud R-st ideaalse platvormi uute alusteadustes kasutatavate pakettide arendamiseks ja kasutamiseks.

Teised "konkureerivad" keeled on Python ja Julia. Minu arvates sobib Python üldotstarbelise programmeerimiskeelena pigem andmete töötlemiseks ja info kogumiseks veebitehnoloogiate abil kui statistiliseks analüüsiks ja visualiseerimiseks (peamised erinevused R ja Pythoni vahel on hästi kirjeldatud). Kuid statistikakeel Julia on üsna noor ja ambitsioonikas projekt. Selle keele peamine omadus on arvutuste kiirus, mõnes testis ületades R 100 korda! Kuigi Julia on varajases arengujärgus ja tal on vähe lisapaketid ja järgijaid, kuid pikemas perspektiivis on Julia võib-olla ainus potentsiaalne konkurent R-ile.

Järeldus

Seega on R-keel praegu üks juhtivaid statistikatööriistu maailmas. Seda kasutatakse aktiivselt geneetikas, molekulaarbioloogias ja bioinformaatikas, keskkonnateadustes (ökoloogia, meteoroloogia) ja põllumajandusteadustes. Üha enam kasutatakse R-i ka meditsiiniandmete töötlemisel, tõrjudes turult välja sellised kommertspaketid nagu SAS ja SPSS.

R-keskkonna eelised:

  • tasuta ja platvormideülene;
  • rikkalik statistika arsenal. meetodid;
  • kvaliteetne vektorgraafika;
  • üle 7000 testitud pakendi;
  • paindlik kasutada:
    - võimaldab luua/redigeerida skripte ja pakette,
    - suhtleb teiste keeltega, näiteks: C, Java ja Python,
    - oskab töötada SAS, SPSS ja STATA andmevormingutega;
  • kasutajate ja arendajate aktiivne kogukond;
  • regulaarsed uuendused, hea dokumentatsioon ja tehniline tugi. toetus.

Puudused:

  • väike kogus teavet vene keeles (kuigi viimase viie aasta jooksul on ilmunud mitmeid koolitusi ja huvitavaid raamatuid);
  • suhteline kasutamise raskus kasutaja jaoks, kes ei tunne programmeerimiskeeli. Seda saab osaliselt siluda, töötades Rcmdr GUI shellis, millest ma eespool kirjutasin, kuid mittestandardsed lahendused peate ikkagi kasutama käsurida.

Kasulike allikate loend

  1. Ametlik veebisait: http://www.r-project.org/
  2. Veebisait algajatele: http://www.statmethods.net/
  3. Üks parimaid teatmeteoseid: The R Book, Michael J. Crawley 2. väljaanne, 2012
  4. Olemasoleva venekeelse kirjanduse nimekiri + hea ajaveeb

1993. aasta augustis teatasid kaks noort Uus-Meremaa teadlast Aucklandi ülikoolist oma uuest arendusest, mille nad nimetasid R-ks. Loojate Robert Gentlemani ja Ross Ihaka sõnul pidi see olema S-keele uus teostus, mis erineb sellest, kui S-PLUS mõningate detailidega, näiteks globaalsete ja kohalike muutujate käsitlemine, aga ka mäluga töötamine. Tegelikult ei loonud nad S-PLUS-i täielikku analoogi, vaid uue "haru" "S-puule". Paljud asjad, mis eristavad R-i S-PLUS-ist, on tingitud skeemikeele (funktsionaalne programmeerimiskeel, Lisp keele üks populaarsemaid dialekte) mõju.

2016. aasta keskpaigaks oli R järele jõudnud SAS-ile ja SPSS-ile (mis on tasulised) ning temast sai üks kolmest levinuimast statistilise teabe töötlemise süsteemist. Samuti tuleb märkida, et R on üks 10 üldotstarbelisest programmeerimiskeelest.

Võimalused

R keskkonnas rakendatakse paljusid statistilisi meetodeid: lineaarsed ja mittelineaarsed mudelid, statistiliste hüpoteeside testimine, aegridade analüüs, klassifitseerimine, klasterdamine, graafiline visualiseerimine. R-keel võimaldab teil määrata oma funktsioone. Paljud R-funktsioonid on kirjutatud R-is. Kogenud kasutajad pääsevad C-koodi kaudu otse juurde R-objektidele. R on rangem objektorienteeritud keel kui enamik statistilisi andmetöötluskeeli. Graafikafunktsioonid võimaldavad teil luua hea prindikvaliteediga graafikuid, mis võimaldavad lisada matemaatilisi sümboleid. Sellel on oma LaTeX-i sarnane dokumentatsioonivorming.

Kuigi R-i kasutatakse kõige sagedamini statistiliseks arvutamiseks, saab seda kasutada ka maatriksarvutusvahendina. Nagu MATLAB, käsitleb R mis tahes arvutehte tulemust ühikupikkuse vektorina. Üldiselt pole R-is skalaarid.

Skriptid

Lihtsalt avage R-seanss ja sisestage üksteise järel programmiaknasse käsud – see on vaid üks võimalikud viisid tööd. Palju produktiivsem meetod, mis on ka R-i suur eelis, on skriptide (programmide) loomine, mis seejärel R-i laaditakse ja selle poolt tõlgendatakse. Töö algusest peale tuleks luua skripte, isegi tühisena tunduvate ülesannete jaoks – see säästab edaspidi oluliselt aega. Skriptide loomine mis tahes põhjusel ja isegi ilma erilise põhjuseta on üks R-i töökultuuri aluseid.

Paketid

Teine R-i oluline eelis on selle jaoks paljude laienduste või pakettide olemasolu. Mõned põhipaketid on kohe pärast R-i arvutisse installimist olemas, ilma nendeta süsteem lihtsalt ei tööta (näiteks pakett nimega base või pakett grDevices, mis kontrollib graafikute väljundit), samuti "soovitatud" paketid (pakett spetsialiseeritud klastrianalüüsi klastri jaoks, pakett mittelineaarsete mudelite analüüsimiseks nlme ja teised). Lisaks saate installida mis tahes peaaegu kaheksa tuhandest (2016. aasta keskpaiga seisuga) CRANis saadaolevast paketist. Kui teil on juurdepääs Internetile, saate seda teha otse R-st, kasutades käsku install.packages().

Lingid

  • CRAN (Comprehensive R Archive Network) on R-i ja selle pakettide keskne salvestus- ja jaotussüsteem.