1 Introduzione
1.1 Che cos’è R
R è un programma che consente di elaborare dati e di rappresentarli graficamente in ambito statistico. È essenzialmente un linguaggio strutturato di tipo funzionale coadiuvato da un insieme di librerie (pacchetti) che consentono di svolgere la maggior parte delle analisi statistiche necessarie per la descrizione di un fenomeno.
Ad essere precisi il linguaggio implementato in R si chiama S sviluppato da John Chambers ed inizialmente da Rick Becker and Allan Wilks dei famosi Bell Laboratories.
Attualmente R è sviluppato da una comunità internazionale coordinata dalla R Foundation for Statistical Computing.
I punti di forza sono, l’immensa varietà di tecniche statistiche disponibili, le potenti capacità grafiche, la possibilità di essere esteso attraverso la creazione di pacchetti, la buona documentazione delle sue funzionalità e la semplicità del linguaggio. Queste caratteristiche lo rendono adatto sia a neofiti che a professionisti e accademici. Non solo, un’attiva comunità di utilizzatori di R rende molto semplice cercare online informazioni e aiuto anche per i propri problemi specifici.
In conclusione R non è (solo) un sistema statistico, ma è più propriamente un ambiente all’interno del quale le tecniche statistiche sono implementate. Inoltre, con l’aiuto di opportuni pacchetti, permette di presentare facilmente i risultati delle proprie analisi in documenti che sono al contempo, tipograficamente piacevoli, mostrino il codice e i risultati ottenuti, nello spirito della riproducibilità. Questo libro, ad esempio, è scritto in RMarkdown con l’aiuto del pacchetto bookdown, che ne facilita l’esportazione in diversi formati quali HTML (HyperText Markup Language) o PFD (Portable Document Format).
Infine, R è rilasciato sotto licenza GNU, questo consente oltre al suo utilizzo gratuito, la possibilità di studiare il suo codice sorgente e quindi di imparare come funziona e di estenderlo con estrema facilità.
1.2 Come usare questo libro
Questo libro è costituito da una serie di capitoli in cui si vanno pian piano a scoprire alcune delle potenzialità di R. Il consiglio è di leggerlo avendo pronto sullo schermo un ambiente R (ad esempio all’interno di RStudio, vedremo come installarli entrambi nel primo capitolo), in modo da poter provare il codice in prima persona, per capirlo e memorizzarlo meglio, sperimentando sul proprio computer.
Usare un linguaggio come R può aiutare nell’adottare un approccio sperimentale nell’apprendimento della statistica (ma anche della matematica e della programmazione): è facile fare esperimenti, vedere cosa succede e aggiustare il proprio codice di conseguenza. Poter vedere il codice sorgente delle funzioni predefinite dà la possibilità di capire meglio come mai escano certi risultati, magari diversi da quelli che ci saremmo aspettati.