16
feb/09

[Gruppo di lavoro] Web Analytics con “R”

Ho creato un gruppo su Facebook: “Quelli che vogliono fare Web Analytics con R“.
Mentre non serve che introduca la Web Analytics, lasciatemi spendere davvero due righe due su “R“: si tratta di un software open-source utilizzato in ambito statistico (io l’ho conosciuto ai tempi dell’università) che può essere facilmente accostato ad un altro termine, “data mining“.
In sostanza, partendo da una base dati, attraverso delle query, R fornisce come output un segmento di quei dati.
Per scendere nello specifico: partendo dai file di log, attraverso le opportune query, R fornisce praticamente tutti gli “incroci” possibili qualora le condizioni descritte nelle query vengano rispettate.
Naturalmente, tra le altre cose, sono previsti comandi dedicati alla presentazione grafica di tali segmenti ottenuti.

L’utilizzo di R spazia in diversi ambiti e con questo gruppo (di lavoro) vorremmo approfondire, appunto, quello della Web Analytics, ovvero, concretamente, pensare ad R come una delle possibili alternative ai software di analisi statistica.

Tale obiettivo si appoggia su due considerazioni:

  • il software è gratuito ed open-source;
  • tra i colleghi, la possibilità di avere a disposizione dei file di log, non è poi così remota.

Ecco.
Il gruppo su Facebook vuole avere questo obiettivo, raccogliendo idee, spunti, risorse e concretizzando quanto appreso in “qualcosa“; questo “qualcosa” è in fase di definizione, anche se ci sono già degli spunti, mentre è molto più concreta la possibilità di un evento collegato al gruppo di lavoro.
Ma di questo ve ne parlerò più avanti. :)

Se volete iscrivervi al gruppo, non dovete altro che farne richiesta (qui).

Allego di seguito anche la definizione presa da Wikipedia (qui).

Una piccola parentesi: di “R” avevo già parlato in occasione del Corso di Web Analytics tenuto da YoYo Formazione Rotolante, nel corso del quale Angela aveva tenuto uno speech proprio su questo argomento (qui e qui).

Abbonati al Feed RSSSe questo post ti è piaciuto, puoi decidere di ricevere gratuitamente gli aggiornamenti del blog abbonandoti al Feed RSS. Clicca qui.

in Web Analytics · TrackBack URL

Commenti

Francesco Gori scrive,

febbraio 16, 2009 @ 12:15

Inutile che ti ripeta quanto sono interessato ad R! :)

Ho iniziato a studiarlo da una settimanetta e pian piano ne sto comprendendo il funzionamento. Ora, oltre ad imparare ad utilizzare il software, sto iniziando a pormi il problema della metodologia.

Fare analisi con i log è differente ed R non è una piattaforma di web analytics. Se da un lato mi permette di segmentare, incrociare, approfondire, dall’altro lato impiego ancora troppo tempo a estrapolare i dati.

Sinceramente, spero che si solleverà un certo interesse verso il rapporto tra R e web anlaytics: più siamo, maggiori saranno i progressi in questa direzione.

Marco scrive,

febbraio 16, 2009 @ 12:28

Hai ragione, R non è una piattaforma di web analytics e l’intenzione non è di presentarla come tale; il mio obiettivo (personale) è quello di impararne l’utilizzo e le potenzialità per avere un’altra “arma” a disposizione quando faccio attività di analisi.

Vorrei avere la possibilità di andare oltre gli “incroci” pre-confezionati che ritrovo nelle piattaforme più diffuse, naturalmente quando ne vale la pena ed ho necessità di scendere nello specifico.

In termini di operatività non credo possa essere adottato come “strumento di default”; ma averlo pronto all’utilizzo, conoscendone comandi e funzionamento, è una condizione alla quale vorrei arrivare.

Inoltre, il fatto di poter andare “al di là” delle metriche presentate nella dashboard delle diverse piattaforme mi stuzzica un po’ anche in termini di “fantasia” perchè, onestamente, ormai abituato all’utilizzo di Google Analytics & Co., faccio fatica a pensare a degli altri incroci ed è una cosa che mi dà un po’ di fastidio perchè sento che, in qualche maniera, mi limita: non penso tanto al dato nudo e credo, ma penso piuttosto a cosa riesco a ricavare da quello che Analytics mi propone (quindi partendo da un dato già filtrato).

fradefra scrive,

febbraio 24, 2009 @ 17:54

Infatti sono convinto che il modo migliore per usare R ( o un altro strumento di data mining) sia propro quello di dargli in pasto dati pre-elaborati, non il file di log diretto.

Giusta anche l’idea di non legarsi troppo ai report e schemi forniti da Google Analytics che nascendo per certe necessità, mal ne gestisce altre (ed invece i dati li avrebbe).

Ovviamente l’utilizzo di R implica la creazione di una struttura di creazione-trasferimento di dati che porta via un po’ di tempo e che si giustifica in progetti di una certa complessità.

Ottima l’idea di approfondirlo e mi fa piacere, Marco, che l’idea dell’anno scorso ti sia piaciuta.
Senti Enrico Altavilla, so che lui aveva in mente gli stessi studi e so che qualcosa aveva fatto.
Ciaooo

Dario Solari scrive,

ottobre 9, 2009 @ 12:19

Ciao.
Pure io ed altri miei amici stiamo sviluppando qualcosa di analogo.

Se sei interessato e/o vuoi confrontarti scrivici a info@associazionerospo.org
Questo è il nostro sito: http://www.associazionerospo.org

Lascia un commento

Forse potranno interessarti...

.