articolo

Pagina di diario

Chiedo anticipatamente scusa a chi (forse tutti) leggendo questa pagina non ci capirà nulla ma ho davvero bisogno di mettere per iscritto questi pensieri perché stanno diventando troppo ingombranti e siccome sono negativi, il fatto che stiano occupando troppo spazio è una cosa che non mi piace.

Si tratta del lavoro che devo fare sui dati della tesi per pubblicare l’articolo scientifico.

Il professore mi ha lasciato il compito di capire se ci fossero misure spaziali alla base della qualità ecologica e io ho iniziato a lavorare con l’analisi statistica che avevo già usato per la tesi (anche se in modo marginale). Ho fatto riarrangiamenti dei dati, sistemato le tabelle e tutto. A giugno ero arrivata ad avere una analisi, un grafico, che non rispondeva alla nostra domanda di base ma qualche considerazione la si poteva fare comunque. Dopo essere stata al mare mi sono rimessa al lavoro e ho scoperto una seconda metodologia statistica, si chiama MDS e avevo provato a usarla sui miei dati senza dire nulla al professore o a M. perché eravamo a cavallo di ferragosto e non sapevo se l’università fosse chiusa e quindi loro giustamente in ferie. I risultati mi sembravano più “interessanti” e anche che potessero rispondere meglio alla nostra domanda ma ad un certo punto, tra le dispense leggo una frase che mi fa cascare le braccia, ovvero che la metodica può essere usata solo se le variabili hanno scale ad intervalli o proporzionali. Quindi anche questo finisce nel cestino.

A questo punto presa dalla disperazione mi metto a fare il punto cercando di porre graficamente con disegni il mio problema e i miei dati e guardandoli mi sembra che la mia questione sia molto simile ad uno degli esempi che avevo letto nei giorni precedenti e che riguardava un terzo tipo di analisi statistica, la discriminante lineare.

Considerate che io queste analisi statistiche non le conosco, devo partire dalle basi per capirle e poter interpretare i grafici.

Si pone però un problema, il software che il professore mi aveva dato per fare le analisi della tesi e che posso tenere perché ha infinite licenze, non fa questa ultima analisi, che si chiama Analisi discriminante lineare o anche pattern recognition.

Così mi faccio coraggio e scrivo al professore e a M. spiegando di nuovo tutto il percorso e arrivando a raccontare l’ultima “scoperta” e dicendo che mi serve un modo per fare l’analisi discriminante.
Mi risponde in tempi brevissimi M. mostrandomi un grafico che ha prodotto usando i dati che gli avevo passato. Probabilmente i dati erano ancora troppo grezzi, troppi e credo anche strutturati in modo non adatto, però forse qualcosa di buono ne poteva uscire. Il problema è che io non riuscirò mai ad usare quel programma, io non ho quel programma. Unica soluzione sarebbe scaricare una versione di prova di un qualche software ma sono sempre a tempo e l’analisi che mi serve è ad un livello superiore che di sicuro non è compresa nel pacchetto di prova.

Ma non è solo questo,c’è dell’altro. Ho una brutta sensazione, che il professore non abbia lui stesso idea di come fare per rispondere alla domanda.
Mi pare che mi abbiano messo a fare una cosa senza darmi gli strumenti corretti per eseguirla.
Mi sento abbandonata e M. non è di grande aiuto e lo dimostra il fatto che devo spiegargli cosa sto facendo e che non sa aiutarmi nell’interpretare i numeri delle analisi statistiche. Per carità non gli sto dando colpe, non è il suo ramo e non mi ha seguito lui quindi è accettabile che non mi sia di grosso aiuto ma diciamo che va ad aumentare il peso sul piatto della bilancia alla voce “abbandono”.
Il professore tace e non è disponibile e se viene a vedere cosa faccio quando mi vedo con M. quando vado in sede per fare il punto della situazione, dice cose che nessuno di noi capisce dove voglia andare a parare… e poi sparisce. Certo, è occupato ed è giusto che sia così ma, ripeto, mi sembra che mi abbiano messo a svuotare il mare con una forchetta e un secchiello bucato, ecco!

Eventi · Pensieri e Riflessioni

Sfiduciata

Oggi, dopo quasi in mese sono tornata in università a mostrare i risultati che avevo ottenuto con l’ultima selezione di indici.

Io ero soddisfatta, molto soddisfatta, perché, anche se non davano risposte chiare belle e sostanziose, ero certa che la selezione degli indici fosse la migliore possibile!

E invece NOOOOOOOOOOOOO

Ho fatto il riassunto dei procedimenti a M. che era un po’ scettico sulla procedura usata ma alla fine sembra che si potesse comunque valutare come utile. Poi abbiamo guardato i risultati ma ad entrambi era sorto il dubbio che si dovesse cercare di avere i dati distribuiti in una condizione bidimensionale piuttosto che mono-dimensionale come erano invece i miei risultati, così abbiamo cercato di coinvolgere il professore ma era impegnatissimo al telefono e ci ha dedicato solo un paio di minuti.

Mai sottovalutare la quantità di disastro contenibile in 2 soli minuti!!!!!
Ci ha detto cose che…
Fondamentalmente non abbiamo capito!!!
Fantastico no?
Quindi abbiamo cercato di capire cosa volesse da me (tecnicamente dalle mie analisi) e abbiamo parlato per una mezz’ora buona cercando di risalire a dove fosse rintracciabile tra i vari parametri finali, ciò che era di nostro interesse per poter andare a modificare nuovamente (sigh!) le variabili da prendere in considerazione.

Anche a costo di ripetermi ma non ne uscirò sana di mente!

Il professore dice che la ricerca è fatta di errori e di prove su prove ma io dico che è ben difficile ricavarne risultati utili se: noi parliamo italiano, parte dei dati parla inglese, l’altra tedesco e la domanda prevede di conoscere i geroglifici!

-*-*-*-*-*-* Breve spiegazione per chiarire cosa sto facendo e cosa ho fatto -*-*-*-*-*-*
Ho preso dati della distribuzione spaziale di 4 habitat (sommersi) e ne ho fatto una mappa sola unendo varie mappe disponibili

Questa mappa è stata analizzata con un programma di elaborazioni “spaziali” in vari modi, ma il principale è che è stata prima suddivisa in pezzi (i corpi idrici) e su ciascuno di questi pezzi sono state applicate circa 100 formule differenti relative ad una qualche descrizione spaziale. Queste 100 formule sono gli indici. Ciascun indice ha il suo significato, c’è quello che misura il perimetro dell’area ricoperta da un tipo di alga, quello che invece dice quanta percentuale della superficie è l’area con la superficie maggiore tra quelle presenti nel pezzo (corpo idrico) esaminato…
Di questi corpi idrici però abbiamo anche dei dati relativi alla qualità dell’ambiente, che sono stati ricavati direttamente sul campo, si tratta dei dati della valutazione ecologica.

I 100 indici sono troppi e spesso danno informazioni su cose molto simili, quindi bisogna fare una selezione, ma come la fai sta selezione?

Bisogna partire dalla domanda e la domanda sebbene appaia banale, tanto banale non è: esiste relazione tra la forma degli habitat e la qualità ecologica dell’ambiente?

Per lavorare a questi problemi, che si chiamano multivariati ed estrarne una informazione utile si usa una analisi statistica particolare ma non è possibile utilizzare tutti gli indici proprio perché spesso danno info simili.

Quindi dobbiamo (io devo) cercare di selezionare quegli indici che ci possano dare delle risposte serie e non roba tipo “jfdudujvddhcx”, ma per fare questo gli indici devono essere scelti in modo oculato, ma sopratutto con una qualche regola perché stiamo parlando di ricerca scientifica!

Molte delle regole provate hanno dato risultati poco o nulla utili, robe proprio “sudtgxtvv”.

L’ultima regola è quella che ho portato oggi e a me sembrava che i risultati ottenuti dopo l’analisi multivariata fossero più che buoni ma a quanto pare no! Il professore vorrebbe che andassimo più in dettaglio nell’indagine!

-*-*-*-*-*-*