La tecnologia per la raccolta di dati genetici si sta sviluppando con grande rapidit`a generando grandi basi di dati, con particolare riferimento alle osservazioni microarray riferite all’ “espressione ” di geni. Sorge quindi l’esigenza di sviluppare analisi statistiche capaci di raccogliere questa sfida, anche se finora queste rimangono spesso confinate in un ambito descrittivo. Recentemente tuttavia sono stati proposti modelli ispirati all’impostazione bayesiana che hanno il pregio di fornire una base probabilistica coerente alle categorie concettuali impiegate (quali raggruppamento, profilo molecolare etc), oltre a consentire stime pi`u efficienti, grazie al cosiddetto effetto di borrowing strength. In particolare sono stati proposti modelli gerarchici bayesiani nei quali le osservazioni sono generate da una distribuzione mistura a tre componenti (a seconda che il gene sia sottoespresso, normalmente espresso e sovraespresso); le distribuzioni iniziali dei parametri sono invece basate sull’ipotesi tradizionale di scambiabilit`a. In questo lavoro proponiamo un modello gerarchico nel quale i parametri che rappresentano le probabilit`a che i geni provengano dalla componente sotto- o sovraespressa non sono pi`u contraddistinti dall’ipotesi di scambiabilit`a, ma piuttosto da una distribuzione mistura con un numero aleatorio di componenti. In questo modo il modello consente di cogliere la presenza di aspetti di eterogeneit`a conducendo di conseguenza ad un modello bayesiano di clustering sia per quanto attiene ai geni che alle unit`a. Il modello viene applicato ad un insieme di dati simulati e ad uno di osservazioni reali.

Consonni, G., Bottolo, L., Bayesian clustering of gene expression microarray data for subgroup identification., in Atti della XLII Riunione Scientifica della Società Italiana di Statistica, (Bari, 09-11 June 2004), Cleup, Padova 2004:Sessioni plenarie e specializz 187-198 [http://hdl.handle.net/10807/12237]

Bayesian clustering of gene expression microarray data for subgroup identification.

Consonni, Guido;
2004

Abstract

La tecnologia per la raccolta di dati genetici si sta sviluppando con grande rapidit`a generando grandi basi di dati, con particolare riferimento alle osservazioni microarray riferite all’ “espressione ” di geni. Sorge quindi l’esigenza di sviluppare analisi statistiche capaci di raccogliere questa sfida, anche se finora queste rimangono spesso confinate in un ambito descrittivo. Recentemente tuttavia sono stati proposti modelli ispirati all’impostazione bayesiana che hanno il pregio di fornire una base probabilistica coerente alle categorie concettuali impiegate (quali raggruppamento, profilo molecolare etc), oltre a consentire stime pi`u efficienti, grazie al cosiddetto effetto di borrowing strength. In particolare sono stati proposti modelli gerarchici bayesiani nei quali le osservazioni sono generate da una distribuzione mistura a tre componenti (a seconda che il gene sia sottoespresso, normalmente espresso e sovraespresso); le distribuzioni iniziali dei parametri sono invece basate sull’ipotesi tradizionale di scambiabilit`a. In questo lavoro proponiamo un modello gerarchico nel quale i parametri che rappresentano le probabilit`a che i geni provengano dalla componente sotto- o sovraespressa non sono pi`u contraddistinti dall’ipotesi di scambiabilit`a, ma piuttosto da una distribuzione mistura con un numero aleatorio di componenti. In questo modo il modello consente di cogliere la presenza di aspetti di eterogeneit`a conducendo di conseguenza ad un modello bayesiano di clustering sia per quanto attiene ai geni che alle unit`a. Il modello viene applicato ad un insieme di dati simulati e ad uno di osservazioni reali.
2004
Inglese
Atti della XLII Riunione Scientifica della Società Italiana di Statistica
Riunione Scientifica della Società Italiana di Statistica
Bari
9-giu-2004
11-giu-2004
88-7178-034-5
Cleup
Relazione invitata. Sessione specializzata
Consonni, G., Bottolo, L., Bayesian clustering of gene expression microarray data for subgroup identification., in Atti della XLII Riunione Scientifica della Società Italiana di Statistica, (Bari, 09-11 June 2004), Cleup, Padova 2004:Sessioni plenarie e specializz 187-198 [http://hdl.handle.net/10807/12237]
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10807/12237
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact