Populations without sampling frame are inherently hard to sample by conventional sampling designs. Often the only practical methods of obtaining the sample involve following social links from some initially identified respondents to add more research participants to the sample. These kinds of link-tracing designs make the sample liable to various forms of bias and make extremely difficult to generalize the results to the population studied. This thesis is divided into two parts. The first part of the thesis describes some attempts to build a statistical theory of link-tracing designs and illustrates, deeply, the Respondent-Driven Sampling, a link-tracing sampling design that should allow researchers to make, in populations without sampling frame, asymptotically unbiased estimates under certain conditions. The second part of the thesis investigates the performance of RDS by simulating sampling from a virtual community on the Internet, which are available in both the network structure of the population and demographic traits for each individual. In addition to simulations, this thesis tests the RDS by making a web-survey of the same population. RDS estimates from simulations and web-survey are compared to true population values and potential sources of bias (in particular those related to the random recruitment assumption) are discussed.

Il campionamento a valanga è considerato un tipo di campionamento non probabilistico, la cui rappresentatività può essere valutata solo sulla base di considerazioni soggettive. D’altro canto esso risulta spesso il solo praticamente utilizzabile nel caso di popolazioni senza lista di campionamento. La tesi si divide in due parti. La prima, teorica, descrive alcuni tentativi proposti in letteratura di ricondurre le forme di campionamento a valanga nell’alveo dei campionamenti probabilistici; tra questi è degno di nota il Respondent Driven Sampling, un disegno campionario che dovrebbe combinare il campionamento a valanga con un modello matematico che pesa le unità estratte in modo da compensare la non casualità dell’estrazione e permettere così l’inferenza statistica. La seconda, empirica, indaga le prestazioni del RDS sia attraverso simulazioni sia con una web-survey su una comunità virtuale in Internet, di cui si conoscono la struttura delle relazioni e alcune caratteristiche demografiche per ogni individuo. Le stime RDS, calcolate a partire dai dati delle simulazioni e della web-survey, sono confrontate con i valori veri della popolazione e le potenziali fonti di distorsione (in particolare quelle relative all’assunzione di reclutamento casuale) sono analizzate.

VITALINI, ALBERTO, L'uso delle reti sociali per la costruzione di campioni probabilistici: possibilità e limiti per lo studio di popolazioni senza lista di campionamento, LANZETTI, CLEMENTE, CASELLI, MARCO, Università Cattolica del Sacro Cuore Milano:Ciclo XXIII [https://hdl.handle.net/10807/285059]

L'uso delle reti sociali per la costruzione di campioni probabilistici: possibilità e limiti per lo studio di popolazioni senza lista di campionamento

Vitalini, Alberto
2011

Abstract

Populations without sampling frame are inherently hard to sample by conventional sampling designs. Often the only practical methods of obtaining the sample involve following social links from some initially identified respondents to add more research participants to the sample. These kinds of link-tracing designs make the sample liable to various forms of bias and make extremely difficult to generalize the results to the population studied. This thesis is divided into two parts. The first part of the thesis describes some attempts to build a statistical theory of link-tracing designs and illustrates, deeply, the Respondent-Driven Sampling, a link-tracing sampling design that should allow researchers to make, in populations without sampling frame, asymptotically unbiased estimates under certain conditions. The second part of the thesis investigates the performance of RDS by simulating sampling from a virtual community on the Internet, which are available in both the network structure of the population and demographic traits for each individual. In addition to simulations, this thesis tests the RDS by making a web-survey of the same population. RDS estimates from simulations and web-survey are compared to true population values and potential sources of bias (in particular those related to the random recruitment assumption) are discussed.
4-mar-2011
XXIII
CORSO DI DOTTORATO IN SOCIOLOGIA E METODOLOGIA DELLA RICERCA SOCIALE AFFERENTE ALLA SCUOLA DI DOTTORATO IN SCIENZE SOCIALI
Il campionamento a valanga è considerato un tipo di campionamento non probabilistico, la cui rappresentatività può essere valutata solo sulla base di considerazioni soggettive. D’altro canto esso risulta spesso il solo praticamente utilizzabile nel caso di popolazioni senza lista di campionamento. La tesi si divide in due parti. La prima, teorica, descrive alcuni tentativi proposti in letteratura di ricondurre le forme di campionamento a valanga nell’alveo dei campionamenti probabilistici; tra questi è degno di nota il Respondent Driven Sampling, un disegno campionario che dovrebbe combinare il campionamento a valanga con un modello matematico che pesa le unità estratte in modo da compensare la non casualità dell’estrazione e permettere così l’inferenza statistica. La seconda, empirica, indaga le prestazioni del RDS sia attraverso simulazioni sia con una web-survey su una comunità virtuale in Internet, di cui si conoscono la struttura delle relazioni e alcune caratteristiche demografiche per ogni individuo. Le stime RDS, calcolate a partire dai dati delle simulazioni e della web-survey, sono confrontate con i valori veri della popolazione e le potenziali fonti di distorsione (in particolare quelle relative all’assunzione di reclutamento casuale) sono analizzate.
LANZETTI, CLEMENTE
CASELLI, MARCO
BOVONE, LAURA
VITALINI, ALBERTO, L'uso delle reti sociali per la costruzione di campioni probabilistici: possibilità e limiti per lo studio di popolazioni senza lista di campionamento, LANZETTI, CLEMENTE, CASELLI, MARCO, Università Cattolica del Sacro Cuore Milano:Ciclo XXIII [https://hdl.handle.net/10807/285059]
File in questo prodotto:
File Dimensione Formato  
tesi_completa_Vitalini.pdf

accesso aperto

Tipologia file ?: Tesi di dottorato
Note: tesi
Dimensione 1.48 MB
Formato Adobe PDF
1.48 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10280/984
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact