Vés al contingut
Línia de recerca Risc cardiovascular

A selection-bias free method to estimate the prevalence of hypertension from an administrative primary health care database in the Girona health region, Spain

Saez M, Barceló MA, Coll-de-Tuero G. Computer Methods and Programs in Biomedicine 2009; 93(3):228-240. doi: 10.1016/j.cmpb.2008.10.010 (Impact Factor: 3.424, COMPUTER SCIENCE, THEORY & METHODS  15/104 Q1)

L'objectiu d'aquest estudi va consistir a proposar un mètode estadístic per a estimar la prevalença utilitzant una base de dades administrativa d'atenció primària de salut. En concret, vam estimar la prevalença d'hipertensió en la població coberta per proveïdors públics d'atenció primària de salut a la Regió Sanitària de Girona, Espanya, en 2005, mitjançant un model en dues parts (model Hurdle).

 

La principal limitació derivada de l'ús de bases de dades administratives és el possible biaix de selecció. Com és sabut, alguns individus tenen més probabilitat d'acudir als centres d'atenció primària i, per tant, d'estar presents en la mostra que uns altres. En aquest sentit, els individus que van contactar amb aquests centres estaran sobre representats. Si la selecció fos exògena, és a dir si la probabilitat que s'observés a un individu fos idèntica per a tots els individus, bastaria amb ponderar la mostra de tal manera que s'atorgués menor pes als individus efectivament observats. No obstant això, és molt probable que els individus contactessin amb els serveis d'atenció primària (d'on provenen les dades), no sols perquè tenien algun dels símptomes d'inici de la malaltia, sinó que també podrien existir factors no observats que influïssin en la utilització d'aquest servei i que estarien correlacionats amb els factors no observables que afectessin la variable resposta. En tot cas, la probabilitat que aquests pacients hagin estat observats no és la mateixa per a tots ells. Així doncs, la ponderació (estandardització) per edat i sexe no corregiria el biaix de selecció.

 

En aquest cas (denominat selecció endògena), s'ha d'utilitzar un model en dues parts. En la primera part s'estima la probabilitat que un individu sigui observat. Aquestes probabilitats s'utilitzen com a ponderacions en la segona part del model amb l'objectiu de corregir la no aleatorietat (és a dir, el biaix de selecció). En aquest article, estimem les dues parts de manera conjunta, especificant un model en dues parts denominat Hurdle.

 

Utilitzant aquest mètode lliure de biaixos de selecció, estimem la prevalença d'hipertensió. Observem que el 15,5% de les persones de 15 anys o més (14,1% entre homes i 16,9% entre dones) sofreix d'hipertensió. Així mateix, la prevalença es va estimar en 31,1% (30,3% homes i 32,0% dones) en persones de 45 anys o més; 48,3% (44,1% homes i 51,9% dones) entre els de 65 anys o més; i el 13,1% (11,8% homes i 13,9% dones) en la població general.