Published January 11, 2019 | Version v1
Book chapter Open

Uso de la distribución bernoulli multivariada en salud bucal

  • 1. Universidad de la República

Description

En general, en muy variadas disciplinas como la Economı́a, el Marketing, la Epidemiologı́a, se dan situaciones donde la matriz de datos de la que se dispone está formada por datos binarios (unos y ceros) que surgen de trabajar con varias variables aleatorias resultantes de un experimento con 2 resultados posibles en cada caso. El interés se centra entonces, generalmente, en analizar y dar cuenta de las relaciones que se dan entre variables a través de la distribución Bernoulli Multivariada (BM). Esta distribución puede ser caracterizada por un vector de intensidades y una matriz de asociaciones entre las variables binarias, que se pueden
interpretar y asimilar como los parámetros de un modelo de regresión, por lo cual es importante entonces ver como queda parametrizado este modelo probabilı́stico y como puede ser estimado.
Se presenta luego a modo de ejemplo una aplicación en salud bucal para evaluar la enfermedad periodontal en la población adulta uruguaya. Los datos surgen del primer relevamiento nacional de salud bucal, llevado a cabo durante los años 2011 y 2012 en diversos departamentos de Uruguay, donde fueron encuestadas personas de 3 grupos etarios (jóvenes, adultos y adultos mayores), a los que se les evalúa presencia de enfermedad periodontal, evaluada como atributos binarios en 6 sextantes de la boca, por lo cual se tienen 6 variables binarias.

In general in very varied disciplines such as Economics, Marketing, and Epidemiology there are situations where the available data matrix is formed by binary data (ones and zeros) that arise from working with several random variables resulting from an experiment with 2 possible results in each case. The interest is then generally focused on analyzing and accounting for the relationships that occur between variables through the Multivariate Bernoulli (MB) distribution presented in this work. This distribution can be characterized by a vector of intensities and a matrix of associations between binary variables, which can be interpreted and
assimilated as the parameters of a regression model, so it is important to see how it is parameterized this probabilistic model and how it can be estimated. An oral health application is then presented as an example to evaluate periodontal disease
in the Uruguayan adult population measured as binary attributes in 6 sextants of the mouth, for which there are 6 binary variables.

 

Files

capitulo_12_libro_puebla_DBM_2018.pdf

Files (340.6 kB)

Name Size Download all
md5:9d0a6b123691f45fb5de8d161d3bd71d
340.6 kB Preview Download

Additional details

Additional titles

Translated title
Use of the multivariate bernoulli distribution in oral health

References

  • Abernathy, J. R., Graves, R. C., Bohannan, H. M., Stamm, J. W., Greenberg, B. G., and Disney, J. A. Development and application of a prediction model for dental caries.Community Dentistry and Oral Epidemiology, 15:pp. 24–28., 1987.
  • Álvarez-Vaz, R., Riaño, M., Mesa, M., Buño, G., and Nalbarte, L. Maloclusión en niños en edad escolar: Análisis de los factores de riesgo. Colección Biblioteca Plural de la CSIC. Departamento de Publicaciones, Unidad de Comunicación de la Universidad de la República (UCUR), 2011.
  • Breiman, L., J.Friedman, Stone, C. J., and Olshen, R. Classification and Regression Trees. Chapman and Hall/CRC, 1 edition, 1984.
  • Cribari-Neto, F. and Zeileis, A.Beta Regression in R. Journal of Statistical Software, 34(2):pp. 1–24,2010.
  • Grün, B., y Kosmidis, I. y Zeileis, A. Extended beta regres- sion in R: Shaken, stirred, mixed, and partitioned, Working Pa- per 2011-22, Working Papers in Economics and Statistics, Re- search Platform Empirical and Experimental Economics, Universität Innsbruck.http://EconPapers.RePEc.org/RePEc:inn:wpaper:2011-22, 2011.
  • Kieschnick, R. and McCullough, B. D. Regression analysis of variates observed on (0, 1): percentages, proportions and fractions. Statistical Modelling: An International Journal, 3(3):193, 2003.
  • Ospina, R. y Ferrari, S. L. Á general class of zero-or-one inflated beta regression models'. Computational Statistics & Data Analysis Volume 56(Is- sue6), pp. 1609-1623,2012.
  • Salinas-Rodrı́guez, A., Manrique-Espinoza, B., and Sosa-Rubı́, S. G. Análisis estadı́stico para datos de conteo: aplicaciones para el uso de los servicios de Salud. Salud Pública de México, 51:pp. 397–406,2009.
  • Verkuilen, J. and Smithson, M. Mixed and mixture regression models for continuous bounded responses using the beta distribution.Journal of Educatio- nal and Behavioral Statistics,37(1):pp. 82–113,2012
  • R Core Team R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria,2017.
  • Venables, W. N. and Ripley, B. D. Modern Applied Statistics with S.Springer, New York, fourth edition. ISBN 0-387-95457-0, 2002.
  • Zeileis, A., Kleiber, C. y Jackman, S. 'Regression models for count data in R',Journal of Statistical Software 27(8),pp. 1–25 http://www.jstatsoft.org/v27/i08,2008.