

Addressing Misidentification in Noninvasive DNA Sampling Using Bayesian Approach and Simulations

La identificación errónea en el muestreo de ADN no invasivo abordada mediante modelos bayesianos y simulaciones



Noninvasive DNA sampling, MCMC, Misidentification, Reversibility, Latent individual (en)
Muestreo de ADN no invasivo, Reversibilidad, Métodos MCMC, Identificación errónea, Individuos latentes (es)



  • Paula Bran Universidad del Valle
  • Leon Escobar Universidad del Valle

Noninvasive DNA sampling has become increasingly popular in wildlife research and conservation because it allows scientists to gather valuable genetic information without disturbing or harming the animals. However, the correct identification of the species or individuals in the sample is virtually impossible when using this kind of sampling. Consequently, it becomes essential to consider the errors hidding true identities in order to improve the quality of the data. Errors, if left unaddressed, can have a considerable impact on the accuracy of statistical inferences drawn from the data. This paper endeavours to review some research about misidentification problems and how Bayesian models and Markov Chain Monte Carlo (MCMC) methods can be applied. In addition, a hypothetical scenario is presented to illustrate how genetic material can serve as unique identifier of individuals, and to highlight the potential difficulties that may arise if a proposal distribution for the MCMC simulations is inappropriately chosen.

El muestreo de ADN no invasivo se ha vuelto cada vez más popular en la investigación y conservación de vida silvestre, ya que permite a los científicos recopilar información genética valiosa sin perturbar ni lesionar a los animales. Sin embargo, la correcta identificación de la especie o individuos en la muestra es prácticamente imposible cuando se utiliza este tipo de muestreo. En consecuencia, es fundamental considerar los errores que ocultan las verdaderas identidades con el fin de mejorar la calidad de los datos. Si los errores no se abordan, pueden tener un impacto considerable en la precisión de las inferencias estadísticas obtenidas a partir de los datos. Este artículo se propone revisar algunas investigaciones sobre problemas de identificación errónea y cómo se pueden aplicar los modelos bayesianos y los métodos de Monte Carlo basados en cadenas de Markov (MCMC). Además, se presenta un escenario hipotético para ilustrar cómo el material genético puede servir como identificador único de los individuos, y resaltar las dificultades potenciales que pueden surgir si se elige inapropiadamente una distribución de propuestas para las simulaciones de MCMC.


