La saturación de datos es un término que se utiliza en investigación para indicar que no se espera que se añada nueva información que mejore o cambie las conclusiones de un estudio. Es importante lograr la saturación de datos. Se alcanza cuando hay suficiente información para replicar el estudio, cuando se ha alcanzado la capacidad de obtener nueva información adicional y cuando ya no es factible la codificación adicional (identificación de temas).
Sin embargo, el concepto de saturación de datos se considera un concepto descuidado. Esto se debe a que es un concepto difícil de definir. Lo que es saturación de datos para uno no es ni mucho menos suficiente para otro.
Hay dos formas en las que la saturación de datos se desarrolla en la investigación:
Saturación de datos en el muestreo
Cuando un investigador elige a los encuestados para un estudio (realiza un «muestreo»), puede hacerlo utilizando un «muestreo teórico». Esto significa que seguirá añadiendo nuevas unidades a la muestra hasta que el estudio haya alcanzado un punto de saturación; es decir, hasta que no se produzcan nuevos datos mediante la inclusión y el análisis de nuevas unidades. El muestreo teórico es un enfoque de adquisición de encuestados para la investigación que está relacionado con un planteamiento denominado «teoría fundamentada» y se caracteriza por el hecho de que la recogida de datos está controlada por la teoría emergente. El investigador tiene que buscar constantemente nuevas unidades y datos, y justificar el propósito teórico por el que se incluye cada grupo adicional en el estudio. Este tipo de enfoque del muestreo es poco común debido a las limitaciones de un presupuesto fijo que determina el diseño del estudio y sus parámetros de muestreo.
Los investigadores a menudo luchan por saber cómo estimar cuántas entrevistas serán necesarias para alcanzar la saturación de datos y, de nuevo, suelen estar dictados por los presupuestos del proyecto. A la hora de decidir el diseño de un estudio, los investigadores deben aspirar a uno que sea explícito respecto a cómo se alcanza la saturación de datos. Para lograr la saturación de los datos de la mejor manera posible, se debe tener mucho cuidado en el muestreo de una sección transversal de las poblaciones de interés, de modo que sea probable que se escuche una gama completa de puntos de vista.
Saturación de datos en la entrevista cualitativa
La entrevista en profundidad y los grupos focales son dos métodos comúnmente utilizados en la investigación cualitativa. Cada uno de ellos implica la búsqueda de la profundidad del significado, a diferencia de una encuesta cuantitativa que tiende a centrarse en preguntas cerradas como el sí/no o las escalas de valoración. Un grupo de discusión o una entrevista en profundidad es una forma de investigación exploratoria. Es abierta y menos estructurada que una encuesta. El entrevistador debe investigar el tema de interés con el encuestado hasta que no haya nada más que añadir. Para ello, puede utilizar preguntas al final de la entrevista como «¿Algo más?» o «¿Necesito saber algo más de lo que le he preguntado?». Esto se hace para asegurar que se ha alcanzado la saturación; que no hay nada más que añadir al tema de interés.
El no alcanzar la saturación de datos en la investigación cualitativa tiene un impacto en la calidad de la investigación y compromete la validez del contenido. Sin embargo, no existe un enfoque único para obtener la saturación de datos. Hay métodos de recogida de datos que tienen más probabilidades de alcanzar la saturación de datos que otros, aunque estos métodos dependen en gran medida del diseño del estudio.
Desgraciadamente, la saturación de datos sólo puede conocerse realmente a posteriori, una vez que se han realizado las entrevistas cualitativas y se han analizado los datos. Sin embargo, la investigación de mercado suele planificarse, justificarse y presupuestarse con antelación. Por lo tanto, lograr la saturación de datos en realidad debe ser una combinación de muestreo sensato, buen diseño de la investigación, herramientas de investigación bien diseñadas y la realidad de los parámetros comerciales del proyecto.
De lo contrario, sus hallazgos pueden quedar al margen de la lluvia.