La depresión es uno de los trastornos de salud mental más extendidos que, a menudo, permanece infradiagnosticado debido a las limitaciones de los métodos e instrumentos tradicionales de evaluación. Recientes avances tecnológicos han permitido a los investigadores explorar las características del habla y de la voz como posibles biomarcadores de trastornos mentales. De hecho, la evaluación de los biomarcadores asociados a la voz resulta prometedora debido a que los patrones del habla pueden reflejar cambios cognitivos, emocionales y psicomotores asociados con la depresión. No obstante, la literatura existente al respecto sigue siendo heterogénea en términos de conjuntos de datos, técnicas de modelado y métodos de evaluación.
Con el objetivo de comprender mejor cómo los biomarcadores basados en la voz se asocian con la depresión, Donaghy y cols. (2024) realizaron una revisión narrativa y sistemática que examinó el uso de técnicas de aprendizaje automático (Machine Learning – ML -). Los autores analizaron estudios empíricos que evaluaban la eficacia de biomarcadores del discurso en la detección de síntomas depresivos y exploraron las diferencias metodológicas entre estudios. Para esta revisión narrativa y sistemática se consideraron varios aspectos metodológicos clave:
- Estudios centrados en características del habla y modelos de ML para la detección de depresión.
- Inclusión de investigaciones empíricas que examinaran conjuntos de datos basados en la voz y técnicas de modelado computacional.
- Extracción y comparación de características metodológicas como tamaño de muestra, características de la voz, algoritmos de ML y métricas de evaluación.
¿Cuál es la eficacia de los biomarcadores de voz para identificar la depresión? ¿Qué variaciones existen entre muestras y diseños metodológicos?
Donaghy y cols. (2024) incluyeron un total de 19 estudios en la revisión final. En estos trabajos, los investigadores extrajeron diversas características acústicas a partir de grabaciones de voz, entre ellas: a) prosodia (p.ej., tono, intensidad o velocidad del habla); b) características espectrales; c) características temporales del habla. Se considera que estas características reflejan lentitud psicomotora, reducción de la expresión emocional y cambios cognitivos, fenómenos comúnmente asociados con estados depresivos.
Además, se examinaron diversos algoritmos de ML utilizados en los estudios analizados, como: a) Support Vector Machines (SVM); b) Random Forest; c) redes neuronales; d) modelos de aprendizaje profundo (deep learning – DL -). Los resultados de los distintos estudios indicaron que los modelos de ML pueden clasificar el habla depresiva frente a la no depresiva con una precisión moderada a alta, aunque el rendimiento varió según la calidad de los datos y el enfoque de modelado utilizado.
Por último, en relación con la variabilidad metodológica, los autores encontraron una considerable heterogeneidad en tamaños muestrales, protocolos de recogida de datos, métodos de extracción de características y estrategias de evaluación. Esta variabilidad dificulta la comparación directa entre estudios y, por tanto, limita la posibilidad de determinar cuáles son los enfoques más eficaces.
Eficacia prometedora de las técnicas de ML para la detección de la depresión
De forma general, los resultados de esta revisión sugieren que las técnicas de ML para analizar biomarcadores de voz representan un enfoque prometedor para la detección de la depresión. De hecho, el análisis del habla ofrece una técnica no invasiva y potencialmente aplicable a otros síntomas psicopatológicos, a través de smartphones o herramientas de telemedicina. Por ello, el ML podría convertirse en una herramienta potente de evaluación clínica.
No obstante, los autores identifican varias limitaciones en los estudios revisados, entre ellas muestras pequeñas y poco diversas, falta de conjuntos de datos estandarizados, resultados inconsistentes sobre el rendimiento de los modelos o escasa replicación de resultados. Estas limitaciones podrían superarse usando conjuntos de datos más amplios, métodos estandarizados y evaluaciones con validación cruzada entre distintas poblaciones, lo que permitiría mejorar la fiabilidad y aplicabilidad clínica.
En conclusión, este estudio señala que el análisis de los biomarcadores de voz con técnicas ML muestra un gran potencial para identificar depresión, ofreciendo oportunidades para la detección temprana y la monitorización remota de la salud mental. Sin embargo, será necesario continuar investigando para mejorar la consistencia metodológica y validar estos modelos en contextos clínicos reales antes de su adopción generalizada.


