^
INAOE

Actas del Congreso Nacional de
Tecnología Aplicada a Ciencias
de la Salud

TecnyMed

EVALUACIÓN DE LA INTELIGIBILIDAD DEL HABLA EN UN ESCENARIO DE TELECONSULTA

Ana Laura Padilla Ortiza, Gabriel Alejandro Galaviz Mosquedaa, Ricardo Téllez Limóna, Rubén López Villegasb, Víctor M. Coello Cárdenasb, Salvador Villarrealc
aCONACyT - Centro de Investigación Científica y de Estudios Superiores de Ensenada, B.C, Unidad Monterrey, Nuevo León, apadilla@cicese.mx, agalaviz@cicese.mx, rtellez@cicese.mx,
bCentro de Investigación Científica y de Estudios Superiores de Ensenada, B.C, Unidad Monterrey, Nuevo León, rlopez@cicese.mx, vcoello@cicese.mx
cCentro de Investigación Científica y Educación Superior de Ensenada Baja California,svillar@cicese.mx

Actas del Congreso Nacional de Tecnología Aplicada a Ciencias de la Salud Vol. 1, 2018


RESUMEN

La teleconsulta es una solución con gran potencial para la prestación de servicios de salud en comunidades actualmente desatendidas por encontrarse en áreas remotas o rurales, ya que comunica a médicos y pacientes con distinta ubicación geográfica al sortear con éxito las barreras de distancia y tiempo. Para que la implementación de un servicio de teleconsulta sea efectivo, debe contar con los siguientes elementos: personal sanitario, personal de soporte tecnológico, una red de telecomunicaciones suficientemente estable para la trasmisión de datos, centros consultantes y unidades móviles o remotas. Partiendo del escenario común de una teleconsulta, donde el médico y el paciente entablan comunicación de forma remota, se debe asegurar que las condiciones acústicas de los centros consultantes y de las unidades móviles sean óptimas, para que la señal de voz del médico sea completamente inteligible para el paciente y viceversa. En este trabajo se presenta un estudio sobre la evaluación de la inteligibilidad del habla durante una teleconsulta. Para ello se utiliza un material de voz emitido desde la posición de un médico y es evaluado por un paciente, considerando condiciones acústicas adversas de ruido y reverberación. Estos resultados contribuyen a la mejora continua del sistema de teleconsulta a-Prevenir desarrollado en el Centro de Investigación Científica y Educación Superior de Ensenada Baja California (CICESE).

Palabras clave: Inteligibilidad, Teleconsulta, Ruido

ABSTRACT

The goal of teleconsultation service is to improve health care in rural areas; teleconsultation service requires health personnel, technology support personnel, telecommunications network with stable data transmission, consulting centers, and mobile units. To assess speech intelligibility in a teleconsultation scenario is essential to ensure effective doctor-patient communication. In this work, we assess speech intelligibility in a teleconsultation system developed in CICESE (Centro de Investigación Científica y Educación Superior de Ensenada Baja California). The results contribute to improve the teleconsultation system.

Keywords: intelligibility, teleconsultation, noise

1. INTRODUCCIÓN

Inicialmente el principal objetivo del desarrollo de la telemedicina era acercar servicios sanitarios a la población ubicada en lugares remotos con escasez de recursos sanitarios para mejorar el acceso a los mismos. Posteriormente, se transformó como un medio para mejorar la calidad asistencial al permitir la formación y el apoyo a la toma de decisiones de profesionales sanitarios ubicados en zonas alejadas. Actualmente, se está planteando como una herramienta para la mejora de la eficiencia en los servicios sanitarios, ya que permite compartir y coordinar recursos geográficamente alejados o rediseñar servicios sanitarios para optimizar recursos [1]. Los principales servicios de telemedicina son [2]: 1) servicios de asistencia remota (teleconsultas de seguimiento o tratamiento y telemonitoreo de pacientes), 2) servicios de gestión administrativa de pacientes, 3) formación a distancia para profesionales, 4) evaluación e investigación colaborativa en red. La teleconsulta se refiere a la asesoría de personal médico que se realiza con el uso de herramientas tecnológicas y de telecomunicaciones, puede ser realizada entre personal médico y pacientes o entre el personal médico (de ambos lados). Corresponde al servicio de la telemedicina que más se utiliza actualmente.

1.1. Enfermedades crónico-degenerativas

Las enfermedades crónico-degenerativas son aquéllas que van degradando física y/o mentalmente a quienes las padecen, provocan un desequilibrio que afecta a los órganos y a los tejidos. Estas enfermedades pueden ser congénitas o hereditarias. Por lo tanto, suelen manifestarse en edades avanzadas, aunque también pueden afectar a personas de entre 20 y 40 años, dependiendo la enfermedad.

Algunos factores de riesgo son: obesidad y sobrepeso, malos hábitos para la salud, factores hereditarios, entre otros. Entre las enfermedades crónico-degenerativas es posible encontrar: diabetes, hipertensión, enfermedades coronarias y obesidad. Este sistema permite a un paciente auto monitorear su salud

Particularmente en México, las enfermedades crónico-degenerativas son la principal causa de mortalidad, ubicadas en el siguiente orden:  1) diabetes mellitus, 2) enfermedades isquémicas del corazón, 3) enfermedades cerebrovasculares, 4) enfermedades crónicas del hígado. Todos estos padecimientos tienen un alto costo en los sistemas de salud [3].

1.2 Inteligibilidad del habla

La inteligibilidad del habla es un término que se utiliza para describir si el discurso de un orador es comprensible para el receptor. Partiendo del esquema básico de un sistema de comunicación, en el que la información fluye desde un orador y llega a un receptor a través de un canal de comunicación acústico, la inteligibilidad puede disminuir por causas localizadas en cualquiera de los tres elementos básicos [4].

Cuando la disminución de la inteligibilidad se localiza en el canal de comunicación, el cual puede ser 1) un recinto o 2) un sistema de transmisión de voz, los factores que la afecta son: ruido de fondo y reverberación en el caso del primero; mientras que, en el caso del sistema, se debe principalmente a la pérdida de información.

Las pruebas subjetivas de inteligibilidad son herramientas útiles para evaluar la calidad acústica de un canal de transmisión destinado a la transmisión de voz.

En general, una prueba subjetiva de inteligibilidad, consiste en que un sujeto escucha un material de voz, y escribe en una destinada para este propósito, o bien repite de forma oral, el estímulo de voz que acaba de escuchar. El porcentaje de aciertos de las palabras reportadas por el sujeto respecto al total de palabras emitidas es un número que caracteriza la inteligibilidad del canal de transmisión bajo prueba.

2. PLATAFORMA a-PREVENIR©

La plataforma a-Prevenir© [5] permite ofrecer servicios de medicina preventiva en comunidades rurales o zonas urbanas con difícil acceso a los servicios de salud. Además, puede ayudar a la detección temprana de factores de riesgo de enfermedades crónico-degenerativas. Esto a través de mejorar el acceso de los usuarios a los valores comúnmente utilizados para la detección de este tipo de enfermedades, tales como, perímetro abdominal e índice de masa corporal. De esta manera, a-Prevenir© es una herramienta con el potencial de mejorar la cobertura y capacidad de sistemas de salud públicos y privados.

Esta plataforma nace de la alarmante tasa de crecimiento en las enfermedades crónico-degenerativas, la Figura 1 muestra la plataforma a-Prevenir, así como la pantalla que ve el paciente durante una teleconsulta.

 

 


Figura 1: a) Plataforma tecnológica a Prevenir©, b) Pantalla vista por el usuario de una teleconsulta de la plataforma a-Prevenir©.

3. METODOLOGÍA

3.1 Estímulos de voz

Para seleccionar los estímulos de voz empleados en las pruebas de inteligibilidad se realizó una búsqueda en la literatura especializada sobre corpus en español para uso audiológico. De esta búsqueda el material seleccionado fue el desarrollado por Aubanel V. et al (2014) [6]. Este corpus es una traducción al español de un material existente en inglés (Harvard Corpus) [7], contiene frases cotidianas que no solo fueron traducidas sino adaptadas al español, el material final se denominó: Sharvard Corpus [6].

El Sharvard Corpus es un material de voz que cuenta con 700 frases fonéticamente balanceadas, este material está disponible en línea, además cuenta también con grabaciones realizadas por dos oradores: hombre y mujer. Una de las características de este material es que está fonéticamente balanceado, es decir, se encuentran todos los fonemas del idioma español.

3.2 Señales de ruido

Las señales de ruido emitidas durante la teleconsulta fueron de naturaleza distinta: voces hablando simultáneamente, ruido de vehículos y ruido de maquinaria. Los ruidos utilizados son grabaciones reales tomadas de la norma [8], los cuales se encuentran disponibles en Internet1. El nivel de ruido fue de 60 dB y fue medido previo a la prueba de inteligibilidad.

3.3 Participantes

Participaron 13 voluntarios (4 mujeres y 9 hombres), todos reportaron una audición normal. La edad de los participantes oscila entre los 26 y 46 años, con una edad promedio de 34.6 años. Los sujetos no estaban familiarizados con las frases de la prueba. Para todos los escuchas el idioma castellano es su lengua materna. Ninguno de los sujetos tenía experiencia en pruebas psicoacústicas.

3.3 Pruebas de inteligibilidad

Previo a la prueba, los participantes respondieron un test de audición mediante el cual se pudo examinar si tenían pérdida auditiva. Solo se consideraron personas sanas auditivamente.

Las pruebas se realizaron en un kiosco de teleconsulta enfocada a enfermedades crónico-degenerativas, se utilizó la plataforma a-Prevenir® desarrollada en el CICESE. El orador, ubicado en la posición del médico (físicamente en CICESE Ensenada, Baja California), emitió una lista de frases [4]. El oyente, ubicado en la posición del paciente (físicamente en CICESE – Unidad Monterrey), repitió las frases emitidas por el orador, las cuales fueron grabadas para su posterior análisis.

Durante las pruebas se utilizaron los siguientes ruidos como disturbios acústicos: conversaciones simultáneas, ruido de tránsito vehicular, ruido de maquinaria [5]. Estas señales se reprodujeron a través de un altavoz ubicado detrás del paciente a un nivel aproximado de 60 dB.

4. RESULTADOS

En la siguiente gráfica se muestran los resultados obtenidos:

Figura 2: Porcentaje de palabras entendidas correctamente durante una teleconsulta utilizando un kiosco de teleconsulta considerando condiciones acústicas adversas. La desviación estándar se muestra entre paréntesis.


5. CONCLUSIONES Y PROPUESTAS

  • La inteligibilidad del habla resulta más afectada por señales de ruido con mayor contenido en bajas frecuencias (ruido de vehículo), que por aquellas con un contenido mayor en altas frecuencias (ruido de maquinaria).
  • La inteligibilidad del habla se ve más afectada cuando están presentes conversaciones simultáneas durante una teleconsulta.
  • El ambiente acústico tiene una influencia significativa en la inteligibilidad del habla durante una teleconsulta. Sin embargo, aún sin disturbio acústico, la inteligibilidad no resulta óptima. Por lo tanto, cuando se despliega un kiosco para teleconsulta en un área abierta, se debe considerar en el diseño del sistema de audio aspectos como el tipo de micrófonos, altavoces y su ubicación en el kiosco.

De estas conclusiones se hacen las siguientes propuestas para mejorar la inteligibilidad y la experiencia en el uso de un kiosco para teleconsulta:

  • El ambiente acústico tiene una influencia significativa en la inteligibilidad del habla durante una teleconsulta. Sin embargo, aún sin disturbio acústico, la inteligibilidad no resulta óptima. Por lo tanto, cuando se despliega un kiosco para teleconsulta en un área abierta, se debe considerar en el diseño del sistema de audio aspectos como el tipo de micrófonos, altavoces y su ubicación en el kiosco.
  • Tanto los altavoces como los micrófonos deben tener una respuesta en frecuencia plana, para que no exista coloración en ninguna frecuencia particular.
  • Cuidar la colocación del altavoz con la finalidad de evitar el contacto directo de éste con la estructura metálica del sistema, para evitar que las vibraciones interfieran con la señal de voz y se generen resonancias al interior de la cavidad que las contiene.

Footnote

1Disponible en: http://docbox.etsi.org/stq/Open/TS%20103%20224%20Background%20Noise%20Database/ (última fecha de consulta: 01 Junio 2018).

6. REFERENCIAS

  1. Organización Mundial de la Salud. Marco de implementación de un Servicio de Telemedicina. Disponible en: http://www.salud.gob.ar/telesalud/sites/default/files/marco-servicio-telemedicina.pdf. Consultado el 5/junio/2018.
  2. Hersh W. R., Hickam, D. H., Severance, S. M., Dana, T. L., Krages, K. P., Helfand, M. (2006). Telemedicine for the medicare population: update. Evid Rep Technol Assess (Full Rep), 131, 1-41.
  3. World Health Organization. Disponible en: http://www.who.int/chp/chronic_disease_report/part1/en/. Consultado el 5/junio/2018.
  4.  Isbert, A. C. (1998). Diseño acústico de espacios arquitectónicos. Ed. Alfaomega.
  5.  Plataforma tecnológica a Prevenir©. Disponible en: https://www.youtube.com/watch?v=my5IdWTgkZk. Consultado el 5/junio/2018.
  6. Aubanel, V., Garcia Lecumberri, M. L., Cooke, M. The Sharvard corpus: A phonemically-balanced Spanish sentence resource for audiology. International Journal of Audiology, Vol. 53, No. 9, pp. 633 – 638, 2014.
  7. 297-1969 - IEEE Recommended Practice for Speech Quality.
  8. ETSI TS 103 224 V1.1.1 (2014-08). Speech and multimedia Transmission Quality (STQ); A sound field reproduction method for terminal testing including a background noise database.