Probablemente no, al menos a corto plazo, pero la transcripción por voz es ya una herramienta muy potente para determinadas tareas.
Obtener un texto bien puntuado, sin erratas ni faltas de ortografía y completamente fiel al mensaje dictado por voz está muy cerca de convertirse en una realidad gracias, sobre todo, a Whisper, el modelo de Reconocimiento Automático del Habla (ASR) de código abierto lanzado por OpenIA en septiembre de 2022. La tercera generación de este software gratuito, Whisper V3, soluciona muchos de los fallos que presentaba en los inicios y que todavía son un quebradero de cabeza para otras herramientas similares.
Los más comunes de esos fallos, como pueden ser confundir palabras con fonética parecida o colocar mal los signos de puntuación, obligan a invertir una gran cantidad de tiempo en revisar el resultado y hacer las correcciones necesarias. Por eso, aunque Whisper no es ni mucho menos perfecto, sí representa un importante avance en el mundo de los transcriptores por voz.
Además, las preferencias para comunicarse entre las generaciones más jóvenes se orientan hacia la grabación de mensajes por voz en lugar de los escritos. De hecho, cada vez es más habitual comunicarse intercambiando mensajes de audio algunos, incluso, de muy larga duración. Por ello, la propia aplicación de WhatsApp planea incluir un transcriptor de audio a texto que evitaría tener que escuchar estos largos mensajes.
Por tanto, el uso de la voz para generar texto es un hecho, nos guste o no. Pero ¿va más allá de los mensajes coloquiales, las reflexiones espontáneas o los recordatorios? ¿Acabará este hábito transformando el teclado de escritorio en un recuerdo vintage?
El dictado por voz es útil para plasmar ideas, pero los textos más elaborados requieren concentración
Buena parte de la respuesta no se encuentra únicamente en el desarrollo tecnológico, sino en la manera en que funciona nuestro cerebro. No pensamos como hablamos y, mucho menos, hablamos como escribimos. Por una parte, la comunicación oral lleva implícita la improvisación, que no siempre es posible o recomendable. Por eso, mensajes complejos como discursos, artículos, agradecimientos o ponencias se trabajan de forma escrita, con una reflexión previa que facilita encontrar las palabras exactas en cada momento. Por su parte, el dictado por voz puede resultar útil para generar borradores o plasmar ideas, pero los textos más elaborados requieren concentración y solo la escritura brinda la oportunidad de pensar antes de expresar.
Con estas salvedades, las ventajas de la transcripción automática por voz son muy numerosas. Desde herramientas pensadas para la accesibilidad de personas con discapacidades motoras o auditivas (escritura dictada o generación automática de subtítulos), hasta transcripciones de entrevistas o reuniones de trabajo. También puede resultar muy útil para estudiantes a la hora de convertir en texto las explicaciones de los profesores, aunque en este punto no debemos descuidar los grandes beneficios que aporta la escritura manual al desarrollo intelectual de los más jóvenes.
Por tanto, ¿desaparecerán los teclados de PC de los escritorios? A corto plazo no lo harán, pero su uso se irá viendo modificado conforme se desarrolle el potencial de la transcripción de voz.
© Imágenes: Shutterstock.
Mutua Madrileña no se hace responsable del producto objeto de la presente entrada ni de las consecuencias de cualquier acción realizada en base a la información proporcionada. Esta información, obtenida de fuentes públicas, no supone, en absoluto, una recomendación de compra ni garantiza la calidad, disponibilidad y/o accesibilidad de los productos indicados.
Blog ÓN
Comité de contenidos