Tutorial: Convertir voz a texto desde Python usando speechrecognition

El principal medio de comunicación de los seres vivos es a través de los sonidos, dicho sea de paso, la voz es el medio base de la comunicación humana.

A su vez, el ser humano debe poder comunicarse con los equipos electrónicos y de cómputo, con ello se usan los botones, pantallas de visualización, teclados, mouse, etc.

Pero pueden existir situaciones donde sea más rápido y factible entablar una comunicación verbal para dictar órdenes a una computadora o sistema.

Es mucho más sencillo darle la orden de voz a una computadora, por ejemplo, de buscar en Google “Busca recetas de cocina” que tener que abrir el navegador y teclear el comando de búsqueda.

La tecnología de reconocimiento o detección de voz es la encargada de leer datos de audio e identificar frases humanas en ellas, para después convertirlas en texto y comandos leíbles para una computadora.

Diversos sistemas de asistentes virtuales hacen uso de esta tecnología para entender las ordenes que les damos.

Lejano a lo que podrías imaginar, este tipo de tecnología es fácil de implementar en Python, y aquí te decimos como.

Instalación

Primero debemos instalar el módulo de reconocimiento de voz de Python, usando el siguiente comando:

pip install speechrecognition

También debemos instalar otro par de bibliotecas más, encargadas del proceso de escucha del audio:

pip install  pyaudio

pip install pyttsx3

Código

A continuación, te presentamos el código completo para convertir voz a texto, incluso a viceversa.

Sigue a Facialix en todas sus redes sociales:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

veinte + 3 =