Una de las profesiones con más futuro en la actualidad es ser filólogo. Y sí, hijo, menos mal que no me hiciste caso cuando te decía que estudiaras otra cosa, que qué ibas a hacer en la vida siendo filólogo.

La Lingüística Computacional es la rama de la Lingüística que se dedica al procesamiento del lenguaje natural a través de los ordenadores, es decir, la disciplina que se encarga de conseguir que un ordenador pueda entendernos cuando le hablamos. Quizás, a simple vista, parezca sencillo, pero que una máquina entienda a un adolescente murciano, a un taxista de Vallecas o a un youtuber no tiene que ser nada fácil. Imagínense ustedes intentando explicar a un ordenador que el «ejke» de un madrileño es igual que el «eske» de un palentino y también que el «eke» de un gaditano.

Estamos hablando de lo que se llama ASR (Automatic Speech Recognition) lo que supone solo una tercera parte de las competencias de un asistente de voz. Es el componente de entrada de voz y salida de texto, por ejemplo, para que nosotros hablemos y el teléfono escriba un mensaje de whatsapp. Aún no nos hemos asomado a la gramática, porque una vez que hemos conseguido convertir la voz en texto, viene otro problema: ¿Ahora cómo consigo que el ordenador entienda lo que quiero decir con «busca vídeos de cocina»?

En cada idioma, además, hay que encontrar la forma de que el ordenador sepa que tiene que hacer lo mismo tanto le digamos «buscar» como «busca, búscame, quiero que busques, quiero que me busques» y otra infinidad de variaciones que se han de interpretar como idénticas.

Esta parte de la gramática suele denominarse NLU (Natural Language Understanding) y es la que se ocupa de dotar de significado e intención a la entrada de texto que nos dio el motor de ASR. Con esto, hemos visto aproximadamente el 50% de las tareas de un lingüista en un asistente. Así que sí, ya ven, montones y montones de trabajo para los lingüistas. Una buenísima noticia.