Ciencia y Tecnología

El grupo de investigación Sistemas de Acceso Inteligente a la Información (SINAI) de la Universidad de Jaén ha desarrollado un sistema basado en inteligencia artificial para identificar mensajes misóginos y xenófobos en Twitter.

Este método puede utilizarse en ámbitos como el policial y el jurídico para localizar mensajes de odio, así como para moderar el lenguaje de los tuits generados en la red social, se detalla en un reportaje de Nova Ciencia de España https://novaciencia.es/un-rastreador-inteligente-identifica-tuits-ofensivos-contra-mujeres-y-migrantes/

El programa se basa en algoritmos de aprendizaje automático, entre ellos, las redes neuronales, estructuras que imitan el funcionamiento del cerebro humano y que ‘aprenden’ a identificar los matices de los mensajes.

Los expertos apuntan que esta tecnología distingue el contenido ofensivo y las ambigüedades del lenguaje para detectar mensajes de odio en Twitter. Añaden que el sistema podría utilizarse como un medio de alerta para la detección de comentarios que inciten al odio y a la violencia hacia las mujeres y migrantes.

Para identificar el discurso ofensivo los investigadores utilizan redes neuronales, que funcionan como lo hace el cerebro: conectan nodos que interpretan la información y la ordenan. Se trata de un sistema inteligente que, a partir de unos datos de entrenamiento compuestos por insultos, términos y expresiones peyorativas, ‘aprende’ los patrones y estructura del lenguaje para predecir nuevos tuits y distinguir aquellos que sean agraviantes.

“En ciertas frases hay pronombres o determinantes que son esenciales y que pueden cambiar completamente el sentido de una expresión. Con nuestro sistema y la ayuda de los recursos lingüísticos es posible identificar las expresiones referidas al discurso de odio”, explica a la Fundación Descubre la investigadora de la Universidad de Jaén Flor Miriam Plaza.

En el estudio, titulado ‘Detecting Misogyny and Xenophobia in Spanish tweets using language technologies’ y publicado en ACM Transactions on Internet Technology, los investigadores explican que para ‘instruir’ al sistema generaron de forma semiautomática cuatro listas de palabras en castellano formadas por expresiones, insultos y palabras ofensivas hacia las mujeres y migrantes.

últimas Noticias
Noticias Relacionadas