Científicos: Algoritmo de IA mejora a los humanos al encontrar noticias falsas

¡Por favor comparta esta historia!
Los científicos de datos tecnócratas se están equivocando de árbol. Tenga en cuenta que nunca dicen que sus algoritmos de caja negra pueden encontrar la verdad, lo que lógicamente debería preceder al aislamiento de las falsedades. Sin embargo, su supuesto avance es aclamado como "una nueva arma en la lucha contra la desinformación". ⁃ Editor TN

Según una nueva investigación, un sistema basado en algoritmos que identifique señales lingüísticas reveladoras en noticias falsas podría proporcionar a los agregadores de noticias y sitios de redes sociales como Google News una nueva arma en la lucha contra la desinformación.

Los investigadores que desarrollaron el sistema demostraron que es comparable y a veces mejor que los humanos para identificar correctamente las noticias falsas.

En un estudio reciente, el sistema encontró falsificaciones con éxito hasta el 76 por ciento del tiempo, en comparación con una tasa de éxito humano del 70 por ciento. Además, su enfoque de análisis lingüístico podría usarse para identificar artículos de noticias falsas que son demasiado nuevos para desacreditar haciendo referencias cruzadas de sus hechos con otras historias.

Rada Mihalcea, profesora de ciencias de la computación e ingeniería en la Universidad de Michigan que está detrás del proyecto, dice que una solución automatizada podría ser una herramienta importante para los sitios que luchan por lidiar con una avalancha de noticias falsas, que la gente suele crear para generar clics o manipular la opinión pública.

Capturar historias falsas antes de que tengan consecuencias reales puede ser difícil, ya que los sitios de agregadores y redes sociales de hoy dependen en gran medida de editores humanos que a menudo no pueden mantenerse al día con la afluencia de noticias. Además, las técnicas actuales de desacreditación a menudo dependen de la verificación externa de los hechos, lo que puede ser difícil con las historias más recientes. A menudo, cuando una historia se demuestra como falsa, el daño ya está hecho.

El análisis lingüístico adopta un enfoque diferente, analizando atributos cuantificables como la estructura gramatical, la elección de palabras, la puntuación y la complejidad. Funciona más rápido que los humanos y se puede usar con una variedad de diferentes tipos de noticias.

"Se puede imaginar cualquier cantidad de aplicaciones para esto en el front o back end de un sitio de noticias o redes sociales", dice Mihalcea. “Podría proporcionar a los usuarios una estimación de la confiabilidad de las historias individuales o de un sitio de noticias completo. O podría ser una primera línea de defensa en la parte trasera de un sitio de noticias, marcando historias sospechosas para su posterior revisión. Una tasa de éxito del 76 por ciento deja un margen de error bastante grande, pero aún puede proporcionar información valiosa cuando se usa junto con los humanos ".

Los algoritmos lingüísticos que analizan el habla escrita son bastante comunes hoy en día, dice Mihalcea. El desafío de construir un detector de noticias falsas no radica en construir el algoritmo en sí, sino en encontrar los datos correctos para entrenar ese algoritmo.

Las noticias falsas aparecen y desaparecen rápidamente, lo que dificulta la recopilación. También viene en muchos géneros, lo que complica aún más el proceso de recolección. Las noticias satíricas, por ejemplo, son fáciles de recopilar, pero su uso de la ironía y el absurdo lo hacen menos útil para entrenar un algoritmo para detectar noticias falsas que están destinadas a engañar.

En última instancia, el equipo de Mihalcea creó sus propios datos, haciendo un crowdsourcing de un equipo en línea que realizó ingeniería inversa para verificar falsas noticias genuinas verificadas. Así es como se crean la mayoría de las noticias falsas, por personas que las escriben rápidamente a cambio de una recompensa monetaria, dice Mihalcea.

Los investigadores reclutaron participantes con la ayuda de Amazon Mechanical Turk y les pagaron para convertir noticias breves y reales en noticias similares pero falsas, imitando el estilo periodístico de los artículos. Al final del proceso, el equipo de investigación tenía un conjunto de datos de noticias reales y falsas de 500.

Luego alimentaron estos pares de historias etiquetadas a un algoritmo que realizó un análisis lingüístico, enseñándose a sí mismo a distinguir entre noticias reales y falsas. Finalmente, el equipo convirtió los algoritmos en un conjunto de datos de noticias reales y falsas extraídas directamente de la web, obteniendo el porcentaje de éxito 76.

Los detalles del nuevo sistema y el conjunto de datos que el equipo usó para construirlo están disponibles gratuitamente, y Mihalcea dice que los sitios de noticias u otras entidades podrían usarlos para construir sus propios sistemas de detección de noticias falsas. Ella dice que la incorporación de metadatos como los enlaces y comentarios asociados con una determinada noticia en línea podría perfeccionar aún más los sistemas futuros.

Los investigadores detallarán el sistema en un documento que presentarán en la 27 Conferencia Internacional sobre Lingüística Computacional en Santa Fe, Nuevo México.

Lea la historia completa aquí ...

Suscríbete
Notificar de
invitado

0 Comentarios
Comentarios en línea
Ver todos los comentarios