Facebook crea un conjunto de datos de código abierto para reducir el sesgo de la IA

Facebook podría usar algunas buenas relaciones públicas después de las últimas noticias que revelaron que la compañía de redes sociales permitió que se robaran los datos de millones de clientes. Para enderezar un poco la nave, Facebook ha creado un conjunto de datos de código abierto que cree que disminuirá el sesgo de la IA.

Facebook tiene como objetivo corregir el sesgo de la IA

Un problema existente con el reconocimiento facial ha sido el sesgo de la IA. Si bien la inteligencia artificial intenta identificar a las personas a través de sus rasgos faciales únicos, históricamente no le va bien con las personas que no son hombres ni personas blancas.

Facebook se ha propuesto corregir el sesgo de la IA con su conjunto de datos de código abierto, lo llama «Conversaciones casuales». Incluye 45,186 videos de más de 3,000 personas que tienen una conversación sin guión. Los participantes son de diferentes géneros, grupos de edad y tonos de piel.

Multitud de Facebook Ai Basis

Se les pagó a los actores para que enviaran videos que incluían sus propias descripciones de edad y género para eliminar la mayor cantidad posible de bases de inteligencia artificial. Luego, el equipo de Facebook los etiquetó por tono de piel según la escala de Fitzpatrick que examina seis tonos de piel.

También se observó que la iluminación mostraba diferentes tonos de piel en situaciones de poca luz. La IA de audio y visual se puede probar con el conjunto de datos de Casual Conversations. El propósito no es desarrollar algoritmos, sino evaluar el desempeño de los algoritmos con diferentes caras.

Dos de los conjuntos de datos utilizados actualmente para el reconocimiento facial, UB-A y Adience, estaban compuestos principalmente por personas de piel blanca. UB-A utilizó el 79,6 por ciento de personas blancas, mientras que Adience utilizó el 86,2 por ciento.

Procesamiento de sesgo de Ai de Facebook

Aparte del tono de piel, los clasificadores de IBM, Microsoft y Face ++ funcionaron mejor con rostros masculinos que con voces femeninas en un estudio del MIT. Casi no hubo errores con los rostros masculinos blancos, mientras que los rostros femeninos más oscuros tuvieron una tasa de error de casi el 35 por ciento.

Casual Conversations tiene como objetivo ayudar a evaluar el algoritmo utilizado actualmente. “Nuestro nuevo conjunto de datos de Conversaciones Casuales debe usarse como una herramienta complementaria para medir la equidad de los modelos de audio y visión por computadora, además de las pruebas de precisión, para las comunidades representadas en el conjunto de datos”, dijo el equipo de Facebook que trabaja en el proyecto.

Evaluaciones de conversaciones casuales

Facebook usó Casual Conversations para probar los cinco algoritmos que habían ganado el Deepfake Detection Challenge en 2020. Este se desarrolló para identificar los medios manipulados que se estaban publicando.

Conjunto de datos de sesgo de inteligencia artificial de Facebook

A pesar de ser algoritmos muy respetados, lucharon con tonos de piel más oscuros. El ganador del tercer lugar en el desafío en realidad fue el mejor con Conversaciones casuales.

Facebook ya ha lanzado el conjunto de datos a la comunidad de código abierto. Al hacerlo, señaló que identifica los géneros de «masculino», «femenino» y «otro», y explicó que no puede identificar a los que se identifican como no binarios.

«Durante el próximo año, exploraremos vías para expandir este conjunto de datos para que sea aún más inclusivo, con representaciones que incluyan una gama más amplia de identidades de género, edades, ubicaciones geográficas, actividades y otras características», dijo Facebook sobre su esfuerzos para eliminar el sesgo de la IA.

Siga leyendo para conocer los esfuerzos de Microsoft para regular el reconocimiento facial para eliminar la base.

Categorías Hogar