Por qué Twitter quiere que los piratas informáticos éticos corrijan sus sesgos algorítmicos



Twitter está aplicando el modelo de recompensa por errores al aprendizaje automático.

El sitio de microblogs ha lanzado el primer concurso de recompensas por sesgo algorítmico de la industria.

El desafío se creó para identificar posibles daños en los notorios algoritmo de recorte de imágenes, que fue abandonado en gran parte después de exhibir prejuicios basados ​​en el género y la raza.

La compañía ahora quiere incentivar a la comunidad para que encuentre más riesgos no identificados del algoritmo. Los ganadores del desafío recibirán premios en efectivo de hasta $ 3,500.

El concurso es el primero en el campo de los sesgos de la IA, pero los programas de recompensas tienen una larga historia en seguridad informática.

Jutta Williams, Gerente de Producto de Twitter META (Ética, Transparencia y Responsabilidad del Aprendizaje Automático), dijo a TNW que la iniciativa se inspiró en cómo las comunidades de investigación y piratas informáticos ayudan al campo de la seguridad:

Twitter siempre ha sido moldeado por las personas que lo usan y lo conocen mejor, por lo que queremos cultivar una comunidad similar, centrada en la ética del AA, para ayudarnos a identificar una gama más amplia de problemas de los que podríamos identificar por nuestra cuenta. Con este desafío, nuestro objetivo es sentar un precedente en Twitter y en la industria para la identificación proactiva y colectiva de los daños algorítmicos.

Aprovechando la comunidad

La iniciativa no es la primera vez que Twitter busca el apoyo de la comunidad para mitigar los daños algorítmicos.

En mayo, el equipo de META compartió su investigación y código sobre los sesgos del algoritmo de recorte de imágenes para que otros pudieran investigar el problema.

El algoritmo de recorte estima lo que la gente quiere ver primero dentro de una imagen. Este cálculo determina cómo se recorta una imagen a un tamaño fácilmente visible.

El modelo se entrenó con datos de seguimiento ocular humano para predecir una puntuación de prominencia en todas las regiones de una imagen. A continuación, elige el punto con la puntuación más alta como centro del cultivo.

Después de recibir comentarios de que el algoritmo no sirvió a todas las personas de manera equitativa, Twitter analizó el modelo en busca de sesgos. Los investigadores descubrieron problemas subyacentes que favorecían a los blancos sobre los negros.

«Queremos llevar este trabajo un paso más allá al invitar e incentivar a la comunidad para que ayude a identificar los daños potenciales de este algoritmo más allá de lo que nosotros mismos identificamos «, dijo a TNW Rumman Chowdhury, jefe del equipo META de Twitter.

En el desafío, los participantes tendrán acceso a la prominencia de Twitter. modelo y el código utilizado para generar un recorte de una imagen. Su misión es demostrar los daños potenciales que puede producir un algoritmo de este tipo.

Estándares democratizadores

Un objetivo clave del concurso es desarrollar estándares impulsados ​​por la comunidad y mejores prácticas para evaluar modelos de AA. En particular, Twitter ha creado una rúbrica de calificación que articula los daños algorítmicos de una manera que no existía anteriormente.

Ya existe una gran comunidad de hackers de IA éticos a los que Twitter espera aprovechar. Históricamente, sin embargo, no se les ha incentivado para hacer este tipo de trabajo de la misma manera que los piratas informáticos de seguridad de sombrero blanco.

«De hecho, la gente ha estado haciendo este tipo de trabajo por su cuenta durante años, pero no se les ha recompensado ni pagado por ello», dijo Chowdhury.

El La introducción de recompensas monetarias agregará más estímulo.

Por último, Chowdhury quiere fomentar un enfoque más inclusivo y proactivo para mitigar los riesgos algorítmicos:

Los programas de recompensas como este son fundamentales para ayudar a crear conciencia sobre los daños y sesgos que pueden existir en los algoritmos que están más allá de nuestro alcance actual de experiencias vividas y comprensión. También invitamos a un una gama de perspectivas más amplia de la que es posible en un equipo o en una empresa; Queremos abrir líneas de comunicación a nivel mundial y proporcionar una plataforma e incentivo para que más personas se comprometan.

El desafío está abierto para inscripciones hasta las 11:59 p.m. (hora del Pacífico) del 6 de agosto. Los ganadores serán anunciados en el taller DEF CON AI Village el 8 de agosto. Cualquiera que tenga una cuenta HackerOne puede participar en el concurso.

¡Saludos humanoides! ¿Sabías que tenemos un boletín informativo sobre IA? Puedes suscribirte aquí mismo.



Fuente: TNW

Compartir:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver Política de cookies
Privacidad