Por qué la IA y la percepción humana son demasiado complejas para compararlas


Desempeño a nivel humano. Precisión a nivel humano. Esos son términos que escucha mucho de las empresas que desarrollan sistemas de inteligencia artificial, ya sea en reconocimiento facial, detección de objetos o respuesta a preguntas. Y para su crédito, en los últimos años se han visto muchos productos excelentes impulsados ​​por algoritmos de inteligencia artificial, principalmente gracias a los avances en el aprendizaje automático y el aprendizaje profundo.

Pero muchas de estas comparaciones solo tienen en cuenta el resultado final de probar los algoritmos de aprendizaje profundo en conjuntos de datos limitados. Este enfoque puede crear falsas expectativas sobre los sistemas de inteligencia artificial y producir resultados peligrosos cuando se les confían tareas críticas.

En un estudio reciente, un grupo de investigadores de diversas organizaciones y universidades alemanas ha destacado los desafíos de evaluar el desempeño de aprendizaje profundo en el procesamiento de datos visuales. En su artículo, titulado «La notoria dificultad de comparar la percepción humana y mecánica”, Los investigadores destacan los problemas en los métodos actuales que comparan redes neuronales profundas y el sistema de visión humana.

En su investigación, el científico realizó una serie de experimentos que excavan debajo de la superficie de los resultados del aprendizaje profundo y los comparan con el funcionamiento del sistema visual humano. Sus hallazgos son un recordatorio de que debemos ser cautelosos al comparar la IA con los humanos, incluso si muestra un rendimiento igual o mejor en la misma tarea.

[Leer:[Read:Una introducción al aprendizaje de una sola vez]

La complejidad de la visión humana y por computadora

En la búsqueda aparentemente interminable de reconstruir la percepción humana, el campo que se ha conocido como visión por computador, el aprendizaje profundo hasta ahora ha dado los resultados más favorables. Redes neuronales convolucionales (CNN), una arquitectura que se usa a menudo en los algoritmos de aprendizaje profundo de visión por computadora, está logrando tareas que eran extremadamente difíciles con el software tradicional.

Sin embargo, comparar las redes neuronales con la percepción humana sigue siendo un desafío. Y esto se debe en parte a que todavía tenemos mucho que aprender sobre el sistema de visión humano y el cerebro humano en general. El complejo funcionamiento de los sistemas de aprendizaje profundo también agrava el problema. Redes neuronales profundas trabajar de formas muy complicadas que a menudo confunden a sus propios creadores.

En los últimos años, una serie de investigaciones ha intentado evaluar el funcionamiento interno de las redes neuronales y su solidez para manejar situaciones del mundo real. “A pesar de una multitud de estudios, comparar la percepción humana y la de las máquinas no es sencillo”, escriben los investigadores alemanes en su artículo.

En su estudio, los científicos se centraron en tres áreas para evaluar cómo los humanos y las redes neuronales profundas procesan los datos visuales.

¿Cómo perciben las redes neuronales los contornos?

La primera prueba implica la detección de contornos. En este experimento, tanto los humanos como los participantes de la IA deben decir si una imagen contiene un contorno cerrado o no. El objetivo aquí es comprender si los algoritmos de aprendizaje profundo pueden aprender el concepto de formas cerradas y abiertas, y si pueden detectarlas en diversas condiciones.

ejemplo de contorno