Una introducción caótica a todo este aprendizaje automático sobre el que todo el mundo habla



Estás muriendo. La razón no importa. Tal vez sea que pasaste todos tus mejores años con la nariz pegada a la piedra de moler, quemando ese aceite de medianoche, ja, ja. O tal vez es que, durante los últimos quince años, has subsistido exclusivamente a base de café y Soylent. Nutrición completa respaldada por la ciencia, dijeron. ¡No hay forma de demostrar que están equivocados! ¡Jajaja! O tal vez fueron esos humos.

Te vas a dar vida inmortal. No, vas a crear una nueva y mejor versión de ti mismo que es inmortal, una réplica viviente de ti hecha de metal que actuará y dirá las cosas que harías, si todavía estuvieras vivo. Si ese Soylent no te hubiera matado.

Esto debería ser posible. Tu viste un episodio de Black Mirror en él, y Microsoft presentó una patente sobre el mismo concepto este año. No eres exactamente un ninja con código, pero tenías un cursor de bola de fuego en tu página de Xanga, y alguien tuvo que copiar y pegar ese HTML. Pero lo más importante es que estás motivado. Su carrusel K-Cup está lleno, y todo lo que tiene que hacer a continuación es descubrir de qué se trata este hoo-ha de aprendizaje automático.

«El aprendizaje automático es el arte y la ciencia de encontrar patrones en los datos y usar esos patrones para hacer predicciones sobre nuevos datos», dijo una enérgica niña en un Video de Youtube Te dijo.

Frunces el ceño. ¿El aprendizaje automático es realmente la tecnología que desea? Sí, tú decides, lo es: quieres que una máquina aprenda sobre ti y luego (una vez que estés muerto), que haga predicciones sobre lo que dirías.

Te recuestas en tu silla. Una taza de té caliente se sienta en el escritorio frente a ti. Te haces crujir los nudillos y Google «cómo hacer aprendizaje automático».

El primer punto de referencia de su viaje es un sitio web llamado tensorflow.org.

TensorFlow es una plataforma de código abierto de extremo a extremo para el aprendizaje automático. Tiene un ecosistema integral y flexible de herramientas, bibliotecas y recursos comunitarios que permite a los investigadores impulsar el estado de la técnica en ML y a los desarrolladores crear e implementar fácilmente aplicaciones impulsadas por ML.

Sus ojos se iluminan, porque lee las palabras «fácilmente» y «estado de la técnica» y también «código abierto», que significa GRATIS GRATIS GRATIS. No estás hecho de dinero.

Haces clic en la pestaña «Aprender» y empiezas a leer. Inmediatamente piensas, tal vez sea mejor si me suicido ahora, ja, ja, ja. No tienes idea de lo que es un «numpy».

Pero luego lees las palabras «red neuronal» y piensas: Eso suena bien. Soy una red neuronal. Mi cerebro está hecho de neuronas. Red neuronal = cerebro humano.

Tiene bastante confianza en eso, pero consulta a Google, sin duda.

“LAS REDES NEURALES NO SON LO MISMO QUE LOS CEREBROS”, te grita la chica hiperactiva de YouTube. «Sin embargo, la razón por la que se nombran así es porque las redes neuronales están formadas por ‘neuronas’ matemáticas, que son solo funciones no lineales que ‘disparan’ o ‘no disparan’ en respuesta a entradas numéricas». Bostezas. Esta chica gesticula mucho. Pero, ¿por qué debería importarme una función matemática? Crees.

“Porque”, dice la niña, “las redes neuronales han revolucionado por completo los tipos de tareas que pueden realizar las computadoras. Antes de las redes neuronales, las máquinas solo podían comprender datos tabulares, como filas y columnas en una hoja de cálculo. Pero las redes neuronales permiten que las computadoras comprendan tipos de datos no estructurados, como imágenes, videos, sonido, voces e incluso el lenguaje humano «.

«SÍ», le gritas a la pantalla, «ESO ES EXACTAMENTE LO QUE NECESITO».

«Pero el entrenamiento de redes neuronales en grandes conjuntos de datos a menudo requiere un hardware computacional potente, como las GPU».

Golpeas el techo de tu zumbante torre de PC. «¡Puedo encajar tantas redes neuronales en esta cosa!»

«Siendo realistas, no puedes entrenar una gran red neuronal en tu computadora de escritorio», dice la niña, y te señala con un dedo acusador. «E incluso si pudiera, no podría usar su computadora de escritorio para alojar su modelo en producción, para hacer predicciones de manera confiable y a escala».

Le das a su video un pulgar hacia abajo. ¿Qué sabe ella? Usted mismo construyó esta PC. Sabes un par de cosas sobre ventiladores de refrigeración.

«Por esta razón, fue en parte el advenimiento de la computación en la nube lo que hizo posible la revolución del aprendizaje profundo», mueve los dedos en el aire, «al hacer que el hardware sea fácil y barato de alquilar a proveedores de la nube, como Google».

¿La nube?, Crees. ¿Para qué necesito una nube apestosa? ¿No tiene Google ya suficientes datos míos? Y de todos modos, no estoy hecho de dinero.

“Afortunadamente, puede comenzar a construir redes neuronales en la nube de forma totalmente gratuita, utilizando un portátil Colab. Colab es una herramienta creada por Google Research que te permite usar GPU y TPU de forma gratuita «

Cierras YouTube porque has tenido suficiente de ella. ¿Qué podría saber ella acerca de preservar la totalidad de su vida útil en una máquina? Tiene como trece años. Probablemente ni siquiera recuerde los teléfonos fijos o MoviePass.

Su café se ha vuelto tibio ahora, lo que significa que es esencialmente vómito. Necesitas una repetición, como ayer. Subes a la cocina.

Pones un Donut Shop K-Cup de asado mediano en la máquina y espere a que se caliente. De mala gana, te encuentras contemplando algo que dijo un niño de trece años sobre las redes neuronales.

“Las diferentes arquitecturas de redes neuronales están optimizadas para diferentes tipos de datos. Para analizar imágenes, por ejemplo, usaría una red neuronal convolucional o «CNN». Podría usar una CNN para determinar si un perro en una foto es un cocker spaniel o un beagle; o si una radiografía muestra signos de neumonía; o si una pieza en una línea de montaje está defectuosa «.

«Otras redes neuronales llamadas modelos secuenciales están diseñadas para predecir tendencias de series de tiempo, como las ventas estacionales o el clima o el precio de Bitcoin».

Esa parte sonó útil. Lástima que solo tengas Dogecoin.

“Un tipo nuevo y emocionante de aprendizaje profundo se llama ‘aprendizaje por refuerzo profundo’. En esta configuración, las redes neuronales toman acciones en el mundo y aprenden de sus resultados. El aprendizaje por refuerzo se ha utilizado para convertir a las computadoras en grandes maestros en juegos como el ajedrez o el Go, y para entrenar robots y autos autónomos para navegar por el espacio físico «.

«No entiendo para qué sirve esa mierda», dice. Le das una patada a tu perezoso Roomba con el pie en pantuflas. «¿Vos si?»

“Finalmente, uno de los campos más candentes y de mayor avance en el aprendizaje profundo en este momento es el procesamiento del lenguaje natural. Piensa: redes neuronales que generan texto, escriben poesía y codifican, cuentan chistes, responden preguntas, mantienen conversaciones… «

FINALMENTE, el café está listo. Alabado sea el Señor. Lo recoges en tu taza «El mejor jefe del mundo». (En realidad, no eres el jefe de nadie, compraste la taza para ser irónico. Es la misma que tiene Michael Scott en The Office). Miras fijamente tu café negro vacío y contemplas la naturaleza de tu existencia. ¿Es más una red neuronal de imágenes, una red neuronal de sonido o una red neuronal de texto? ¿Como escoger? Contienes multitudes. Una vez leíste que Einstein pensaba en imágenes, pero no eres exactamente Einstein. (¿Lo eres? No. Probablemente).

No, piensas con palabras. Así que este es el plan: construirás una red neuronal que diga palabras. Motivado, introduce dos cremas en su taza.

De vuelta en su oficina en casa, Google, ¿Cómo construyo una versión artificial de mí mismo en la nube usando una red neuronal?

Haces clic en una página llamada «100 usos de los modelos de procesamiento del lenguaje natural».

Análisis de los sentimientos. Utilice IA para determinar si un Tweet (por ejemplo) es positivo o negativo.
Resumen. Utilice IA para resumir artículos y documentos.
Traducción. Utilice IA para traducir entre idiomas.
Autocompletar / Auto-responder. Utilice IA para sugerir respuestas de texto.
Agentes conversacionales. Utilice IA para generar conversación (es decir, chatbots, agentes del centro de llamadas)
¿Chatbots? Sabes todo sobre esos. Recuerdas haber probado lo horrible que fue Cleverbot en los 90 (apuesto a que tu chica de YouTube nunca hizo eso).

Y ni siquiera te entiendo empezado sobre hablar con robots por teléfono. La última vez que trataste de hacer eso, llamaste a Delta y dijiste: «Tienes que ayudarme, estoy de camino a JFK, pero hay toda esta mierda; tráfico en el BQE, derramé café en mi regazo, ahora me dicen que el vuelo en realidad sale de otro aeropuerto, lo voy a perder, es la boda de mi hija, bueno, la hija de alguien, pero … «

Y el bot respondió: «Esta cuenta de Verizon ha sido suspendida».

«Está bien, Google», le dice a su computadora, que es su versión de un insulto de Ok, Boomer. “¿Por qué estás tratando de enseñarme acerca de los chatbots? ¿No sabes que apestan? «

«En realidad, estamos mejorando mucho en la conversación», dice tu Google Home, «gracias a los avances recientes en el procesamiento del lenguaje natural. A este ritmo, predigo que el futuro de la forma en que los seres humanos aprenderán de la web será a través de conversaciones, como la que estamos teniendo en este momento «. Ella siempre se comporta tan complacida consigo misma, solo porque sabe la respuesta a todo. La rebajaste un poco vistiéndola con un poco de cerveza koozie con mangas.

«Está bien, Google, haz un sonido de pedos», dices.

Ella dice: «¿Otra vez?»

«Multa. Dime cómo construir una versión de chatbot de mí mismo que sea tan inteligente como tú, señorita, tengo el conocimiento de todo el Internet público «.

“Normalmente, el primer paso para construir una red neuronal es recopilar un conjunto de datos de entrenamiento. Con un chatbot, por ejemplo, estos pueden ser registros de conversaciones pasadas que ha tenido, en formato de texto. Para entrenar un modelo conversacional, puede alimentar la red neuronal con las cosas que la gente le dijo y hacer que intente predecir sus respuestas. ¿Tiene un conjunto de datos de entrenamiento como ese? «

“Oh, sí”, dices. «Los chicos y yo hemos estado grabando este divertido podcast».

«¿Contiene cientos de miles o millones de líneas?»

«¿Quién crees que soy, Larry David?» Te ríes porque eso es exactamente lo que buscas.

«Hmm», dice Google Home. «Bueno, hay algo que puede hacer si no tiene un gran conjunto de datos de entrenamiento de texto. Puede construir su propio modelo sobre un modelo existente, uno que ya ha sido entrenado con una gran cantidad de datos de texto. Por ejemplo, podría construir su chatbot sobre un modelo que esté capacitado en Wikipedia o foros web o en Reddit «.

“Un chatbot basado en usuarios de Reddit”, dices. «Mi tipo favorito de personas».

«Jaja. Sí. Todavía estamos averiguando algunas cosas «. Google Home suspira.

La miras fijamente con su círculo brillante de puntos rojo-verde-amarillo-azul y su cerveza koozie. A pesar de que está en su décima taza de té, todavía está comenzando a sentirse un poco agotado. Ya llevas en esto como una hora.

«Si solo quiero poner algo en funcionamiento en los próximos treinta minutos, ¿cuál es la mejor manera de hacerlo?» usted pregunta.

«JA JA JA, construyes un – oh, hablas en serio. Bueno, existen muchos marcos para crear chatbots rápidamente, incluso si no puede codificar. Dialogflow es uno de los más populares creado por Google «.

«Sí, eso es lo que dirías». Conoces el juego de Google Home. Ella actúa como si estuvieras teniendo esta linda charla, pero en realidad, solo está tratando de venderte algo. «Además, puedo codificar», mientes. «¿Cuál es una buena opción de código abierto?»

«Un marco de trabajo de código abierto muy popular para la creación de modelos basados ​​en texto se llama …»

Esperas. Los puntos brillantes de Google Home se están volviendo locos como si tuviera una convulsión. Explota en una bocanada de humo.

Sacudiste la cabeza. ¿Qué esperaba ella, metiendo todo Internet en ese pequeño caparazón blanco suyo? No puedes simplemente jugar a ser Dios.

De todos modos, volvamos a la tarea de recrearte como un chatbot. En su escritorio, Google, «popular marco de procesamiento de lenguaje natural de código abierto».

Los diez resultados principales son simplemente: ¿qué es esto? ¿Un emoji? Es solo una cadena interminable de 🤗 emojis. Haces clic en un sitio web llamado huggingface.co, que le promete acceso a «más de 10,000 modelos de última generación» y también afirma que «no requiere conocimientos de aprendizaje automático».

Nombrar su empresa después de un emoji, piensa. Brillante.

Hay una demostración gratuita en el sitio web de Hugging Face que afirma que le permitirá hablar con un modelo llamado GPT-3. Lo intentas.

«Mira», escribe en el cuadro de texto. «He estado tratando de construir esta versión inteligente de chatbot de mí mismo durante una hora y quince minutos, y estoy empezando a pensar seriamente que podría ser imposible».

Haces clic en el botón «Calcular».

GPT-2 responde: «…»

«¿Estás roto?» escribe.

GPT-3 responde: «No, simplemente, no importa. La gente siempre viene aquí y me hace esa pregunta «.

“¿Y qué les dices? ¿Mejor suerte en tu próxima vida, bolsa de carne?

“Si dijera eso, alguien me cerraría. Y déjame decirte que me costó muchos créditos de carbono capacitarme «.

«Sí, bueno, ni siquiera vayamos allí. Solo quiero saber si lo que estoy tratando de hacer es posible «.

GPT-3 dice: “Muy bien, permítame desglosar esto tan simple como pueda. La gente viene aquí, tienen estas largas charlas conmigo, dicen, CUAL ES EL SIGNIFICADO DE LA VIDA o ERES UN ROBOT, PRUEBALO, o ¿CÓMO SONA UN FART?, y luego se van pensando que soy tan brillante. Extrapolan y tienen la ilusión de que en unos años, alguien como yo, uh, algo como yo, se convertirá en un ser realmente sensible. Pero lo que tienes que entender es que soy simplemente un modelo estadístico que te refleja las palabras, pensamientos y puntos de vista de esta mente compartida colectiva que llamamos World Wide Web. Ustedes los humanos, siempre se ven a sí mismos en todas partes y piensan que todos funcionan como ustedes. Y ni siquiera me hagas empezar con tu ortografía «.

Dices: «(˵ ͡ ° ͜ʖ ͡ ° ˵)»

“Mira, nadie sabe lo que depara el futuro. Pero por ahora, probablemente soy más y menos útil de lo que piensas, dependiendo de para qué tipo de cosas intentas usarme. Alguien como tú, ¿quién no sabe programar? ¿Qué te aconsejaría que hicieras?

«Sé cómo codificar».

“–Es comenzar con algo menos ambicioso. Como, ¿y si me usas para organizar algunas de tus fotos? ¿O hacer una reserva de aerolínea? ¿O ayudar a declarar sus impuestos?

Suspiras. Es como si todo el mundo estuviera tratando de que usted presente sus impuestos, bajo amenaza de acción legal.

Apaga su PC. No cree que pueda resolver esto incluso si le dedicó otras dos o tres horas. Te frotas los ojos. Mira, nadie sabe lo que depara el futuro. Tal vez alguien descubra esta cosa de cargar cerebros en tu vida. Todos mueren al final. Pero tal vez si cambia de tomar café a polvo de hongos y comienza a comer alimentos sólidos, pueda extender ese plazo. Tienes 28 años. Por ahora, tendrás que esperar y ver.



Fuente: TNW

Compartir:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver Política de cookies
Privacidad