5 recursos gratuitos que todo científico de datos debería empezar a utilizar hoy



Suscríbase a los boletines de datos

Antes de lanzarme a los MOOC populares o comprar libros recomendados en Amazon, comencé por suscribirme a varios boletines informativos sobre ciencia e ingeniería de datos. Al principio, estaba leyendo cada artículo y tomando notas, pero con el tiempo aprendí a reconocer los enlaces importantes compartidos en múltiples boletines y me enfoqué en algunos. Los boletines son excelentes para mantenerse al día con nuevas herramientas, investigaciones académicas y publicaciones de blogs populares compartidas por grandes gigantes de Internet (por ejemplo, Google, Netflix, Spotify, Airbnb, Uber, etc.).

Estos son algunos de mis boletines favoritos:

  • Resumen de ciencia de datos de Tristan Handy: Tristan ofrece sus propios comentarios sobre su lista curada de artículos sobre ciencia de datos.
  • Ciencia de datos semanal: Una lista seleccionada de artículos y publicaciones de blog relacionados con la ciencia de datos, la inteligencia artificial y el aprendizaje automático. También considero que las secciones de Capacitación y recursos son una colección útil de tutoriales en línea.
  • Boletín de hackers: Un boletín semanal con artículos seleccionados de Hacker News. No es específico de ingeniería o ciencia de datos, pero hay una sección dedicada a los datos y el código que son relevantes.
  • AI semanal de VB: Pensamientos de escritores de Venture Beat con una colección de artículos relacionados con la IA.

También me suscribo a Datos Machina, El envío de análisisy AI semanal.

Elabore su propio plan de estudios de datos

A continuación, según su enfoque, debe elaborar su plan de estudios de ciencia de datos, ingeniero de datos o analista de datos. Esto puede incluir aprender a programar en Python o R si está cambiando de carrera desde un rol que no es de programación. Si el presupuesto no es una preocupación, unirse a un bootcamp o tomar cursos de Udacity y Dataquest puede ser una excelente opción para obtener tutoría en línea de expertos de la industria. Sin embargo, si es consciente de los precios como yo, puede optar por seguir guías de código abierto para crear un plan de estudios gratuito:

Una advertencia aquí es que simplemente tomar estos cursos no es suficiente. En general, encontré la mayoría de los cursos y tutoriales en línea para enfocarse en el conocimiento fundamental (por ejemplo, matemáticas, estadísticas, teorías) o guías simplificadas para recorrer un ejemplo trivial. Esto es especialmente cierto en big data, ya que los tutoriales tienden a utilizar un subconjunto más pequeño de datos para ejecutarse localmente en lugar de recorrer una configuración de producción completa en la nube.

Para complementar la teoría con escenarios realistas, sugiero unirse Kaggle y el uso de herramientas gratuitas de Google, como Colab para practicar el trabajo con grandes conjuntos de datos. También puede buscar repositorios de Github de los estudiantes de Udacity para ver cómo se vería un proyecto final.

Conecta con expertos gratis

Cualquier guía profesional le diría que la creación de redes es importante. Pero, ¿cómo se puede encontrar a expertos de la industria dispuestos a asesorar o simplemente a responder algunas preguntas? Antes de la pandemia, una opción era asistir a las reuniones, pero esa oportunidad se limitaba en gran medida a los residentes en los principales centros tecnológicos como el Área de la Bahía, Nueva York o Seattle (al menos en los EE. UU.). La otra opción era asistir a conferencias o talleres enfocados en ciencia de datos, aprendizaje automático o ingeniería de datos. Sin embargo, las entradas para estos eventos eran muy caras, por lo que no era práctico que las personas asistieran sin el patrocinio de la empresa.

Como empleado de una startup que vive en Baltimore, mi solución fue conectarme en línea viendo primero videos gratuitos de las sesiones realizadas por socios de la industria en conferencias de tecnología (por ejemplo, AWS re: Invent, Microsoft Ignite o Google Cloud Next) y conectándome con los oradores en LinkedIn . Además de las conferencias magistrales y las sesiones sobre lanzamientos de nuevos productos en la nube, hay toneladas de sesiones sobre mejores prácticas y discusiones de arquitectura en las que un gerente de producto o un desarrollador líder de un socio de la industria (por ejemplo, Lyft, Capital One, Comcast) presentaría una solución. arquitecto de AWS / Azure / GCP en la resolución de un problema real a escala. Tomaba notas sobre la sesión y luego me comunicaba con todos los oradores en LinkedIn con una pregunta sobre su producto o una decisión arquitectónica mencionada en la charla. Sorprendentemente, casi todos los oradores estaban dispuestos a responder y continuar conversando conmigo, a pesar de que yo era solo un recién graduado que trabajaba en una empresa desconocida en ese momento.

Con el tiempo, crecí de manera constante mi red de esta manera y tuve el beneficio adicional de estar al día con los nuevos productos y las tendencias de la industria en todos los principales proveedores de nube. Teniendo en cuenta la situación actual con COVID-19 y el cambio continuo hacia eventos virtuales, esto puede convertirse en la nueva norma en la creación de redes en lugar de asistir a conferencias para conocer a otras partes interesadas en persona.

Obtener la certificación

Si bien las certificaciones en la nube de ninguna manera son una validación de la capacidad o el conocimiento de los datos, sigo pensando que es valioso invertir en certificaciones. Esto es especialmente cierto si su objetivo es ser un ingeniero de datos, ya que el conocimiento de la nube es imperativo para ejecutar cargas de trabajo de producción. Incluso para los científicos de datos, familiarizarse con los productos en la nube les permite realmente concentrarse en analizar los datos en lugar de luchar para cargar y limpiar datos a escala.

Otro aspecto subestimado de obtener la certificación es la apertura de la red. Hay miembros muy activos en LinkedIn, particularmente en consultoría tecnológica, que publican sobre nuevas oportunidades en puestos de datos en la nube. Algunos reclutadores publican directamente en grupos de LinkedIn solo para titulares de certificación. La certificación por sí sola no conducirá a un nuevo trabajo o puesto, pero tener esas insignias facilita el inicio de una conversación con otras personas o reclutadores. Personalmente, conseguí algunos pequeños proyectos de consultoría después de adquirir las certificaciones.

Resuelve problemas reales

Finalmente, como con cualquier disciplina de ingeniería, solo mejorarás con la práctica. Si ya trabaja como científico de datos o ingeniero de datos, obtener experiencia en el mundo real no debería ser un problema. Para otros que buscan la transición, muchos recomendarán crear una cartera. ¿Pero por dónde empiezas? Es probable que trabajar con el conjunto de datos clásico del Titanic para la clasificación de supervivencia o la agrupación para el conjunto de datos del iris perjudique su cartera de proyectos que lo ayude.

En su lugar, intente utilizar proyectos públicos de Github como inspiración. Según la red que acumuló en LinkedIn a través de sesiones de tecnología y certificaciones, observe lo que otros están construyendo. Siéntase libre de usar ejemplos de proyectos de Udacity o Coursera en Github. Luego, mezcle conjuntos de datos reales de Investigación de Google, Kaggleo buscar un conjunto de datos interesante y empezar a construir soluciones para problemas reales.

Si está interesado en un sector o una empresa específica, intente buscar conjuntos de datos públicos y cree un proyecto de muestra. Por ejemplo, si está interesado en fintech, intente usar Datos de préstamos públicos de Lending Club para construir un algoritmo de aprobación de préstamos. Lo más importante de trabajar con conjuntos de datos reales es que estos son muy desordenados y ruidosos en comparación con los que se proporcionan en entornos académicos.





Fuente: TNW

Compartir:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Esta web utiliza cookies, puedes ver aquí la Política de Cookies