Capacitar Alunos em Aprendizagem Automática e Ciência de Dados com Python

Um curso de 24 horas reuniu mais de 30 alunos de diversas formações académicas, oferecendo experiência prática com ferramentas populares como Python, PyTorch, Pandas, Matplotlib e Jupyter Notebooks.

Sobre

Em julho de 2024, o 3CA.UBI organizou um curso abrangente de 24 horas intitulado “Introdução à aprendizagem automática e à ciência de dados com Python”. Este curso reuniu mais de 30 alunos de diversas formações académicas, incluindo alunos de licenciatura, mestrado e doutoramento. O programa foi concebido para fornecer uma base robusta em aprendizagem automática, deep learning e ciência de dados, oferecendo experiência prática com ferramentas populares como Python, PyTorch, Pandas, Matplotlib e Jupyter Notebooks.

O Desafio


Havia uma necessidade crescente de equipar os alunos de diversas disciplinas académicas com competências práticas e de ponta em aprendizagem automática e ciência de dados. O desafio era apresentar aos alunos estes tópicos avançados de uma forma que não só abrangesse os aspetos teóricos, mas também os capacitássemos com a capacidade de resolver problemas do mundo real utilizando a ciência de dados e a aprendizagem automática.

A Solução

O currículo do curso foi concebido para equilibrar a teoria com as aplicações práticas. Começando com os fundamentos da programação Python, os alunos foram progressivamente apresentados a conceitos avançados, como algoritmos de aprendizagem automática e redes de aprendizagem profunda. Os participantes aprenderam os conceitos básicos das linhas de comando do Linux e como utilizar o SSH para aceder remotamente a ambientes HPC, estabelecendo as bases para futuros trabalhos de supercomputação.

Os alunos trabalharam num conjunto de dados do mundo real, fazendo previsões utilizando vários modelos de aprendizagem automática. Em alternativa, poderiam escolher conjuntos de dados das suas próprias áreas de estudo, levando a uma variedade de projetos em áreas como a engenharia mecânica, a análise desportiva e o reconhecimento de imagens.

Os participantes aplicaram técnicas de aprendizagem automática, como limpeza de dados, engenharia de características e ajuste de hiperparâmetros, utilizando ferramentas como o Scikit-learn para construir modelos precisos. O curso apresentou também uma introdução a deep learning com PyTorch, onde os alunos construíram redes neuronais simples e exploraram redes neuronais convolucionais (CNNs) para tarefas de reconhecimento de imagem.

Cada aluno apresentou as suas descobertas, demonstrando a sua compreensão dos conceitos. A utilização de ferramentas de visualização como o Matplotlib e o Seaborn ajudou-os ainda mais a interpretar e apresentar os seus dados de forma eficaz.

Serviços Providenciados


O docente do curso foi investigador de pós-doutoramento no 3CA.UBI, apoiado pelo projeto EUROCC.

Impacto

O curso teve um impacto significativo nos participantes, melhorando a sua compreensão sobre a aprendizagem automática e a ciência de dados. Os alunos possuem agora um conjunto completo de competências que lhes permite enfrentar desafios do mundo real utilizando técnicas de aprendizagem automática. A combinação de formação prática e teórica preparou-os para futuras carreiras e atividades académicas, especialmente na aplicação da aprendizagem automática em vários domínios, como a engenharia, o desporto e a visão por computador.

Embora os alunos não tenham realizado grandes cálculos em HPC durante o curso, estão agora equipados com o conhecimento para utilizar estes recursos de forma eficaz. O próximo curso, Supercomputação prática em aprendizagem automática, oferecido pela 3CA.UBI, basear-se-á nesta base, permitindo aos participantes otimizar ainda mais os seus modelos utilizando HPC.

Parceiros Envolvidos