A Ciência de Dados ou Data Science está cada vez mais presente em nosso dia a dia e em vagas que buscamos no LinkedIn. Mesmo como desenvolvedor, é possível vez ou outra se deparar com alguma vaga que esbarre ou exija algum conhecimento com data science. Eu vou listar neste artigo algumas dicas que podem
A Ciência de Dados ou Data Science está cada vez mais presente em nosso dia a dia e em vagas que buscamos no LinkedIn.
Mesmo como desenvolvedor, é possível vez ou outra se deparar com alguma vaga que esbarre ou exija algum conhecimento com data science.
Eu vou listar neste artigo algumas dicas que podem ser úteis para você, que assim como eu, é desenvolvedor e busca conhecer outras áreas de conhecimento dentro da tecnologia da informação.
Isto não significa que sairá um engenheiro de dados (são tantos termos), mas é o suficiente para estar apto a utilizar as ferramentas em seu dia a dia e quem sabe, algum dia garimpar alguma vaga na área.
As linguagens mais utilizadas no Data Science
Com certeza eu começaria aprendendo sobre as linguagens de programação mais utilizadas para o data science, que são Python e R (no momento que escrevo este artigo em 2022 é o que está aquecido).
Para isto, você precisa primeiramente se habituar com a estrutura da linguagem. Então, se não conhece a linguagem, recomendo que entenda as estruturas mais simples das mesmas.
Quando digo as estruturas mais simples, me refiro aos laços (for e while), estruturas condicionais (if, else) e outros recursos na mesma linha.
Se quiser aprender estas linguagens de maneira gratuita, separei algumas playlists que podem ajuda-lo. Você pode acessar a playlist que criei ou simplesmente assistir abaixo:
Conhecer as bibliotecas disponíveis
A partir do momento que estiver habituado com as linguagens, está na hora de partir para o conhecimento sobre as bibliotecas disponíveis para resolver os problemas de dia a dia.
Tudo em data science, assim como na programação, está relacionado a resolver algum problema, ou seja, dar uma solução para uma problema de negócio conhecido.
A primeira biblioteca que cito é para Python é o Pandas, que te dará a possibilidade de manipular dados, selecionar colunas, filtrar linhas, fazer agregação (group by), aplicar função Lambda, fazer merge e concat, entre outros.
Outra biblioteca também disponível é o Seaborn, que irão apresentar as mesmas funcionalidades, mas você irá notar que ela é bem mais caprichada nos recursos gráficos.
Conhecer os algoritmos de Machine Learning
Aqui está um requisito que você pode achar moleza pelo fato de lidar diretamente com código ou ser programador, mas não se engane! Vá estudar a fundo os algoritmos de machine learning.
Até mesmo para você não passar vergonha no momento da entrevista ou falar alguma “groselha” para o entrevistador, estude a fundo os algoritmos, suas diferenças e aplicações.
Também separei uma lista aqui completa com os algoritmos de machine learning que você pode assistir ou utilizar como um roteiro de estudos. Você pode assirtir ela também na sequência:
Na sequência acima você vai encontrar os principais algoritmos de machine learning:
- Linear Regression
- Decision Tree
- Random Forest
- Extra Trees
- K-Means
- Cluster Hierárquico
Se conseguir me organizar aqui, mais pra frente posso trazer alguns vídeos no canal comentando sobre eles, mas no momento, vou indicar vídeos do pessoal mais especialista em cada tópico.
Bom, de maneira geral, tentei descrever de maneira objetiva um conteúdo para iniciar sua jornada com o mundo do data science ou ciência de dados.
Claro que, assim como na programação, este é outro universo a ser explorada e que você pode aos poucos colocar em sua lista de estudos e aprender mais sobre o assunto.
Caso tenha alguma dúvida também e puder ajudar, marca aqui nos comentários e com certeza ficarei feliz em ajudar e também ser ajudado, certo? Afinal, quando você compartilha conhecimento, você acaba aprendendo também.
Até a próxima!
Leave a Comment
Your email address will not be published. Required fields are marked with *