Para ser contratado como cientista de dados, não siga o rebanho

Ainda me lembro do momento em que meu irmão decidiu vender seu bitcoin. Era 2017 e estávamos em um Starbucks. Fomos abordados por uma mulher de meia-idade que estava distribuindo panfletos para quem quisesse uma. "BITCOIN: um caminho para a aposentadoria antecipada" foi escrito em negrito no topo.

Eu estava curioso, então perguntei a ela o que ela achava do mercado de criptomoedas em geral, mas descobriu-se que ela não conhecia nenhuma outra criptomoeda além do bitcoin. Ethereum? "Nunca ouvi falar disso." Litecoin? "Essa é a versão barata do bitcoin, certo?"

Agora, como regra geral, quando até mesmo a senhora de meia idade sem noção no Starbucks local está lançando você na mais recente tendência de tecnologia, provavelmente você está se aproximando do pico do hype. Ou, se preferir, uma “bolha”.

Esta não é uma nova observação, claro. Todos concordam que quando se trata de investir, se você está fazendo o que todo mundo está fazendo, é improvável que você veja qualquer retorno. O que é estranho, porém, é que as pessoas não conseguem aplicar esse mesmo raciocínio quando se trata de investir em si mesmas .

Vamos supor que você queira ser contratado como cientista de dados. Se você está fazendo todas as coisas do tipo “eu quero me tornar um cientista de dados”, isso significa que você não deve esperar conseguir o emprego dos seus sonhos. Atualmente, o mercado está cheio de talentos juniores e, como resultado, é pouco provável que o cientista de dados médio aspirante consiga muita tração. Então, se você quiser evitar o resultado mediano, por que as coisas medianas?

O problema é que a maioria das pessoas não pensa assim quando embarcam em suas jornadas de ciência de dados. Eu falei com centenas de aspirantes a cientistas de dados através do meu trabalho na SharpestMinds , e cerca de 80% deles têm aproximadamente a mesma história para contar:

1. Primeiro, eles aprendem as cordas (Python + sklearn + Pandas + talvez algum SQL ou algo assim)
2. Então, eles tomam um MOOC do tipo cookie-cutter de algum tipo
3. Eles lêem algumas descrições de trabalho, ficam preocupados porque não têm o que é preciso
4. Talvez pegue outro MOOC, talvez comece a se candidatar a empregos através de um quadro de empregos
5. Não ouça nada de volta (ou, na melhor das hipóteses, bombardeie algumas entrevistas)
6. Fique frustrado, pense em fazer um mestrado, candidate-se a mais alguns trabalhos
7. Chegar a um ponto de decisão: repito # 2 a # 7 até que algo diferente aconteça?

Se isso acontecer com você, provavelmente você está em uma bolha de auto-aperfeiçoamento: você está fazendo o que todo mundo está fazendo, mas esperando um resultado diferente. A primeira coisa que você precisa fazer é parar .

Se você quer resultados acima da média, não pode fazer coisas medianas. Mas, para evitar fazer coisas comuns, você precisa saber quais são as coisas comuns.

Aqui estão alguns exemplos: se você precisava fazer um MOOC para aprender as cordas, tudo bem. Mas não fique preso em uma espiral MOOC: MOOCs são, quase por definição, projetados para uma pessoa comum, então você não se tornará um excelente candidato fazendo mais deles. Da mesma forma, se você tiver 4 ou 5 notebooks Jupyter com a mesma pilha chata de sklearn / Pandas / seaborn / Keras no seu GitHub, não faça outro .

No geral, a regra é: se algo parece ser um próximo passo óbvio, porque todo mundo está fazendo isso, é uma ótima coisa para não fazer . E, inversamente, você precisa encontrar as coisas que ninguém mais está fazendo e fazer essas coisas o mais rápido possível.

Quais são essas coisas? Baseado no que eu vi, cerca de 5 vem à mente:

1. Replicar documentos. Isto é especialmente verdadeiro se você é um aficionado por aprendizado profundo. As pessoas não fazem isso porque é mais difícil do que pegar um conjunto de dados e usar uma ANN ou XGBoost simples para fazer uma classificação de cookie-cortador. Encontre o artigo mais interessante (idealmente relativamente recente) relevante para o seu campo no arXiv, e leia-o. Entende isso. Em seguida, replique-o, potencialmente em um novo conjunto de dados. Escreva uma postagem no blog sobre isso.
2. Não fique confortável em sua zona de conforto. Se você começar um novo projeto, é melhor aprender algumas novas estruturas / bibliotecas / ferramentas. Se você está construindo seu 6º caderno Jupyter que começa com df = pd.read_csv(filename)e termina com f1 = f1_score(y_true, y_pred) , é hora de mudar sua estratégia.
3. Aprenda coisas chatas. Outras pessoas não estão fazendo isso porque ninguém gosta de coisas chatas. Mas aprender um fluxo adequado do Git, como usar o Docker, como criar um aplicativo usando o Flask e como implantar modelos na AWS ou Google Cloud são habilidades que as empresas querem desesperadamente que os candidatos tenham, mas que são subestimadas por um sólido maioria dos requerentes.
4. Faça coisas irritantes. 1) Ofereça-se para apresentar um trabalho em um encontro local de ciência de dados. Ou, no mínimo, participe do encontro local de ciência de dados. 2) Envie mensagens frias para pessoas no LinkedIn. Tente oferecer valor antecipadamente ("Acabei de notar um erro de digitação no seu site"). NÃO PERGUNTE-LOS PARA UM TRABALHO FORA. Faça sua pergunta o mais específica possível ("Eu adoraria receber seus comentários no meu post"). Você está tentando construir um relacionamento e expandir sua rede, e isso exige paciência. 3) Participe de conferências e rede. 4) Inicie um grupo de estudo.
6. Faça coisas que pareçam loucas. Todos vão para o repositório da UCI ou usam alguns conjuntos de dados de ações (yawn) para construir seu projeto. Não faça isso. Aprenda a usar uma biblioteca de web scraping ou uma API pouco apreciada para criar seu próprio conjunto de dados personalizado. É difícil obter dados, e as empresas geralmente precisam confiar em seus engenheiros para obtê-los. Seu objetivo deve ser se deparar com o tipo de lunático obcecado por ciência de dados que construirá seu próprio conjunto de dados se for necessário fazer o trabalho.

Cada uma dessas estratégias é outra maneira de superar o barulho que os recrutadores enfrentam todos os dias. Nenhum deles são balas de prata, mas são maneiras infalíveis de obter mais tração no mercado de trabalho de ciência de dados e se tornar um cientista de dados mais capaz.

No final do dia, lembre-se que quando você está construindo suas habilidades, você está investindo em si mesmo. E isso significa que todos os mesmos princípios econômicos que se aplicam ao investimento se aplicam aqui: se você quer um resultado excelente, você tem que fazer coisas extraordinárias.

Se você tiver dúvidas sobre como otimizar seu aprendizado de máquina ou a trajetória da ciência de dados, sempre fico feliz em conversar. Apenas me envie um DM no Twitter em @ jeremiecharris :)

FONTE: https://towardsdatascience.com/the-economics-of-getting-hired-as-a-data-scientist-e3882933b43c

Pesquisar este blog

APENAS UM RAPAZ LATINO-AMERICANO

Para ser contratado como cientista de dados, não siga o rebanho

Para ser contratado como cientista de dados, não siga o rebanho

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Vila Montecelli: entre a fé, a luta e a memória

MEU TEMPO NO SANEP

Formação dos Estados Nacionais