A verdadeira razão por trás de toda a mania de aprendizagem profunda

Uma simples explicação em português, menos a matemática, estatísticas e código


Aprendizagem profunda criou uma perfeita dicotomia.
Por um lado, temos profissionais de ciência de dados falando sobre isso, e cada um deles e seu colega pulam para aprender e fazer uma carreira com essa tecnologia supostamente revolucionária em análise.
E depois há todo mundo querendo saber o que é o zumbido. Com uma infinidade de tecnologias de análise projetadas como a panacéia para os problemas dos negócios, é de se perguntar o que é essa ' coisa legal ' adicional .
Foto de Sandro Schuh no  Unsplash
Para pessoas do lado comercial, não há caminhos fáceis para se obter uma compreensão simples e intuitiva. Uma busca no Google se envolve nas camadas profundas das redes neurais, ou as deixa atropeladas pelos símbolos matemáticos. Cursos on-line sobre o assunto assombram um com um bando de termos de estatísticas.
Um eventualmente cede e acaba pegando todo o hype pelo valor de face. Aqui está uma tentativa de desmistificar e democratizar a compreensão da aprendizagem profunda (DL), em inglês simples e em menos de 5 minutos. Prometo não mostrar as imagens clichês de cérebros humanos, ou uma teia de aranha de redes :-)

Então, o que é o aprendizado profundo?

Vamos começar com a premissa básica de aprendizado de máquina (ML). A tentativa é ensinar máquinas sobre como chegar a um resultado desejado, quando é apresentado algum insumo. Diga, quando mostrado os preços das ações dos últimos 6 meses, preveja o valor de amanhã. Ou, quando apresentado com um rosto, identifique a pessoa.
A máquina aprende como fazer coisas como esta, eliminando a necessidade de instruções laboriosos de cada vez.
A aprendizagem profunda é apenas um discípulo (ou disciplina) do aprendizado de máquina, mas com um QI mais alto. Faz o mesmo que acima, mas de uma maneira muito mais inteligente.

E como é diferente do aprendizado de máquina?

Deixe-me explicar isso usando um exemplo simples de detecção de rosto.
Pic: “Jimmy respondendo a perguntas” pelo trabalho derivado de Beatrice Murch : Sylenius, licenciado sob CC BY 2.0
O reconhecimento facial tradicional usando o aprendizado de máquina envolve primeiro identificar manualmente características perceptíveis em um rosto humano (como olhos, sobrancelhas, queixo). Em seguida, uma máquina é treinada para associar cada face conhecida a esses recursos específicos. Agora, mostre uma nova face, e a máquina extrai esses recursos predefinidos e faz uma comparação para obter a melhor correspondência. Isso funciona moderadamente.
Pic: Aprendizado de máquina é divertido .. por Adam Geitgey
Agora, como o aprendizado profundo resolve o mesmo problema? O processo é quase o mesmo, mas lembre-se que esse aluno é mais esperto. Portanto, em vez de usar os recursos faciais comuns, você permite que o modelo descubra com criatividade o que deve ser observado. Pode decidir que a característica mais marcante em rostos humanos é a curvatura na face esquerda, ou quão plana é a testa. Ou talvez algo ainda mais sutil.
Recursos faciais identificados por algumas das camadas intermediárias da arquitetura DeepFace DL
Ele silenciosamente descobre essa conexão entre a entrada (face) e a saída (nome), quando são mostradas toneladas de tais pares. Então, quando apresentado com um novo rosto, voila acerta magicamente. Em comparação com as técnicas de reconhecimento anteriores, DL bate a bola para fora do parque, com precisão e velocidade.
Ícones por hunotika , MGalloway (WMF) , Google [ CC BY 3.0 ] via Wikimedia Commons

Mas por que eles sempre mostram imagens do cérebro humano?

Para ser justo, não é uma conexão.
Vamos rever como uma criança aprende as primeiras lições. Você mostra cartões flash com a imagem de um elefante e lê em voz alta. Depois de alguns desses casos, quando o bebê olha para qualquer semelhança de um elefante, identifica-o instantaneamente. Independentemente da pose, cor ou contexto. Nós não ensinamos a ela sobre o tronco, a presa ou a forma das orelhas, mas ela aprendeu na totalidade. E ela apenas entende .
Fotos de Picsea , Anita Jankovic , Stoffel Anna , Chris Rhoads em  Unsplash
Assim como não temos certeza de como o bebê aprendeu a identificar o que compõe um elefante, realmente não sabemos como as redes neurais, a tecnologia por trás do aprendizado profundo descobre isso. É aqui que surgem todas as semelhanças com o cérebro humano e as conexões neurais, mas vou parar aqui e poupar-lhe o trabalho.
É suficiente saber que o aprendizado profundo é insanamente inteligente em identificar automaticamente os sinais mais distintivos (recursos) em qualquer dado dado (face). Em outras palavras, é um mestre na extração de recursos . Quando recebe toneladas de pares de entrada-saída, identifica o que aprender e como aprendê-lo.
O aprendizado profundo descobre o padrão mais forte em qualquer entidade apresentada - um rosto, voz ou até mesmo uma tabela de números.

Isso é um grande negócio para aprendizado de máquina?

Sim, é enorme.
Apesar dos avanços estelares no aprendizado de máquina, o maior desafio enfrentado pela disciplina foi ... você adivinhou certo, a extração de recursos . Os cientistas de dados passam noites sem dormir descobrindo conexões entre uma entrada ( uma centena de fatores do comportamento do cliente ) e a saída ( rotatividade do cliente ). Então as máquinas convenientemente aprendem com elas.
Portanto, a diferença entre a precisão máxima e os resultados ruins é a identificação dos melhores recursos. Agora, graças ao aprendizado profundo, se as máquinas puderem fazer esse trabalho pesado automaticamente, não será legal?

Que uso tem uma máquina de identificação de padrões para os negócios?

Muito
O aprendizado profundo pode ser aplicado em qualquer lugar onde haja um equipamento para aprendizado de máquina. Pode confortavelmente debater problemas com dados estruturados, uma área onde os algoritmos tradicionais reinam supremos. Com base no que vimos, ele pode travar os ciclos de aprendizado e levar a precisão a níveis estonteantes.
Mas o maior estrondo para o fanfarrão é naquelas áreas onde o ML ainda está gaguejando sem um começo rápido. Tome o caso das imagens, vídeo, áudio ou significado mais profundo do texto antigo. O aprendizado profundo esmagou problemas com esses tipos de dados que precisam de máquinas para identificar, classificar ou prever. Vamos olhar alguns.
  • A tecnologia avançada de reconhecimento facial está vendo as primeiras aplicações no mundo real , e a qualidade da imagem ou exposição não são mais restrições.
  • Isso fez com que não apenas a detecção de espécies de animais fosse possível, mas nos permite nomear cada tubarão-baleia no oceano. Diga olá a Willy, a baleia jubarte!
  • Os avanços no reconhecimento de fala reduziram as taxas de erro em mais de 30% desde que o DL assumiu. E cerca de 2 anos atrás, eles superaram os humanos neste espaço.
  • DL dotou as máquinas de habilidades artísticas , e há aplicações interessantes de síntese de imagem e transferência de estilo possíveis.
  • Graças a DL, é possível extrair um significado mais profundo do texto , e há tentativas iniciais de resolver o desafio de notícias falsas.
Detecção de objetos usando Deep learning no fluxo Tensor, por Diego Cavalca

Isso é tudo muito bom, não há uma pegadinha?

Bem, a maior vantagem do aprendizado profundo é realmente sua deficiência. O próprio fato de os humanos não terem que identificar características distintivas significa que a máquina define o que considera importante. Nós, seres humanos, somos criaturas da razão e temos problemas com qualquer coisa que não se encaixe em um molde.
O problema se infiltra nesse paraíso quando alguém tenta interpretar o significado dos recursos identificados pela máquina, ou tenta explicar de maneira transparente por que a decisão de uma máquina deve ser implementada. Afinal de contas, quão confortável é um tomador de decisões de negócios apostar milhões, ou pior ainda colocar vidas de pessoas no altar da enigmática, mas recomendações precisas de uma ferramenta, inventada anos atrás?
Interpretabilidade dos algoritmos de aprendizagem profunda e explicação visual dos resultados é um campo em rápida evolução, e a pesquisa está se aproximando rapidamente. E sim, precisa de muitos dados para começar. Então, sim, há alguns soluços nessa área, mas os resultados estelares e estáveis ​​superam claramente os contras, por enquanto.
Então, isso é aprendizagem profunda em uma casca de noz. Por favor, compartilhe seus comentários abaixo.

Embora os modelos de IA tenham dado grandes saltos para a frente, sem seres humanos, eles são tão indefesos quanto um peixe fora d'água. Confira meu artigorecente para descobrir por que a humanidade não está em perigo, pelo menos não ainda  :)

Comentários

Postagens mais visitadas deste blog

SE MARAVILHAR COM AS COISAS DA VIDA

Dilemas econômicos: Teorema de Arrow

SQL em escala com o Apache Spark SQL e DataFrames - conceitos, arquitetura e exemplos