Machine Learning para noobies: conhece exemplos práticos

11-05-2021

Tempo de leitura: 8 minutos

Machine Learning para noobies: conhece exemplos práticos

Por João Varela e António Capela, Data Scientists @ Xpand IT

Machine Learning (ML) é um campo que tem sido alvo de muita atenção nos últimos anos. Segundo o mais recente HypeCycle sobre Inteligência Artificial divulgado pela Gartner, Machine Learning deixou de ser uma área com expectativas demasiado elevadas, estando agora numa fase de maior maturação, sendo que o planalto de real produtividade da aplicação de tecnologia estará num futuro bem próximo. Por isso mesmo, se pensas que ML pode ser um trabalho para ti, é a altura certa para seres um engenheiro nesta área. Neste artigo vamos falar do que é Machine Learning, enumerar exemplos de aplicações do mesmo e partilhar algumas vantagens e desvantagens de trabalhar neste ramo. No final esperamos que fiques com uma ideia mais clara sobre se trabalhar como ML engineer é o teu emprego de sonho.

O que é Machine Learning?

De acordo com a IBM, Machine Learning é “uma forma de inteligência artificial que permite a um sistema aprender a partir de dados em vez de a partir de programação explicita”. Felizmente para todos nós, inteligência artificial ainda não é uma super-inteligência que vai dominar o mundo e acabar com a raça humana, mas sim um conjunto de técnicas e algoritmos matemáticos avançados que permitem identificar padrões e tendências em grandes quantidades de dados de forma a automatizar processos ou extrair insights para ajudar a tomar decisões. É por esta razão que os sistemas mais avançados de assistência por voz como a Alexa ainda não têm sentimentos. São apenas sistemas muito inteligentes que conseguem reconhecer padrões de sons na voz dos seus utilizadores. Mesmo o Mr. Stark, quando desenvolveu a sua assistente, deu-lhe o nome de J.A.R.V.I.S (“just a rather very intelligent system”).

Machine Learning giph

O que é um modelo de Machine Learning?

Podemos começar por pensar num modelo de Machine Learning como uma criança a aprender a falar, a criança recebe estímulos dos pais com exemplos de palavras que deve tentar imitar e, pouco a pouco, após muitas tentativas a criança começa a repetir estes sons. Nesta analogia os estímulos dos pais são o nosso dataset, um conjunto de exemplos que a criança deve tentar interpretar, e posteriormente imitar; o dataset tem grande influência no nosso modelo (as palavras mais repetidas pelos pais serão mais facilmente aprendidas pela criança, o idioma falado pelos pais será o mesmo que o da criança e mesmo qualquer pronuncia na voz dos pais terá influência na linguagem da criança). É por esta razão que em ML o nosso dataset deve ser sempre suficientemente representativo do que estamos a tentar modelar.

O processo de aprendizagem da criança é conhecido no mundo de ML como fase de treino. Nesta fase são feitos pequenos ajustes ao modelo iterativamente, de forma a aproximar o nosso resultado com o resultado pretendido. Neste modelo – à diferença entre o resultado do nosso modelo e o resultado pretendido dá-se o nome de erro – os pequenos ajustes que são feitos ao modelo ao longo da fase de treino são calculados através de operações matemáticas tendo por base este mesmo erro. Durante a sua aprendizagem, cada criança tem as suas facilidades e dificuldades. Isto faz com que existam diferentes métodos de aprendizagem para cada criança. Analogamente, em ML temos diferentes tipos de modelos: alguns mais apropriados para determinado tipo de dados, outros para quando existem grandes quantidades de dados, etc.

Esta aprendizagem da criança não é apenas válida para a fala, podendo ser aplicada a mesma ideologia para o aprender a andar ou mais tarde o aprender na escola. Da mesma forma os modelos de ML têm variadas aplicações: podem receber dados relativos à meteorologia do dia seguinte e prever qual o número de gelados que serão vendidos nesse dia, podem receber uma imagem e tentar identificar qual o objeto presente na mesma. Podem receber o som captado pela voz de um utilizador e identificar se este pretende ligar a luz do quarto ou preparar o seu típico café, entre muitos outros.

Como referido anteriormente, Machine Learning contém vários tipos de algoritmos que permitem uma aprendizagem distinta tendo como base um conjunto de dados. Pegando no primeiro exemplo referido acima, estes sistemas olham para dados cuja previsão já é conhecida. Neste caso, o registo meteorológico e a lista de vendas de gelados ao longo do último ano e, iterativamente, aprendem a reconhecer padrões nestes dados (em dias de chuva vendem-se menos gelados, quando está calor o número de vendas é superior, etc.). Após este passo de treino, o algoritmo permite calcular, com um determinado nível de incerteza, qual será o valor previsto de gelados vendidos em dias futuros. Este tipo de análise, permite ao senhor da loja de gelados fazer uma gestão de quantos gelados precisa de ter em stock para vender no dia seguinte, definir o número de trabalhadores necessários para o dia seguinte, etc., o que leva a uma gestão de loja mais informada e possivelmente a uma otimização de custos.

Qual a diferença de sistemas de Machine Learning para sistemas de software mais tradicionais?

Um sistema de software mais tradicional implementa uma estratégia ou algoritmo bem definido. Ou seja, todas as condições do problema têm de estar bem explicitas na sua implementação. ML não vem de forma alguma substituir estes sistemas tradicionais. Se quisermos desenvolver uma aplicação de venda de gelados ao domicílio, queremos que o comportamento da aplicação seja sempre idêntico: o utilizador preenche a sua morada, escolhe o seu gelado preferido, faz o pagamento, e recebe o seu fresco gelado em casa.

Este é um tipo de problema que é completamente resolvido apenas com sistema de software tradicional. Se, por outro lado, o senhor da loja de gelados quiser prever qual o número de gelados que irá vender no dia seguinte utilizando técnicas tradicionais, todas as situações teriam de ser retratadas (Se tiverem mais de 30ºC e menos de 20% de humidade serão vendidos 7 gelados, se a temperatura descer para 25ºC passarão para 6, etc.). É neste tipo de problemas que modelos de ML podem ajudar, enquanto que num sistema tradicional as previsões dependem de um conjunto de regras criado por um developer.

Machine Learning giph movie

Num sistema de Machine Learning, este conjunto de regras são ajustadas automaticamente pelo nosso modelo, de um modo intrínseco, com base num dataset com exemplos passados. No caso da loja de gelados, o modelo produzido poderá receber parâmetros de entrada com registos diários como a temperatura, humidade, número de vendas nos últimos dias, dia da semana, se é feriado, etc., e fazer uma previsão do número de gelados vendidos nesse dia, oferecendo ainda expetativas da precisão e garantias matemáticas da validez da abordagem escolhida. Este novo paradigma é principalmente relevante em problemas mais complexos em que são utilizadas grandes quantidades de dados com milhões de registos e milhares de variáveis, nas quais existe maior dificuldade na definição destas condições.

O que contribuiu para a popularidade de Machine Learning

Apesar do mais recente hype desta tecnologia, o conceito de Machine Learning data a década de 50, onde foram desenvolvidos os primeiros algoritmos de aprendizagem automática. Como referido anteriormente, estes modelos necessitam de conjuntos de dados previamente classificados para executar o seu processo de treino; além disso, o processamento iterativo de grandes quantidades de dados exige um poder computacional muito elevado, o que não era possível na altura. Segundo a IBM, existem 6 razões que deram origem a este avanço na área da inteligência artificial:

Os processadores mais modernos são cada vez mais poderosos
O custo de armazenamento de grandes quantidades de dados é cada vez inferior, nomeadamente com o surgimento das plataformas cloud
O aparecimento de tecnologias de computação distribuída
O aumento na produção de dados, o que beneficia o treino deste tipo de modelos
A implementação destes modelos é cada vez mais partilhada abertamente, o que contribui muito para a sua utilização e investigação
Técnicas de visualização de dados estão cada vez mais acessíveis

Aplicações de Machine Learning

Os mais recentes avanços em ML permitiram a implementação desta tecnologia em diferentes áreas de negócio. Podes verificar alguns destes exemplos no último artigo que lançámos na Xpand IT sobre o que é Data Science. Alguns exemplos mais recentes, muito falados da aplicação destes modelos são o AutoPilot, o Deep Fake ou a Open AI.

AutoPilot

A Tesla está a desenvolver sistemas de ML que permitem veículos conduzirem sem interferência humana. Com base num destino especificado, e em diferentes tipos de sensores instalados no veículo como câmaras e radares, já é possível fazer uma viagem sem nunca tocar no volante do carro.

Deep Fake

Deep Fake é um algoritmo de ML que permite a criação de vídeos fake. Tomando como exemplo este vídeo, foram utilizados excertos de discursos de Barack Obama, para criar um vídeo falso do mesmo, alterando as suas expressões faciais e discurso. Esta ferramenta, apesar de ser muito perigosa, pode ser utilizada no ramo do entretenimento, ou para criação de plataformas interativas em museus.

Open AI

A Open AI desenvolveu um sistema inteligente capaz de jogar Dota 2. Após jogar o equivalente a 10000 anos de jogo contra si próprio, o modelo foi capaz de derrotar a melhor equipa do mundo. O Dota 2 é um jogo que exige muita coordenação, e esta vitória foi considerada um grande milestone. Apesar de se tratar apenas de um jogo, este é um ambiente controlado onde podem ser feitos testes deste tipo de modelos, podendo depois serem aplicados em áreas reais como a robótica, condução autónoma ou a medicina.

Machine Learning giph robot

Vantagens e desvantagens de ser engenheiro de Machine Learning

Para tentar dar a entender os desafios que encontramos no dia-a-dia em desenvolvimento de ML, aqui ficam alguns pontos que consideramos mais relevantes para entender as vantagens e desvantagens neste tipo de projetos.

Vantagens:

O leque de aplicações de ML é muito vasto, o que significa que tens a possibilidade de não só escolher projetos que consideres mais cativantes, como te dá a oportunidade de trabalhar e aprender em muitas áreas de negócio distintas
Como engenheiro de ML tens a oportunidade de ter influência direta na vida das pessoas. Apesar de parecer um pouco clichê, é verdade que o modelo que estás a desenvolver terá impacto na vida de alguém, seja porque lhe recomendaste um novo produto, ou por teres adicionado cinco minutos de tempo livre por lhe dares indicações para o caminho mais rápido até casa
Tens a possibilidade de trabalhar com muitas ferramentas distintas, como diferentes linguagens de programação, bibliotecas gráficas, sistemas de computação distribuídos, e muito mais

Desvantagens:

Na área de machine learning não existem respostas 100% corretas, existe uma grande variedade de abordagens para chegar a um resultado, resultado este que também é difícil de validar. As muitas abordagens e incertezas podem tornar esta área um pouco overwhelming, e difícil de dominar
Sendo uma área em constante desenvolvimento, as técnicas que aprendes podem ficar rapidamente desatualizadas. É necessária uma constante aprendizagem de novos modelos e ferramentas

Conclusão

Machine Learning é uma área que atualmente se encontra em grande desenvolvimento, cada vez mais as empresas têm a obrigação de utilizar estas tecnologias para se tornarem competitivas no mercado, isso leva a que haja uma grande procura de mão de obra especializada na área, sendo a altura certa para te juntares ao hype train. Esperamos que este artigo tenha contribuído para consolidar a tua opinião sobre o que é ser um engenheiro de ML, e quem sabe não nos iremos encontrar em algum projeto no futuro. Se quiseres saber um pouco mais sobre o nosso trabalho, podes visitar a página de Data Science da Xpand IT.

Categories:

Blog de Carreira em Tecnologia

Tags:

Machine Learning

Comments are closed.

Comments

0
springfield rifles

… [Trackback]

[…] Read More to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
click here

… [Trackback]

[…] Here you can find 92201 more Information to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
Continue Reading

… [Trackback]

[…] Read More here to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
웹툰 사이트

… [Trackback]

[…] Here you can find 67736 more Info on that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
pgslot

… [Trackback]

[…] Read More on on that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
Cannabis delivery Toronto

… [Trackback]

[…] There you can find 68909 more Info to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
สล็อตเว็บตรง

… [Trackback]

[…] Read More Info here to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
รับทำวิจัย

… [Trackback]

[…] Find More on on that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
แทงมวย LSM99

… [Trackback]

[…] There you will find 69943 additional Info to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
gazibo

… [Trackback]

[…] Read More to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
naga356

… [Trackback]

[…] Info to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]
0
ทัวร์โรงงานจีน

… [Trackback]

[…] Info to that Topic: careers.xpand-it.com/blog/machine-learning-para-noobies-conhece-exemplos-praticos/ […]

Anterior Seguinte

Cookie	Duração	Descrição
_GRECAPTCHA	5 meses 27 dias	Este cookie é configuirado pelo Google reCAPTCHA protege o nosso site contra ataques de spam nos formulários de contacto.
cli_user_preference	1 ano	Este cookie é definido pelo plugin de Consentimento de Cookies GDPR e é usado para armazenar se o usuário consentiu ou não com o uso de cookies. Ele não armazena dados pessoais.
cookielawinfo-checkbox-[CATEGORY]	1 ano	Este cookie é usado pelo plugin GDPR Cookie Consent guarda o consentimento do visitante da [CATEGORIA].
CookieLawInfoConsent	1 ano	CookieYes define este cookie para registar o estado predefinido do botao correspondente a categoria e o estado do CCPA. Funciona apenas em coordenacao com o cookie principal.
viewed_cookie_policy	1 ano	Este cookie usado pelo GDPR Cookie Consent plugin para guardar se o visitante consentiu ou não o use the cookies. Não guarda nenhum dado pessoal.

Cookie	Duração	Descrição
__adroll	1 ano 1 mes	Este cookie e definido pela AdRoll para identificar utilizadores em visitas e dispositivos diferentes. e utilizado em leiloes em tempo real para que os anunciantes possam exibir anuncios relevantes.
__adroll_fpc	1 ano	A AdRoll define este cookie para segmentar utilizadores com base no comportamento de navegacao.
__adroll_shared	1 ano 1 mes	A AdRoll define este cookie para recolher informacoes sobre utilizadores em diferentes websites para publicidade relevante.
__ar_v4	1 ano	Este cookie e definido sob o dominio DoubleClick para colocar anuncios que direcionam para o website nos resultados de pesquisa do Google e para monitorizar as taxas de conversao desses anuncios.
_clck	1 ano	A Microsoft Clarity define este cookie para reter o ID do Utilizador Clarity do navegador e definicoes exclusivas para aquele website. Isso garante que as acoes realizadas durante visitas subsequentes ao mesmo website sejam associadas ao mesmo ID do utilizador.
_clsk	1 dia	A Microsoft Clarity define este cookie para armazenar e consolidar as visualizacoes de pagina de um utilizador numa unica sessao de gravacao.
_fbp	3 meses	Este cookie é configurado pelo Facebook para exibir anúncios quando estiver no Facebook ou noutra plataforma digital onde é usada publicidade do Facebook
_ga	2 anos	Este cookie é configurado pelo Google Analytics, calcula dados de visitantes, sessões, campanhas e acompanha o uso do site. O cookie armazena informações anónimas atribuindo um número aleatório para distinguir visitantes únicos.
_ga_*	2 anos	Este cookie é configurado pelo Google Analytics é usado para distinguir os visitantes.
_gat_UA-*	1 minuto	Este cookie é configurado pelo Google Analytics, onde o elemento padrão no nome contém um número que identifica o site. É uma variação do cookie _gat usado para limitar a quantidade de dados registados pelo Google em sites de alto volume de tráfego.
_gcl_au	3 meses	O Google Tag Manager define o cookie para experimentar a eficiencia de publicidade em websites que utilizam os seus servicos.
_gid	1 dia	Este cookie é configurado pelo Google Analytics guarda um ID único que é usado para gerar dados estatísticos sobre como o visitante usa o site
_hjAbsolutesessaoInProgress	30 minutos	O Hotjar define este cookie para detetar a primeira visualizacao da pagina de um utilizador, que e um sinal Verdadeiro/Falso definido pelo cookie.
_hjFirstSeen	30 minutos	O Hotjar define este cookie para identificar a primeira sessao de um novo utilizador. Ele armazena o valor verdadeiro/falso, indicando se foi a primeira vez que o Hotjar viu este utilizador.
_hjIncludedInsessaoSample_*	2 minutos	O Hotjar define este cookie para determinar se um utilizador está incluído na amostragem de dados definida pelo limite diário de sessões do seu site.
_hjRecordingEnabled	nunca	O Hotjar define este cookie quando uma gravacao comeca e e lido quando o modulo de gravacao e inicializado, para verificar se o utilizador ja esta numa gravacao numa sessao especifica.
_hjRecordingLastActivity	nunca	O Hotjar define este cookie quando uma gravacao de utilizador comeca e quando os dados sao enviados atraves do WebSocket.
_hjsessao_*	30 minutos	O Hotjar define este cookie para garantir que os dados de visitas subsequentes ao mesmo site sejam atribuidos ao mesmo ID de utilizador, que persiste no ID de Utilizador Hotjar, unico para esse site.
_hjsessaoUser_*	1 ano	O Hotjar define este cookie para garantir que os dados de visitas subsequentes ao mesmo site sejam atribuidos ao mesmo ID de utilizador, que persiste no ID de Utilizador Hotjar, unico para esse site.
_te_	sessao	O Grupo Adroll regista um ID unico que identifica o dispositivo de um utilizador que regressa. O ID e utilizado para anuncios direcionados.
AnalyticsSyncHistory	1 mês	Este cookie é usado pelo Linkedin para guardar informação sobre quando ocorreu a sincronização com o cookie lms_analytics para os visitantes dos países selecionados.
anj	3 meses	A AppNexus define o cookie anj, que contem dados sobre se um ID de cookie esta sincronizado com parceiros.
ANONCHK	10 minutos	O cookie ANONCHK, definido pelo Bing, e usado para armazenar o ID da sessao do utilizador e verificar os cliques em anuncios no motor de busca Bing. O cookie ajuda na geracao de relatorios e personalizacao.
bcookie	2 anos	Este cookie é usado pelo Linkedin para guardar informação sobre quando ocorreu a sincronização com o cookie lms_analytics para os visitantes dos países selecionados.
CLID	1 ano	Usada pelo Microsoft Clarity, o objetivo desta cookie é gerar um mapa de calor e uma gravação da sessão.
CMID	1 ano	A Casale Media define este cookie para recolher informacoes sobre o comportamento do utilizador para publicidade direcionada.
CMPRO	3 meses	A CasaleMedia define o cookie CMPRO para rastreamento anonimo de utilizacao e publicidade direcionada.
CMPS	3 meses	A CasaleMedia define o cookie CMPS para rastreamento anonimo de utilizadores com base nas visitas ao website, exibindo anuncios direcionados.
fr	3 meses	Este cookie é usado pelo Facebook permite mostrar anúncios relevantes aos visitantes, analisando o comportamento do visitante noutros websites que possuem pixel do Facebook ou o plugin social do Facebook.
IDE	1 ano 24 dias	Os cookies Google DoubleClick IDE armazenam informacoes sobre como o utilizador utiliza o website para apresentar anuncios relevantes de acordo com o perfil do utilizador.
KRTBCOOKIE_*	3 meses	A Pubmatic define este cookie para registar um ID unico que identifica o dispositivo do utilizador em visitas posteriores a websites que utilizam a mesma rede de anuncios.
li_sugr	3 meses	O LinkedIn define este cookie para recolher dados sobre o comportamento do utilizador, otimizando o website e tornando os anuncios no website mais relevantes.
MR	7 dias	Este cookie, definido pelo Bing, e usado para recolher informacoes do utilizador para fins de analise.
msd365mkttr	2 anos	O Microsoft Dynamic 365 guarda informações sobre o comportamento do utilizador em vários sites. Esta informação é usada para otimizar a relevância do anúncio no site.
msd365mkttrs	sessão	Permite a utilização de um formulário específico, que envia os dados preenchidos pelo utilizador para o Microsoft Dynamic 365.
MUID	1 ano	Identifica os navegadores que visitam os sites da Microsoft. Estes cookies são usados para análise de sites e outras finalidades operacionais.
PugT	1 mes	A PubMatic define este cookie para verificar quando os cookies foram atualizados no navegador, a fim de limitar o numero de chamadas ao armazenamento de cookies no lado do servidor.
SM	sessao	O cookie da Microsoft Clarity define este cookie para sincronizar o MUID em dominios Microsoft.
SRM_B	1 ano 24 dias	Usado pela Microsoft Advertising como um ID unico para visitantes.
test_cookie	15 minutos	O doubleclick.net define este cookie para verificar se o navegador do utilizador suporta cookies.
UserMatchHistory	1 mês	Este cookie usado pelo LinkedIn para sincronizar os ID's dos Ads.
uuid2	3 meses	O cookie uuid2 e definido pela AppNexus e regista informacoes que ajudam a distinguir entre dispositivos e navegadores. Essas informacoes sao usadas para selecionar anuncios entregues pela plataforma e avaliar o desempenho do anuncio e seu pagamento atribuido.
VISITOR_PRIVACY_METADATA	5 meses 27 dias	Cookie utilizado pelo YouTube para rastrear e enriquecer as configurações de privacidade dos utilizadores na plataforma do YouTube.
YSC	sessão	Este cookie é usado pelo Youtube para guardar as visualizações de videos do youtube embebidos em páginas.
yt-remote-connected-devices	nunca	Este cookie é usado pelo YouTube para guardar as preferências de video do visitante nos videos embebidos.
yt-remote-device-id	nunca	Este cookie é usado pelo YouTube para guardar as preferências de video do visitante nos videos embebidos.
yt.innertube::nextId	nunca	Este cookie é usado pelo YouTube regista um ID único para guardar quais os vídeos que o visitante visualizou.
yt.innertube::requests	nunca	Used by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Duração	Descrição
_hjAbsoluteSessionInProgress	30 minutos	O Hotjar define este cookie para detetar a primeira sessao de visualizacao de pagina de um utilizador, o que e indicado por um valor Verdadeiro/Falso definido pelo cookie.
_icl_visitor_lang_js	1 dia	Este cookie é configurado pelo WPML WordPress plugin guarda o idioma redirecionado.
bscookie	2 anos	Este cookie é usado pelo LinkedIn guarda se o utlizador fez login com multi-factor
CONSENT	2 anos	Este coookie é usado pelo YouTube em videos embebidos e regista dados estatísticos anonimamente.
cxssh_status	3 meses 8 dias	Este cookie determina se o navegador aceita cookies.
lang	sessão	Este cookie é usado pelo LinkedIn para guardar a escolha do idioma do visitante no website linkedin.com.
li_gc	2 anos	Este cookie é usado pelo Linkedin para guardar o consentimento dos visitantes acerca do uso de cookies não essenciais.
lidc	1 dia	Este cookie é usado pelo LinkedIn para facilitar a escolha do datacenter.
VISITOR_INFO1_LIVE	5 meses 27 dias	Este cookie usado pelo YouTube para medir a largura de banda de modo a determinar se o visitante acede à nova ou à antiga interface.
wpml_browser_redirect_test	sessão	Este cookie é usado pelo WPML WordPress plugin é usado para testar se os cookies estão ativos no browser.
yt-remote-connected-devices	nunca	Este cookie é usado pelo YouTube para guardar as preferências de video do visitante nos videos embebidos.
yt-remote-device-id	nunca	Este cookie é usado pelo YouTube para guardar as preferências de video do visitante nos videos embebidos.