01-08-2023
Como construir soluções inteligentes com Generative AI?
por José Camacho, Senior .NET Developer & DevOps Team Lead @ Xpand IT
Não há dúvidas que inteligência artificial (AI) é a tendência tecnológica de 2023. Graças ao agora famoso ChatGPT, que acumula tanto conhecimento, o seu grande boom nos últimos meses foi de tal forma acelerado que os serviços e possibilidades por detrás do AI já são uma aposta fiável.
Nos últimos meses, as áreas de transformação digital da Xpand IT estão a trabalhar com AI, neste caso utilizando o Azure OpenAI Services, para criar customer facing apps, melhorar o employee empowerment ou criar soluções backend business driven para clientes nas áreas da banca, seguros, energias renováveis, retalho, etc.
No entanto, o que está por detrás da Inteligência Artificial? O que os serviços do OpenAI disponibilizam para preparar um sistema ou modelo capaz de prestar assistência personalizada? Promovemos algumas respostas neste blog post e no webinar com demo incluída no site de carreiras da Xpand IT.
Modelos de OpenAI
Existem vários modelos de inteligência artificial a serem frequentemente utilizados nas áreas de engenharia e desenvolvimento de software:
- Generative AI: os modelos que conseguem gerar texto, imagens e/ou também vídeos
- Large Language Model (LLM): os modelos de larga quantidade que contam com muitas horas de treino e investimento em GPUs
- Generative pre-trained transformers: a tecnologia disruptiva que está nos modelos de AI como o GPT, uma arquitetura de modelo de linguagem baseada em redes neurais e treinada por texto de várias fontes na Internet capaz de gerar texto coerente e fluente
Conceitos-chave para trabalhar com modelos de AI
A execução dos modelos de AI baseia-se nos seguintes conceitos/ações:
- Prompt: excerto de texto com algum contexto que indica ao modelo o que pretendemos
- Completion: o output, ou seja: o que o GPT gera com base no que foi pedido
- Token: parte ou totalidade das palavras processadas pelos modelos GPT
- Prompt Engineering: o processo de construção e validação de prompts com base em frases ou pedidos, dando contexto ao modelo para se comportar de determinada forma
Exemplos de prompt engineering com instruções, exemplos/contexto, input e output (que também poderás ver no nosso webinar exclusivo):
Exemplos de modelos com zero, one ou few shots – exemplos que permitem dar maior conhecimento ao modelo para chegar ao resultado esperado de um pedido:
Mais a saber sobre os Large Language Models (LLM)
Como já poderás ter visto no ChatGPT, muitas pessoas fazem a mesma pergunta. No entanto, a resposta a essa mesma pergunta poderá ser diferente para cada utilizador porque a base dos LLMs é probabilística – é aqui que podemos começar a falar dos limites da eficácia da inteligência artificial.
A base probabilística pode gerar:
- Alucinação: outputs que não são suportados pelo input ou estão factualmente incorretos
- Outputs inapropriados: que podem conter conteúdo ofensivo ou sensível que seja difícil de monitorizar ou corrigir comportamento
- Dados desatualizados ou irrelevantes à medida que emerge nova informação. Treinar estes modelos exige muita computação, tempo e otimização constante
- Limite no número de tokens: incapacidade de input de grandes documentos para dar todo um contexto a um prompt
Alguns casos de uso de Large Language Models:
- Generation: gerar texto a partir de um prompt curto (o que faz o ChatGPT)
- Summarization: resumir um grande texto/prompt (por exemplo de um livro)
- Rewrite: capacidade de reescrever texto através de um prompt source text
- Extraction: extrair texto específico de um prompt source text
- Classification: classificar texto de um prompt sample text
- Search: pesquisa semântica
- Clustering: agrupar informação
Como usar Inteligência Artificial na Cloud? Azure OpenAI Services
O Azure OpenAI Services é um serviço cloud da Microsoft criado para empresas e que permite criar soluções personalizadas com base nos modelos de OpenAI existentes no mercado:
- GPT3, GPT4 e ChatGPT: modelo que gera texto para várias utilizações e aplicações
- Codex: modelo especializado em código, capacidade de gerar código, está por detrás do GitHub Copilot (extensão para o Visual Studio Code)
- DALL-E 2: gerar imagens com base em texto que, por exemplo, está disponível no Bing da Microsoft
Descobre mais sobre como utilizamos o Azure OpenAI Services e os seus modelos com três casos de uso distintos: pesquisa semântica; perguntas e respostas com pesquisa semântica a partir de um documento; e em suporte/assistência para clientes – com demonstração da arquitetura/prompt engineering de cada um deles.
Leave a comment
Comments are closed.