Marinho T.I: 2026

quarta-feira, 22 de julho de 2026

Arquitetura Orientada a Eventos: Quando as APIs Síncronas Deixam de Ser Suficientes

Fala turma, tudo certo?

"Sua aplicação trava porque um serviço externo demorou 5 segundos para responder? Está na hora de falarmos sobre desacoplamento real."

No mundo dos microsserviços, a comunicação entre diferentes partes de um sistema é fundamental. Por muito tempo, as APIs síncronas (baseadas em requisição/resposta HTTP) foram a espinha dorsal dessa comunicação. Elas são simples de entender e implementar, mas, à medida que a complexidade e a escala aumentam, suas limitações se tornam evidentes. É nesse ponto que a Arquitetura Orientada a Eventos (EDA) se apresenta como uma alternativa poderosa, promovendo um desacoplamento mais profundo e uma resiliência superior.

O Problema do Acoplamento em Microsserviços

Com APIs síncronas, um serviço (o cliente) faz uma requisição a outro serviço (o servidor) e espera por uma resposta. Se o servidor estiver lento, indisponível ou falhar, o cliente também é afetado. Isso cria um acoplamento temporal e de disponibilidade, onde a saúde de um serviço depende diretamente da saúde de outro. Em um ecossistema de dezenas ou centenas de microsserviços, isso pode levar a falhas em cascata e a um sistema frágil.

Vantagens do Event-Driven: Resiliência e Escalabilidade

A EDA inverte essa lógica. Em vez de serviços se comunicarem diretamente, eles publicam eventos (fatos que aconteceram no sistema) em um event broker (como Kafka, RabbitMQ ou AWS SQS/SNS). Outros serviços interessados nesses eventos (os consumidores) podem se inscrever e reagir a eles de forma assíncrona. Isso traz benefícios significativos:

Desacoplamento: Produtores e consumidores de eventos não precisam saber da existência um do outro. Eles se comunicam indiretamente através do event broker. Isso permite que os serviços evoluam independentemente.

Resiliência: Se um serviço consumidor estiver fora do ar, o evento permanece no broker e pode ser processado quando o serviço voltar. O produtor não é afetado pela falha do consumidor.

Escalabilidade: Novos consumidores podem ser adicionados facilmente para processar o mesmo evento, permitindo escalar a capacidade de processamento sem impactar os produtores.

Reatividade: Sistemas podem reagir a mudanças em tempo real, permitindo experiências de usuário mais dinâmicas e processos de negócio mais ágeis.

Casos de Uso: Onde a EDA Brilha

A Arquitetura Orientada a Eventos é particularmente eficaz em cenários que exigem alta disponibilidade, escalabilidade e processamento assíncrono. Alguns exemplos:

Processamento de Pagamentos: Em um marketplace (como discutido na postagem sobre API-First), um evento de "pagamento recebido" pode desencadear múltiplos processos em paralelo: atualização de estoque, notificação ao vendedor, envio de e-mail ao comprador, etc. Se um desses processos falhar, os outros não são impedidos.

Notificações: Um evento de "novo pedido" pode gerar notificações via e-mail, SMS, push notification, sem que o serviço de pedidos precise saber como cada tipo de notificação é enviado.

Sincronização de Dados: Manter diferentes sistemas (CRM, ERP, Data Warehouse) atualizados com eventos de negócio de forma consistente e assíncrona.

IoT e Streaming de Dados: Processar grandes volumes de dados gerados por sensores ou dispositivos em tempo real.

Embora APIs síncronas ainda tenham seu lugar, a Arquitetura Orientada a Eventos oferece uma abordagem mais robusta e flexível para construir sistemas distribuídos e escaláveis. Ao abraçar o desacoplamento e a comunicação assíncrona, as organizações podem criar aplicações mais resilientes, reativas e capazes de lidar com a complexidade do mundo digital moderno. É uma mudança de paradigma que vale a pena explorar para levar suas arquiteturas ao próximo nível!

:wq!

quarta-feira, 15 de julho de 2026

LLMOps: O Desafio de Colocar a I.A. Generativa em Produção (e manter ela lá)

Fala pessoal, todos bem?

"Ter um chat legal no computador é fácil. O desafio real começa quando você precisa que ele responda 10 mil usuários por segundo sem 'alucinar'."

Nos últimos anos, a Inteligência Artificial Generativa (GenAI), especialmente os Large Language Models (LLMs), saiu dos laboratórios de pesquisa e invadiu o nosso dia a dia. Mas, transformar um protótipo fascinante em uma solução robusta e escalável em produção é uma história completamente diferente. É aqui que entra o LLMOps, a disciplina que adapta os princípios de DevOps para o ciclo de vida complexo dos modelos de linguagem.

GenAI vs. LLMs

LLMOps (Operações de Grandes Modelos de Linguagem)

Conjunto de práticas, ferramentas e processos usados para gerenciar, implementar, monitorar e otimizar modelos como GPT-4, LLaMA ou Claude em produção. Ele transforma protótipos de IA em aplicações empresariais escaláveis, controlando custos, latência, qualidade das respostas e mitigando "alucinações".

Do DevOps Tradicional ao LLMOps

Se você já trabalha com DevOps, sabe que a automação, a integração contínua (CI), a entrega contínua (CD) e a observabilidade são pilares fundamentais. No entanto, LLMs trazem desafios únicos que exigem uma abordagem mais especializada:

Gerenciamento de Dados: LLMs são famintos por dados. A curadoria, versionamento e monitoramento da qualidade dos datasets de treinamento e fine-tuning (processo de ajustar um modelo já treinado para que ele execute tarefas com mais precisão em um contexto específico) são cruciais. Um dado ruim pode levar a um modelo enviesado ou com "alucinações".

Versionamento de Modelos: Não basta versionar o código. É preciso versionar o modelo, seus pesos, os dados de treinamento e até mesmo os prompts utilizados. Capacidade de repetir é a chave.

Versionamento - Sequência

Monitoramento e Observabilidade: Além das métricas tradicionais de infraestrutura (CPU, memória), precisamos monitorar métricas específicas de LLMs, como latência de inferência, custo por token, taxa de "alucinações", qualidade das respostas e desvio de comportamento ao longo do tempo. Um modelo que funciona bem hoje pode começar a degradar amanhã devido a mudanças nos dados de entrada ou no ambiente.

Observabilidade - Exemplo Dashboard

Aqui vale mencionar uma experiência que já tive. Conversando num mesmo chat sobre temos diversos e espaçados com o tempo, o chat começa a misturar o tema quando recebe uma pergunta "aberta". As vezes pedimos apenas para ele dar opções quando a troca de uma palavra, queremos uma palavra mais simples ou diferente, daí ele tenta colocar ela no contexto de algo que foi conversado sem ter a menor relação.

O Papel Crucial dos Dados e do Feedback Loop

Em LLMOps, o modelo não é um artefato estático. Ele está em constante evolução. Um feedback loop robusto é essencial para coletar as interações dos usuários, identificar falhas, refinar prompts e, eventualmente, retreinar ou ajustar o modelo. Isso garante que a I.A. continue aprendendo e melhorando, mantendo sua relevância e precisão em um ambiente dinâmico.

Feedback Loop - Fluxograma

Observabilidade em LLMs

Enquanto na observabilidade tradicional focamos em logs, métricas e traces de aplicações, em LLMs precisamos ir além. Imagine um cenário onde seu LLM começa a gerar respostas inadequadas ou a ter um custo de inferência exorbitante. Sem as ferramentas certas, identificar a causa raiz pode ser um pesadelo. A observabilidade em LLMs deve cobrir:

Custo: Monitorar o consumo de tokens e o custo associado às chamadas de API ou inferências locais.

Latência: Garantir que as respostas sejam rápidas o suficiente para a experiência do usuário.

Qualidade da Resposta: Métricas como pertinência, coerência, toxicidade e "alucinações" são vitais. Ferramentas de avaliação humana (Human-in-the-Loop) e métricas automatizadas (como RAGAS para RAG) são indispensáveis.

Desvio de Dados/Modelo: Detectar quando os dados de entrada ou o comportamento do modelo em produção começam a divergir significativamente do que foi observado durante o treinamento.

Fechando nosso entendimento...

LLMOps não é apenas um conjunto de ferramentas, mas uma cultura que visa trazer a mesma maturidade e eficiência que temos no desenvolvimento de software tradicional para o mundo da Inteligência Artificial Generativa. É a ponte entre a inovação e a entrega de valor real, garantindo que a I.A. não seja apenas inteligente, mas também confiável, escalável e sustentável em produção.

LLMOps - Workflow

Tudo que envolve I.A também é um desafio, nada fora do "normal" na vida das empresas e principalmente de quem trabalha com tecnologia.

Até o próximo post.

Abs

:wq!

quinta-feira, 9 de julho de 2026

API-First: O segredo por trás da agilidade dos grandes Marketplaces

Fala turma, tudo certo?

"Em um marketplace, sua API é o seu produto. Se ela não é escalável, o seu negócio também não é."

Quando pensamos em grandes marketplaces, normalmente lembramos do aplicativo, do site ou da experiência do usuário.

Mas existe uma camada que praticamente ninguém vê e que sustenta tudo isso.

As APIs.

São elas que conectam vendedores, compradores, meios de pagamento, logística, antifraude, ERPs, CRMs e dezenas (às vezes centenas) de sistemas internos e externos.

É por isso que empresas que adotam uma estratégia API-First conseguem evoluir seus produtos muito mais rapidamente.

Não porque escrevem código mais rápido. Mas porque constroem uma plataforma preparada para crescer.

O que significa API-First?

Muita gente acredita que API-First é simplesmente desenvolver a API antes do frontend.

Na verdade, é uma mudança de mentalidade.

Primeiro é definido o contrato.

Depois vem a implementação.

Isso faz com que diferentes equipes consigam trabalhar em paralelo.

Enquanto uma equipe implementa a API, outra desenvolve o frontend, outra cria testes automatizados e outra prepara integrações.

Tudo baseado no mesmo contrato.

Exemplo de um contrato OpenAPI

openapi: 3.0.3
paths:
/orders:
post:

summary: Criar um novo pedido
requestBody:
required: true
content:
application/json:

schema:
type: object
properties:
productId:
type: integer
quantity:
type: integer

responses:
"201":
description: Pedido criado com sucesso

Esse contrato já permite que diferentes equipes trabalhem em paralelo:

👨‍💻 Backend implementa a API.
🎨 Frontend desenvolve a interface.
🧪 QA cria testes automatizados.
📚 Arquitetura publica a documentação.
🤝 Parceiros começam a integrar seus sistemas.

Tudo isso antes mesmo da API existir.

Um exemplo simples

Fluxo Marketplace

Imagine um marketplace onde um cliente realiza uma compra.

Parece uma única ação. Certo?

Mas, por trás dela, diversas integrações acontecem simultaneamente:

➡️ Cadastro do pedido
➡️ Reserva do estoque
➡️ Processamento do pagamento
➡️ Cálculo do frete
➡️ Geração da nota fiscal
➡️ Notificação ao vendedor
➡️ Atualização do aplicativo do comprador

Tudo isso acontece através de APIs.

Se apenas uma delas falhar ou não escalar, toda a experiência do usuário é ou pode ser comprometida.

O contrato vale mais que a implementação

Em arquiteturas modernas, o contrato da API é praticamente um acordo entre equipes.

Ele define:

Recursos disponíveis
Métodos HTTP
Estrutura das requisições
Estrutura das respostas
Códigos de retorno
Regras de autenticação
Versionamento

Quando esse contrato é bem definido, as equipes trabalham de forma independente, reduzindo retrabalho e acelerando entregas.

API-First também significa pensar em segurança desde o início

Não adianta ter uma API rápida se ela não é segura.

Algumas práticas que considero fundamentais:

OAuth2 ou OpenID Connect
Rate Limiting
Versionamento
Idempotência para operações críticas
Logs centralizados
Observabilidade
Documentação automática com OpenAPI

Escalabilidade não é apenas adicionar mais servidores

Imagine que uma promoção gera um pico de 500 requisições por segundo.

Sua API consegue responder?
Seu banco suporta essa carga?
Os serviços downstream acompanham?
Existe cache?
Existe fila para processamento assíncrono?
Existe Circuit Breaker caso um serviço fique indisponível?

Essas perguntas fazem parte do desenho da arquitetura.

Não são problemas que deveriam ser descobertos em produção.

O que vejo funcionando em projetos corporativos

API Gateway centralizando autenticação e roteamento.
Contratos definidos antes da implementação.
OpenAPI/Swagger como fonte oficial da documentação.
Observabilidade desde o primeiro deploy.
Versionamento planejado.
Integrações desacopladas utilizando eventos quando possível.
Testes de contrato para evitar que uma alteração quebre consumidores existentes.

No fim, API-First não é sobre tecnologia.

É sobre criar um ecossistema onde diferentes times conseguem evoluir seus produtos de forma independente, segura e previsível.

Quanto maior a empresa, mais importante isso se torna.

Porque, em arquiteturas distribuídas, uma boa API deixa de ser apenas uma interface de integração.

Ela passa a ser um produto.

E produtos precisam ser pensados para evoluir.

Na sua opinião, qual é o erro mais comum que você encontra em APIs corporativas? Contratos mal definidos, falta de versionamento, segurança ou outro ponto?

Abs e até a próxima.

:wq!

terça-feira, 7 de julho de 2026

O "Novo ITIL": Como a governança acelera (e não trava) o DevOps.

Fala pessoal, tudo bem?

Durante muito tempo, criou-se a ideia de que ITIL e DevOps eram conceitos opostos.

De um lado, processos, governança e controles.
Do outro, velocidade, automação e entregas frequentes.

Na prática, as empresas mais maduras descobriram justamente o contrário.

Agilidade sem controle é o caminho mais rápido para o caos operacional.

Deploys rápidos não significam necessariamente entregas de qualidade.
Automatizar um processo ruim apenas faz com que o erro aconteça mais rápido.

O ITIL evoluiu muito.

Ele deixou de ser um conjunto de processos burocráticos para se tornar um modelo de Gestão de Serviços Orientado à Geração de Valor.

Isso conversa diretamente com os princípios do DevOps.

Veja alguns exemplos:

✅ Gestão de Mudanças (Change Enablement)

Antigamente: Toda mudança precisava passar por reuniões longas e aprovações manuais.

Hoje: Mudanças de baixo risco podem ser aprovadas automaticamente através de pipelines de CI/CD, desde que atendam critérios previamente definidos.

Resultado: Mais velocidade, menos risco e total rastreabilidade.

✅ Gerenciamento de Incidentes

Não basta restaurar um serviço rapidamente.

É importante entender:

O que aconteceu?
Como evitar que aconteça novamente?
O que pode ser automatizado para reduzir o impacto?

É aí que entram práticas como Post-Mortem, Blameless Culture e observabilidade.

✅ Gerenciamento de Problemas

Resolver o incidente é apenas o primeiro passo.

Eliminar a causa raiz é o que realmente aumenta a confiabilidade da plataforma.

✅ Gerenciamento de Configuração (CMDB)

Em ambientes modernos, infraestrutura como código (IaC) torna os ambientes reproduzíveis, auditáveis e muito mais fáceis de governar.

A documentação deixa de depender apenas de planilhas e passa a fazer parte do próprio código.

O que vejo funcionando nas empresas

Automação para mudanças repetitivas.
Aprovação humana apenas quando realmente agrega valor.
Monitoramento e observabilidade desde o desenvolvimento.
Processos simples e claros.
Métricas para apoiar decisões, não para gerar burocracia.

No fim, o objetivo não é seguir o ITIL "ao pé da letra".

O objetivo é criar processos que permitam entregar software com velocidade, segurança, previsibilidade e qualidade.

Governança não existe para impedir mudanças.
Ela existe para permitir que elas aconteçam com confiança.

Na minha experiência, as equipes que conseguem equilibrar automação, boas práticas de engenharia e governança são justamente as que entregam mais valor ao negócio.

E você?

Na sua empresa, a governança acelera as entregas ou ainda é vista como um obstáculo?

Compartilha com a gente nos comentários.

Abs e até a próxima.
:wq!

sexta-feira, 3 de julho de 2026

Observabilidade: Você está olhando para o futuro ou para o retrovisor?

E aí pessoal. Tudo bem?

"Se o seu time só olha para o dashboard depois que o cliente reclamou, você não tem observabilidade, você tem um retrovisor."

Ao longo da minha trajetória gerenciando infraestruturas críticas e ambientes de alta escala, uma lição se tornou fundamental: a diferença entre Monitoração e Observabilidade é o que define a resiliência de um ecossistema tecnológico.

Muitos times ainda estão presos ao modelo de monitoração reativa: "O servidor caiu? O alerta tocou?".

Isso é importante, mas é apenas o básico. A verdadeira Observabilidade vai além: ela nos permite entender o PORQUÊ algo aconteceu, mesmo em cenários complexos e distribuídos que nunca previmos.

🔹 Monitorar é saber QUE algo quebrou.

🔹 Observar é entender POR QUE quebrou e como evitar que se repita.

Para elevar a maturidade operacional em arquiteturas modernas (como clusters Kubernetes e microsserviços), precisamos focar em três pilares estratégicos:

SAÚDE DO NEGÓCIO, NÃO APENAS DA INFRAESTRUTURA: De nada adianta uma infraestrutura com baixo consumo de recursos se a jornada do usuário está travada. A observabilidade eficaz conecta métricas técnicas (Golden Signals) com indicadores de negócio em tempo real.

COMBATE À FADIGA DE ALERTAS: Alertas em excesso geram cegueira operacional. Estratégias inteligentes de APM e Logs estruturados devem servir para filtrar o que é crítico, permitindo que o time foque na resolução de problemas reais, e não em "apagar incêndios" constantes.

OBSERVABILIDADE POR DESIGN: A visibilidade não deve ser um "puxadinho" feito depois que o código está pronto. Ela deve ser parte do desenho da solução. Quando pensamos em como o sistema será observado desde a arquitetura, o tempo médio de resolução (MTTR) cai e a confiabilidade sobe.

No final do dia, observar é sobre ter VISIBILIDADE para tomar decisões rápidas e garantir que a tecnologia realmente suporte o crescimento do negócio com segurança.

E na sua experiência? Como você tem equilibrado a necessidade de monitorar a infraestrutura com a visão real da experiência do usuário?

Vamos trocar ideias nos comentários! 👇

Abs

:wq!

segunda-feira, 29 de junho de 2026

As habilidades que mais me ajudaram na carreira (e não foram técnicas)

E aí pessoal. Tudo bem?

Durante muito tempo achei que minha evolução na carreira dependeria apenas de aprender novas tecnologias.

Depois de participar de diferentes projetos, lidar com incidentes, mudanças de ambiente e trabalhar com equipes multidisciplinares, percebi que algumas habilidades fizeram muito mais diferença do que eu imaginava.

💬 Comunicação

Não basta saber resolver um problema ou explicar todos os detalhes técnicos durante uma reunião se o seu público não for 100% técnico.

É preciso explicar soluções, alinhar expectativas, registrar decisões e conversar com pessoas de diferentes áreas.

De forma geral, você precisa se fazer entender.

📋 Organização

Projetos envolvem prioridades, prazos e diversas demandas simultâneas.

Ser organizado reduz retrabalho e aumenta a confiança da equipe.

Tempo é uma das moedas mais valiosas que temos hoje, tanto no mercado de trabalho quanto na vida pessoal.

📚 Documentação

A documentação não serve apenas para quem chega depois.

Ela economiza tempo, reduz erros e facilita a continuidade dos projetos.

Mas lembre-se: Ela precisa ser objetiva, contextualizada e fácil de manter.

🔎 Curiosidade

Grande parte do que aprendi veio da vontade de entender como as coisas realmente funcionam.

Perguntar, pesquisar e experimentar sempre acelerou meu aprendizado.

Também aprendi que vale muito a pena se aproximar de outras áreas e de outros times. Isso amplia a visão do negócio, ajuda a entender o contexto como um todo e torna as conversas muito mais produtivas. Não olhar apenas para o próprio "quadrado" faz diferença.

🚀 Aprendizado contínuo

Na tecnologia, tudo muda muito rápido. Ainda mais nos dias atuais.

O aprendizado deixou de ser um diferencial. Hoje ele faz parte da profissão.

Mais importante do que conhecer uma ferramenta específica é desenvolver o hábito de aprender constantemente.

🤝 Trabalho em Equipe

Os melhores resultados que participei nunca foram fruto de uma única pessoa.

Compartilhar conhecimento, ouvir opiniões e colaborar faz toda a diferença.

Quem nunca trabalhou com aquele profissional que parece ser o único capaz de resolver determinados problemas?

Durante a minha carreira encontrei vários profissionais assim. Embora sejam extremamente competentes, esse cenário normalmente revela um problema do processo, não da pessoa. Quando o conhecimento fica concentrado, surgem dependências desnecessárias, documentações frágeis e uma equipe menos preparada para crescer.

Hoje continuo estudando novas tecnologias, mas valorizo cada vez mais essas habilidades. São elas que transformam conhecimento técnico em resultados, fortalecem equipes e fazem diferença no longo prazo.

E para você?

Qual habilidade não técnica mais impactou sua carreira?
Existe alguma habilidade que você gostaria de ter desenvolvido antes?

“A tecnologia abre portas. São as habilidades humanas que ajudam a permanecer, crescer e gerar impacto dentro delas."

#Liderança #Tecnologia #SoftSkills

quarta-feira, 22 de julho de 2026

Arquitetura Orientada a Eventos: Quando as APIs Síncronas Deixam de Ser Suficientes

O Problema do Acoplamento em Microsserviços

Vantagens do Event-Driven: Resiliência e Escalabilidade

Casos de Uso: Onde a EDA Brilha

A Arquitetura Orientada a Eventos é particularmente eficaz em cenários que exigem alta disponibilidade, escalabilidade e processamento assíncrono. Alguns exemplos:

quarta-feira, 15 de julho de 2026

LLMOps: O Desafio de Colocar a I.A. Generativa em Produção (e manter ela lá)

Do DevOps Tradicional ao LLMOps

Fechando nosso entendimento...

quinta-feira, 9 de julho de 2026

API-First: O segredo por trás da agilidade dos grandes Marketplaces

O que significa API-First?

Um exemplo simples

O contrato vale mais que a implementação

API-First também significa pensar em segurança desde o início

Escalabilidade não é apenas adicionar mais servidores

O que vejo funcionando em projetos corporativos

terça-feira, 7 de julho de 2026

O "Novo ITIL": Como a governança acelera (e não trava) o DevOps.

O que vejo funcionando nas empresas

sexta-feira, 3 de julho de 2026

Observabilidade: Você está olhando para o futuro ou para o retrovisor?

segunda-feira, 29 de junho de 2026

As habilidades que mais me ajudaram na carreira (e não foram técnicas)

Política de conteúdo