Você já parou para pensar como seria aparecer numa transmissão ao vivo do Maracanã, flagrado pela câmera de TV entre bandeiras, copos e camisas do seu time, sem ter saído do sofá? Essa pergunta, que parece absurda, é exatamente o que uma trend viral está respondendo com resultados que chegam a confundir até olhos treinados. Vídeos de pessoas aparecendo nas arquibancadas de grandes estádios, com aquele granulado característico de câmera de transmissão esportiva, tomaram o Instagram nas últimas semanas e acumulam milhões de visualizações.

O que torna esse fenômeno curioso não é só o resultado final, mas o processo por trás dele: duas ferramentas de inteligência artificial, um prompt bem calibrado e uma foto com boa iluminação. A combinação entre o futebol — o esporte de maior apelo emocional do Brasil — e a democratização das ferramentas de IA criou uma equação quase irresistível para quem consome e produz conteúdo nas redes sociais.

Por que o ChatGPT Images 2.0 entrega um resultado tão convincente

A primeira etapa da trend usa o ChatGPT com o modelo Images 2.0, lançado pela OpenAI no início de 2025, que representa um salto técnico considerável em relação às versões anteriores no que diz respeito à preservação de feições humanas. Para entender por que o resultado é tão realista, preciso fazer uma analogia de engenharia: pense no prompt como um conjunto de parâmetros de entrada num sistema de controle. Quanto mais precisos os parâmetros, mais previsível e fiel é a saída. O segredo desta trend está em instruir a IA a fazer exatamente o contrário do que ela naturalmente tende a fazer — embelezar.

O prompt recomendado pelos usuários que testaram a trend, incluindo a equipe do TechTudo, instrui o modelo a não suavizar a pele, não corrigir a mandíbula e não aplicar filtros. Tecnicamente, é como desativar o controle de ganho automático de uma câmera: você perde o conforto visual, mas ganha autenticidade. O resultado simula o granulado, o motion blur leve e a iluminação irregular típicos de câmeras de transmissão esportiva operando em condições de alta velocidade e luminosidade variável de estádio. O plano gratuito do ChatGPT já inclui acesso ao Images 2.0, com limite de gerações por dia; o plano Plus, disponível por US$ 20 por mês, remove essa restrição.

Por que o ChatGPT Images 2.0 entrega um resultado tão convincente Você apareceu
Por que o ChatGPT Images 2.0 entrega um resultado tão convincente Você apareceu

O passo a passo completo com os prompts que a trend usa

A criação acontece em duas etapas sequenciais, cada uma com sua ferramenta específica. Segundo apuração do SportNavo com base nos tutoriais testados pelas principais publicações de tecnologia do país, o fluxo funciona assim:

  1. Escolha da foto base: uma selfie simples, com rosto bem visível, boa iluminação frontal e enquadramento limpo. Fotos com fundo neutro tendem a gerar resultados mais naturais porque a IA tem menos elementos para interpretar incorretamente.
  2. Upload no ChatGPT: abra uma conversa, faça o upload da imagem e cole o seguinte prompt, substituindo o campo indicado pelo seu clube:
"Gere um espectador comum usando a foto em anexo sem mudar o rosto, flagrado acidentalmente por uma câmera de transmissão ao vivo de futebol. Sem efeitos artificiais. A pessoa está levemente virada para a esquerda, olhando para o campo, acompanhando o jogo. Cena de arquibancada com torcida ao redor, clima realista de estádio, pessoas usando camisas do [SEU TIME] versão 2026, copos, bandeiras e acessórios de torcida. Sem exageros no rosto, sem aparência de ensaio fotográfico, sem suavização excessiva da pele. Estilo transmissão esportiva ao vivo, proporção 16:9, resolução 4K."

Com a imagem gerada, a segunda etapa é levá-la ao Kling AI, plataforma de animação de vídeo com inteligência artificial desenvolvida pela empresa chinesa Kuaishou Technology. É aqui que a cena ganha vida: a câmera balança levemente, as pessoas ao redor se movem, a bandeira tremula ao vento. O prompt para animação instrui a ferramenta a manter "qualidade de transmissão ao vivo, leve desfoque de movimento, textura realista da pele, iluminação natural de estádio e movimentação suave da torcida", com a instrução central de que a pessoa parece não perceber a câmera — exatamente como acontece nos flagras reais de transmissão.

Do ponto de vista técnico, o Kling AI usa um modelo de difusão temporal para interpolar frames entre a imagem estática e os movimentos gerados, o que produz aquela sensação de câmera handheld que os cinegrafistas de estádio conhecem bem. É a mesma lógica do optical flow usado em softwares de edição profissional, mas executado automaticamente por IA a partir de um único frame de entrada.

O que essa trend revela sobre a relação entre IA e conteúdo esportivo

Existe uma camada mais profunda nesse fenômeno que vai além do entretenimento. A trend da arquibancada é, na prática, um experimento coletivo e involuntário sobre os limites da percepção humana diante de conteúdo gerado por IA. Quando o resultado é convincente o suficiente para enganar seguidores e até jornalistas, a pergunta sobre autenticidade se torna urgente no contexto esportivo — um ambiente onde a imagem ao vivo é, historicamente, sinônimo de verdade.

Para o criador de conteúdo comum, a trend representa uma porta de entrada acessível para ferramentas que, há dois anos, exigiam conhecimento técnico avançado ou orçamento profissional. O ChatGPT Images 2.0 e o Kling AI juntos entregam, em menos de dez minutos e sem custo obrigatório, um produto que uma produtora de vídeo cobraria horas de trabalho para criar. A escala desse acesso é o que diferencia 2026 de qualquer momento anterior na história da criação de conteúdo digital.

Para quem quer refinar o resultado além do básico, três ajustes fazem diferença mensurável: usar foto com iluminação lateral suave (que imita melhor a luz de refletores de estádio), especificar no prompt o estádio ou cidade desejada para que a IA construa um contexto arquitetônico mais coerente, e no Kling AI, reduzir a intensidade do movimento gerado para evitar distorções nas bordas do rosto — o ponto onde os modelos ainda erram com mais frequência. A trend segue crescendo, e quem dominar esses parâmetros sairá na frente quando o próximo jogo grande acontecer.

A câmera imaginária varre a arquibancada, para por dois segundos num rosto que nunca esteve lá, e segue em frente — e ninguém no estádio percebe a diferença.