Todo mundo sabe que o gol de Vinicius Júnior aos 31 minutos do primeiro tempo contra Marrocos foi celebrado por 12 milhões de pessoas ao mesmo tempo. O que pouca gente sabe é que essas 12 milhões de pessoas não viram o mesmo instante — e que essa defasagem de 30 segundos revela mais sobre a maturidade do ecossistema digital brasileiro do que qualquer número de audiência isolado.

O que acontece nos bastidores antes de o gol aparecer na sua tela

A imagem de um jogo de futebol não nasce na tela do espectador. Ela percorre um trajeto que começa no estádio, passa por centros de produção, atravessa cabos de fibra óptica e satélites, é processada por servidores distribuídos geograficamente e só então chega ao dispositivo do torcedor. Cada uma dessas etapas consome milissegundos que, somados, produzem o fenômeno chamado de latência — ou, no vocabulário popular, delay. Na partida entre Brasil e Marrocos neste sábado (13), pela primeira rodada do Grupo C da Copa do Mundo, a defasagem registrada na CazéTV foi de aproximadamente 30 segundos em relação ao tempo real.

Luiz Carlos Abrahão, diretor de tecnologia da Associação Brasileira de Emissoras de Rádio e Televisão (Abert), contextualiza a discussão com precisão técnica:

"Quando se fala em transmissão 'sem delay', trata-se mais de uma forma de comunicação com o público do que de uma descrição técnica literal. O que a tecnologia busca hoje é reduzir a latência a níveis praticamente imperceptíveis."

A engenharia de streaming evoluiu de forma considerável nos últimos anos. Tecnologias como o LL-HLS (Low Latency HTTP Live Streaming) e o WebRTC reduzem o tamanho dos blocos de vídeo transmitidos e tornam o uso do buffer — uma área de armazenamento temporário na memória — mais eficiente. O buffer funciona como uma reserva de segurança: ele armazena alguns segundos de vídeo para compensar oscilações na conexão e evitar travamentos. Quanto menor o buffer, menor o delay, mas maior o risco de interrupções.

Há aqui uma tensão estrutural que qualquer estudante de engenharia de redes reconheceria: estabilidade e velocidade são objetivos conflitantes. Reduzir a margem de segurança do buffer para entregar a imagem mais rápido significa apostar que a conexão do usuário se manterá estável. Com 12 milhões de acessos simultâneos, essa é uma aposta de alto risco.

O recorde de 12 milhões e o que ele diz sobre o mercado de transmissões

Antes mesmo de a bola rolar em Agadir, a CazéTV já havia superado 9 milhões de usuários simultâneos — e assim que o árbitro apitou o início da partida, o canal ultrapassou os 11 milhões, chegando ao pico de 12 milhões de acessos simultâneos, o maior número desde a criação do canal em 2022. Para comparação, o recorde anterior havia sido registrado no jogo entre Brasil e Croácia na Copa do Mundo de 2022 — a eliminação nos pênaltis nas quartas de final — com 6,9 milhões de simultâneos. O crescimento em quatro anos é de 73,9%.

Esses números precisam ser lidos dentro de um contexto mais amplo de distribuição de audiência. A Globo, somando TV Globo, SporTV e Ge TV, alcançou 46,4 milhões de pessoas durante a estreia do Mundial — o equivalente a 25% de todo o público conectado no período. Na TV aberta, a cerimônia de abertura registrou 16 pontos de audiência, crescimento de 39% em relação à média da faixa horária. O SBT marcou 4,18 pontos de média durante o jogo inaugural, com pico de 4,49 no Painel Nacional de Televisão.

O que esses dados revelam, em conjunto, é um mercado em fase de coexistência, não de substituição. A televisão linear ainda detém uma escala que o streaming não alcança — mas o streaming avança com uma velocidade que a televisão linear não consegue replicar.

"O buffer continua sendo um elemento essencial, funcionando como uma reserva que ajuda a garantir uma transmissão mais estável e uma melhor experiência para o usuário", reforça Abrahão, da Abert.

Por que o delay importa além da tecnologia

Há uma cena em A Rede Social, o filme de David Fincher, em que Eduardo Saverin pergunta a Mark Zuckerberg por que ele quer escalar o Facebook tão rapidamente, antes de ter um modelo de negócio sustentável. A resposta de Zuckerberg é direta: porque se você não está crescendo, alguém está crescendo no seu lugar. A lógica da CazéTV na Copa do Mundo de 2026 segue um raciocínio semelhante — crescer a audiência agora, mesmo com imperfeições técnicas, para construir o ativo mais valioso do mercado de mídia: a hábito do espectador.

O delay de 30 segundos não impediu 12 milhões de pessoas de escolherem a plataforma. Isso é um dado comportamental relevante: a tolerância do público ao atraso técnico é maior do que a tolerância à ausência de conteúdo. A CazéTV transmite todos os 104 jogos da Copa do Mundo de 2026, uma cobertura que nenhum veículo de TV aberta oferece com a mesma amplitude.

Do ponto de vista do investimento em infraestrutura, o custo de reduzir o delay de 30 segundos para, digamos, 5 segundos envolve servidores de borda distribuídos (CDN), contratos de largura de banda com operadoras e engenharia de software especializada. Esses custos são repassados, direta ou indiretamente, ao modelo de monetização — seja por publicidade, assinatura ou patrocínio. Com 12 milhões de simultâneos, a equação começa a fazer sentido econômico.

Para o espectador que quer reduzir o delay na prática, as opções passam por conexão via cabo em vez de Wi-Fi, fechar aplicativos em segundo plano, usar o aplicativo nativo em vez do navegador e, quando possível, reduzir a resolução do vídeo — o que diminui o volume de dados processados e, consequentemente, o buffer necessário. Nenhuma dessas medidas elimina o delay; elas apenas o comprimem.

O recorde de 12 milhões e o que ele diz sobre o mercado de transmissões 30 segun
O recorde de 12 milhões e o que ele diz sobre o mercado de transmissões 30 segun

O Brasil joga sua segunda partida no Grupo C da Copa do Mundo 2026 na próxima quarta-feira, e a CazéTV já anunciou que manterá a transmissão simultânea com todos os jogos da fase de grupos. A questão que os engenheiros da plataforma terão de responder até lá é se 12 milhões de acessos simultâneos representam o teto do sistema atual — ou apenas o piso do que está por vir.