Por trás da “For You”: Como funcionam os algoritmos!

Por trás da “For You”: Como funcionam os algoritmos!

O Problema Computacional

Todos os dias, bilhões de vídeos são publicados na internet. Apenas no TikTok, estima-se que 34 milhões de conteúdos sejam enviados diariamente. Diante disso, surge um problema computacional gigantesco: como uma plataforma escolhe, entre milhões de opções, qual será o vídeo que aparecerá na sua tela nos próximos segundos?

Por mais que pareça algo simples, os sistemas de recomendação modernos estão entre as tecnologias mais complexas já criadas pela computação. As redes sociais como Facebook, YouTube e Instagram não organizam conteúdos de forma cronológica há muito tempo. Em vez disso, utilizam modelos matemáticos capazes de prever comportamento humano, ou seja, o feed não é apenas uma sequência aleatória de vídeos. Ele é o resultado de milhares de cálculos estatísticos acontecendo em tempo real.

Mas para entender como isso funciona, primeiro precisamos abandonar uma ideia que é muito comum. Os algoritmos não te conhecem!

Para um computador, não existe humor, opinião, interesse ou tristeza. Eles não sabem se você teve um dia ruim e precisa de um vídeo de comédia para relaxar, ou se está hiperfocado estudando para uma prova. Existe apenas comportamento mensurável.

Toda interação realizada dentro de uma plataforma pode ser transformada em dados. Curtir uma publicação, compartilhar um vídeo ou permanecer alguns segundos extras assistindo a determinado conteúdo gera sinais que alimentam o sistema. Até mesmo ações aparentemente insignificantes, como diminuir a velocidade da rolagem ou voltar um vídeo alguns segundos, funcionam como indicadores matemáticos de interesse. Em outras palavras, o algoritmo não tenta compreender o que você sente. Ele apenas mede a probabilidade de você continuar ali.

Se uma pessoa costuma assistir a vídeos de culinária até o final, curtir e compartilhar as receitas, por exemplo, o sistema identifica um padrão. A partir disso, ele conclui que existe uma alta chance de aquele usuário continuar consumindo conteúdos semelhantes. E nisso consiste o coração dos algoritmos modernos: transformar comportamento humano em números. E como eles fazem isso? Criando o seu perfil digital através de coordenadas.

O perfil digital e o mapa dos seus interesses

Na computação, usamos uma estrutura chamada vetor para organizar essas informações. Os vetores são entidades matemáticas capazes de armazenar informações. Nesse caso, as nossas informações serão os nossos interesses. Pode parecer complicado, mas imagine que a rede social é um gigantesco “mapa” (um espaço multidimensional).

Nesse mapa, você não é definido pelo seu nome ou personalidade, mas sim por uma coordenada, como em um GPS. Se você interage muito com vídeos de futebol, o seu “ponto” no mapa se move para o lado dos esportes. Se de repente você começa a curtir vídeos de carros, o seu ponto se desloca um pouco mais para perto do ramo automobilístico. Os vídeos também têm suas próprias coordenadas nesse mapa, baseadas nas hashtags, trilha sonora e no tipo de pessoa que costuma assisti-los.

O que a rede social faz o tempo todo é tentar adivinhar a distância entre você (o seu ponto no mapa) e os vídeos que estão sendo publicados. De maneira técnica agora: o sistema faz uma comparação constante entre dois conjuntos de dados: o perfil matemático do usuário e o perfil matemático dos conteúdos disponíveis. E essa comparação se dá pela “Similaridade do Cosseno”.

Como funciona o “match”?

Para descobrir se você vai gostar de um vídeo, o sistema usa um cálculo matemático chamado Similaridade do Cosseno. Como falamos anteriormente, os algoritmos trabalham com vetores dentro de um espaço chamado mapa de interesses, né? Você como usuário tem o seu vetor, enquanto o vídeo dentro da plataforma também é descrito como um vetor. Se formos lembrar das aulas de física da escola, lembraremos que os vetores têm módulo (tamanho), direção (ângulo) e sentido (positivo ou negativo, no nosso caso está mais para um “gosta” ou “não gosta”).

O algoritmo simplesmente calcula o ângulo entre esses dois vetores. Se eles apontam para a mesma direção, o ângulo entre eles é mínimo (e a similaridade é máxima). É um “match” perfeito, e o vídeo vai para a sua For You! Se apontam para lados totalmente opostos, o sistema descarta o vídeo. É através de milhares de cálculos trigonométricos como esse, feitos em frações de segundo, que o seu feed é montado.

Mas surge uma pergunta: quem define as coordenadas exatas do seu perfil e dos vídeos nesse mapa gigante? É impossível ter humanos catalogando e dando notas para 34 milhões de vídeos por dia. É aqui que os vetores se conectam com o Machine Learning.

A máquina que aprende sozinha: Machine Learning

Nenhum programador escreveu uma regra fixa no código dizendo: “Se o usuário curtir gatos, mostre vídeos de cachorros”. Em vez disso, os engenheiros criam a estrutura de uma Rede Neural, um sistema inspirado nas conexões do cérebro humano, e deixam que ela encontre os padrões sozinha através de um ciclo contínuo de tentativa e erro.

Funciona como um sistema de retroalimentação (o famoso feedback loop). O algoritmo faz uma “aposta” e te mostra um vídeo. Se você assiste até o fim, ele entende que acertou e fortalece aquele caminho neural (ajustando os “pesos” matemáticos a favor daquele tema). Se você pula o vídeo em um segundo, ele entende que errou, corrige a rota e recalcula o seu vetor na hora. O sistema está literalmente aprendendo e se reescrevendo a cada deslizar de dedo.

Para essas redes neurais, não importa o tema do vídeo, importa o objetivo final. E o objetivo supremo de todas elas é apenas um: A Retenção.

O modelo matemático é otimizado para uma única métrica, que é o tempo de tela. A máquina aprendeu rapidamente que não precisa te mostrar aquilo que você diz gostar, mas sim os gatilhos visuais e sonoros que fazem o seu cérebro liberar dopamina. Ela encontra o padrão exato que prende os seus olhos na tela por mais alguns segundos.

É justamente nesse ponto cego entre o que queremos ver e o que não conseguimos parar de ver que entra uma reflexão importante, muito bem retratada no famoso documentário O Dilema das Redes. A premissa do filme é clara: se você não está pagando pelo produto, o produto é você. Os algoritmos não foram treinados para te mostrar o conteúdo mais educativo, saudável ou verdadeiro. Eles foram matematicamente condicionados a explorar a psicologia humana para te manter conectado pelo maior tempo possível, garantindo que você veja mais anúncios.

Mas com tudo isso em mente, surge um questionamento: se todas as grandes empresas utilizam essa mesma matemática de vetores e aprendizado de máquina, por que a experiência em cada rede parece tão diferente? O que nos prende em uma plataforma é muito subjetivo — alguns preferem debates textuais no X, outros gostam de acompanhar amigos no Instagram. No entanto, o mercado passou por uma verdadeira revolução na forma de recomendar e consumir conteúdo com a explosão dos vídeos curtos na vertical. Esse formato dinâmico tomou conta do mundo, forçando gigantes a se adaptarem (dando origem aos Reels do Instagram e aos Shorts do YouTube), mas o grande pioneiro desse modelo de entrega foi o TikTok.

Como um aplicativo desconhecido mudou o mundo?

O grande diferencial do aplicativo não foi apenas criar uma fórmula mágica, mas sim mudar a lógica da distribuição e a precisão da coleta de dados. Enquanto o Instagram e o Facebook nasceram baseados no Social Graph (recomendar coisas com base em quem você segue e conhece), o TikTok apostou tudo no Interest Graph (mapeando puramente o seu interesse, independentemente de amigos).

Para isso funcionar, a plataforma usou uma sacada simples de design: um vídeo por tela cheia. Diferente de um feed onde você vê vários posts ao mesmo tempo, a tela cheia força uma interação binária e limpa: ou você assiste, ou você pula. Sem distrações para sujar os dados, a rede neural capta com precisão milimétrica o seu comportamento, medindo desde repetições em loop até os milissegundos que você levou para arrastar o dedo.

Com dados tão puros, o modelo de distribuição muda. Cada vídeo novo é testado em um pequeno grupo “cobaia” de usuários. Se a retenção for alta, ele vai para um grupo maior, e assim exponencialmente. É por isso que a “For You” se molda tão rápido ao seu gosto e qualquer conta com zero seguidores pode viralizar: o sistema foi desenhado para ser o mais rápido do mundo em transformar a sua atenção em coordenadas matemáticas.

Por trás da sua tela infinita de vídeos não existe mágica, nem um sistema que escuta o microfone do seu celular para ler pensamentos. Existem estatísticas, cálculos de ângulos entre vetores e redes neurais que se retroalimentam milhões de vezes por minuto para maximizar o seu tempo de atenção.

Entender a engenharia por trás da sua “For You” é o primeiro passo para retomar o controle sobre o que você consome. Afinal, a cada curtida, pausa ou vídeo assistido em loop, você não está apenas passando o tempo: você está, literalmente, fornecendo as coordenadas exatas para o algoritmo que vai tentar te prender na rede amanhã.

Abner Fraiz