Lançadores e buscadores

Por Filipe Garrett, para o TechTudo


O BERT é o novo algoritmo de buscas por trás das pesquisas realizadas por meio do Google. A nova ferramenta usa inteligência artificial para compreender os pedidos do usuário, a partir de uma construção de sentido que leva em conta o contexto de cada palavra e frase. Assim, o buscador pode oferecer resultados mais precisos e focados naquilo que realmente interessa para a pessoa. A tecnologia já está aplicada nas versões de 70 países, incluindo o Brasil, do serviço de buscas do Google.

Tecnologia de buscas do Google ganha reforço de nova inteligência artificial — Foto: Marvin Costa/TechTudo Tecnologia de buscas do Google ganha reforço de nova inteligência artificial — Foto: Marvin Costa/TechTudo

Tecnologia de buscas do Google ganha reforço de nova inteligência artificial — Foto: Marvin Costa/TechTudo

O que é um algoritmo?

O termo algoritmo tem origem na matemática e, sob o ponto de vista da ciência da computação, serve para classificar um conjunto de passos que um determinado software precisa realizar para chegar a um resultado.

No caso de um algoritmo de buscas, e de forma simplificada, esses passos poderiam ser capturar o texto que o usuário insere na caixa de pesquisa e vasculhar a Internet em busca de resultados que depois são exibidos na tela. Em linhas gerais, quando alguém cita o algoritmo de buscas do Google (ou qualquer algoritmo, na verdade), está se referindo a um mecanismo de software que desempenha uma tarefa específica.

Antes do BERT

Antes de aplicar o novo algoritmo, as buscas do Google davam mais relevância a palavras-chave do que ao contexto das perguntas. Além disso, elas organizavam os resultados dando mais evidência ao conteúdo mais acessado: é por isso que, às vezes, ao pesquisar dúvidas sobre um produto, você pode ser direcionado para lojas virtuais antes de encontrar as informações que realmente interessam.

Esses resultados, criados por relevância e importância das palavras-chave, levam a inconsistências, sobretudo em um cenário em que 15% de todas as pesquisas realizadas por dia são completamente inéditas. Por nunca terem sido feitas, o algoritmo anterior não tinha bons parâmetros para organizar as respostas, aprofundando o problema de imprecisão dos resultados.

Com relação à busca em si, o algoritmo processava palavra por palavra de forma independente e isso criou um hábito nos usuários. Segundo o Google, a tendência é de que as pessoas façam pesquisas apenas utilizando as palavras-chave que elas consideram importantes, sem a construção de uma pergunta com começo, meio e fim – algo que o Google acredita ser não só possível, mas desejável, para melhores resultados com o BERT.

O que o BERT faz?

À esquerda, sem BERT. À direita, o resultado mais preciso com a ajuda do algoritmo — Foto: Divulgação/Google À esquerda, sem BERT. À direita, o resultado mais preciso com a ajuda do algoritmo — Foto: Divulgação/Google

À esquerda, sem BERT. À direita, o resultado mais preciso com a ajuda do algoritmo — Foto: Divulgação/Google

A imagem acima compara os resultados de uma mesma busca com ou sem BERT. A questão é, em tradução livre: "2019 viajante Brasil para EUA precisa de visto". Sem o BERT, o Google dá como primeira resposta uma notícia do jornal Washington Post cujo título é "cidadãos americanos podem viajar ao Brasil sem documentação ou visto", o que é exatamente o contrário daquilo que foi buscado.

Com o BERT, o algoritmo leva em contexto a formulação da frase e percebe que a busca está relacionando o Brasil como ponto de partida e os Estados Unidos como destino, o que dá um resultado mais preciso: o site da embaixada norte-americana no Brasil.

A ideia por trás do BERT é oferecer uma ferramenta de buscas que não dá tanto peso a palavras-chave, mas, sim, ao contexto das buscas. Assim, ele tenta inferir o real sentido da pesquisa e oferecer resultados mais alinhados com aquilo que a pessoa está efetivamente pesquisando. A ferramenta é um complemento ao que o RankBrain, primeira técnica de inteligência artificial associada a resultados de buscas e implementada pelo Google há cinco anos.

Para esse fim, o Google treinou a ferramenta com textos extraídos de artigos da Wikipedia. Com essa base de dados em mão, os desenvolvedores do Google começaram a treinar a IA com testes de completar, parecidos com aqueles que as crianças desempenham na fase de alfabetização: trechos de texto tinham palavras removidas e o algoritmo precisava descobrir o termo ideal para completar o conteúdo, sem prejudicar seu sentido.

Com isso, o BERT deve possibilitar resultados mais precisos e mais contextuais ao mecanismo de busca do Google. Essa capacidade tende a aprofundar a qualidade da ferramenta, já que é comum que o usuário simplesmente não saiba exatamente formular uma busca corretamente. Como observa o Google em seu blog oficial, “muitas vezes, usamos ferramentas de buscas para aprender” algo novo que nós não temos o conhecimento de como buscar de forma eficiente.

Comparação mostra diferença de resultados entre os algoritmos — Foto: Divulgação/Google Comparação mostra diferença de resultados entre os algoritmos — Foto: Divulgação/Google

Comparação mostra diferença de resultados entre os algoritmos — Foto: Divulgação/Google

Na imagem, mais uma comparação. A busca é "esteticistas aguentam muita coisa no trabalho". Sem o BERT, o resultado é um comparativo entre dois tipos de profissionais. Já com o BERT a resposta é mais relevante: o resultado aponta para um site que detalha quais são as demandas que fazem parte do cotidiano profissional de um esteticista.

Outro desdobramento da tecnologia tem a ver com assistentes de voz e com buscas por fala. Segundo o Google, a aplicação do processamento mais contextual do BERT deve permitir que usuários interajam de forma mais natural com assistentes de voz, uma vez que o algoritmo deve se mostrar capaz de compreender melhor os sentidos das instruções.

Via Google (1 e 2)

Como excluir pesquisas recentes no Google pelo celular

Como excluir pesquisas recentes no Google pelo celular

Mais do TechTudo