O futuro da pesquisa visual do Google
Lançado em 2009, como um novo aplicativo experimental no Google Labs, hoje o Google Goggles está disponível para Android e iOS na forma de um aplicativo gratuito. O Goggles é capaz de pesquisar visualmente uma série de coisas, principalmente objetos e lugares, como livros, pontos de interesse, cartões, desenhos, quadros, rótulos de produtos, logotipos e textos.

Quando o Google Goggles foi lançado, a mídia mundial se surpreendeu com a capacidade do aplicativo em reconhecer elementos visuais de forma rápida e precisa, sem qualquer necessidade de utilizar o teclado para adicionar outros dados. A tecnologia, que parecia ser de última geração, está pronta para dar um novo grande passo.
Com a utilização da tecnologia de reconhecimento óptico de caracteres (OCR) intregado à plataforma do Goggles, o App é capaz de transformar o texto inserido em uma imagem em texto pesquisável na internet, ler códigos de barras, e encontra imagens similares em bancos de dados de artes e monumentos. Entretanto, isso parece ser apenas o início para o Google Goggles.
De acordo com uma patente publicada no último dia 10 de fevereiro, a gigante de Mountain View planeja expandir os recursos do Goggles e torná-lo ainda mais poderoso e inteligente. Em vez de focar as informações em um único objeto por vez, o novo Goggles teria a capacidade de trazer, aos usuários, uma pluralidade de resultados.
A ideia é bem simples. Ao tirar fotos de uma cidade, as imagens tradicionalmente contém prédios, ruas, rostos de pessoas, carros e muitos outros objetos. Com a nova tecnologia do Goggles, o mecanismo de busca seria capaz de quebrar as imagens em partes, buscar os objetos captados, e dar, então, uma combinação de resultados de pesquisa com base em todas essas partes.
Para que isso seja possível, o Google precisaria trabalhar com diferentes tecnologias de reconhecimento de objetos. Segundo o site SEO by The Sea, as tecnologias necessárias seriam:
- uma busca de reconhecimento facial;
- uma pesquisa OCR para textos nas imagens;
- um sistema de busca para reconhecimento de objetos;
- pesquisa de reconhecimento de produtos, o que poderia reconhecer imagens bidimensionais, como capas de livros e CDs, e imagens em três dimensões, tais como mobiliários;
- reconhecimento de códigos de barras;
uma busca de reconhecimento, que poderia fornecer informações sobre determinadas pessoas, lugares e coisas;
- reconhecimento histórico, reconhecendo marcos reais e, possivelmente, imagens de anúncios em outdoors;
- reconhecimento do lugar através de dados georeferenciados por um receptor GPS;
- reconhecimento de cores;
- busca de imagens semelhantes.
A patente mostra, ainda, em imagens, como seria o funcionamento da nova geração do Goggles:

1ª Ilustração: da mesma forma que nos smartphones atuais, os usuários são convidados a registrar a imagem (foto) de um objeto;
2ª Ilustração: o Goggles, então, passa a tentar reconhecer o objeto em questão. Com a tecnologia desenvolvida pelo Google, a imagem é dividida automaticamente em pedaços para o reconhecimento independente de cada elemento;
3º Ilustração: com os elementos distribuídos e reconhecidos, o Goggles é capaz de identificar os textos, hyperlinks, links para produtos, reconhecimento facial, reconhecimento de anúncios, logotipos e outros.

O resultado, que poderá ser exibido em categorias, como na imagem acima, permite que o usuário visualize uma relação de informações, incluindo a pesquisa genérica (do produto em questão), informações sobre o produto, logotipo, reconhecimento facial, imagens similares e resultados da web.
Entretanto, se você foi detalhista, notou que o Google pretende usar uma pesquisa de reconhecimento facial para encontrar perfis em redes sociais. E como ele vai fazer isso? Em uma outra patente, publicada na mesma data, a empresa mostra detalhes desta outra inovação.
Com um modo de funcionamento similar ao Goggles, a nova geração do reconhecimento facial do Google é capaz de trabalhar com imagens que contenham diversas faces. O sistema, então, tenta identificar imagens que potencialmente correspondam à respectiva face, de acordo com critérios de similaridade visual.
Para chegar às redes sociais, o Google analisa os dados da pessoa em questão, incluindo métricas de conectividade social a partir de uma pluralidade de aplicações, tais como comunicação, aplicativos de redes sociais, aplicativos de agenda, e aplicativos de colaboração.
Uma lista de pessoas é, então, ordenada por um ranking, e identificadas conforme as métricas de similaridade visual entre a imagem facial e as respectivas métricas de conexão social nas redes sociais. No fim, a pessoa melhor identificada da lista é apresentada ao usuário.
Embora seja curioso olhar as patentes e tentar descobrir onde o Google pretende utilizá-las, é ainda mais fascinante pensar que todo o processo descrito neste artigo ocorre em poucos segundos. Quanto à questão de privacidade, ambas as tecnologias pretendem varrer conteúdo público, incluindo seu perfil online.
15 fevereiro, 2011 as 17:13
O Jeito Google de trabalhar da resultados hehe…
Esta vindo aew mais uma revolução!
2 março, 2011 as 0:44
é como uma grande máquina onde mais conteudo mais capacidade de carga junto com a tecnologia