Internet

05/08/2014 06h02 - Atualizado em 05/08/2014 06h02

'Sr. Wikipédia' conta como funcionam os bots que publicam textos em massa

Barbara Mannara
por
Da redação

Já pensou produzir dez mil artigos por dia para o Wikipédia? O sueco Sverker Johansson topou o desafio e atualmente é o colaborador com maior número de publicações no site, e tudo isso sem ganhar um centavo. Já são mais de 2,7 milhões de artigos e a produção em larga escala é possível por causa de um bot: um programa que automatiza o serviço e gera entradas com assuntos já determinados. Em entrevista ao TechTudo, o colaborador conta como tudo funciona; confira.

'Zuckerberg italiano' vai lançar nova rede social no Brasil em outubro

Sverker (Foto: Reprodução/TWSJ)Bot de computador com codinome Lsjbot gera entradas automaticamente (Foto: Reprodução/TWSJ)


Vejo bots como uma importante ferramenta para deixar o Wikipedia mais equilibrado e democrático
Sverker Johansson

Nascido em Lund, na Suécia, Sverker Johansson cursou engenharia, pela Lund Institute of Technology e tem 53 anos. Além disso, é formado em economia, física e linguística. Nada que indique essa “paixão” pelos artigos do Wikipédia.

A publicação de textos em massa no site teve início em 2007, quando Sverker começou a contribuir para a enciclopédia editando arquivos "na mão". “Fui motivado pela visão de compartilhamento livre de informações, que é a essência do Wikipedia, na qual o conhecimento humano estaria disponível para todos”, explicou. 

Mas, ele não parou por ai. Atualmente, Sverker é responsável pela produção de 8,5% do conteúdo disponível no Wikipédia, com maior parte sobre espécies de animais e plantas. Um volume um tanto desproporcional para uma pessoa só.

Como funciona? A “vantagem” se dá por um bot de computador, ou seja, um programa de codinome “Lsjbot” elaborado pelo próprio Sverker, que gera a publicação de milhares de artigos automaticamente.

Segundo o colaborador, basta inserir códigos no bot do tipo “complete as lacunas”: X é uma espécie de animal Y, e foi descoberto por Z em 19XX, por exemplo. Quando as lacunas são substituídas com as informações corretas sobre as espécies, o texto será enviado para Wikipedia e guardado como um artigo. As fontes utilizadas, das quais as informações são extraídas, ficam indicadas na parte inferior da página.

Esse sistema gerou polêmica entre diversos internautas, que não aprovam a maneira automatizada de publicação. Entretanto, para Sverker, essa é uma das formas mais democráticas e eficazes de produzir artigos.

“Meu bots criam uma coleção equilibrada de artigos de origem animal, por exemplo, com uma boa cobertura tanto dos animais do Brasil quanto dos da Europa”, completa. Além disso, reduz os erros "humanos" dos artigos escritos à mão, como erros de ortografia ou digitação. Ele lembra que as publicações podem ser melhoradas por outros colaboradores, o que acontece com frequência. 

Sverker (Foto: Reprodução/TWSJ)Sverker acredita que o sistema de bot é mais democrático e eficaz na produção (Foto: Reprodução/TWSJ)

Depois de plantas e animais, uma nova safra de artigos sobre todos os autores do mundo poderá entrar em produção, conforme os projetos futuros de Sverker.

Quer conhecer mais sobre o "Sr. Wikipédia" sueco? Veja a entrevista completa com Sverker Johansson:

TechTudo: Por que você começou a contribuir para o Wikipedia? 

Sverker Johansson: Comecei a editar para o Wikipedia "na mão", da mesma forma que todos os outros, por volta de 2007. Fui motivado pela visão de compartilhamento livre de informações, que é a essência do Wikipedia, na qual o conhecimento humano estaria disponível para todos.

Depois de alguns anos, percebi que as pessoas estavam usando bots para as tarefas de rotina. Fiquei curioso e descobri que era possível criar artigos dessa forma. Assim, os artigos sobre tópicos determinados poderiam ser produzidos em massa, de forma rápida.

Quando eu comecei a fazer isso estava motivado tanto pelo desafio técnico quanto pela minha esperança de que essa seria a maneira mais eficaz de contribuir com a visão do Wikipedia. Assim, minha contribuição poderia realmente fazer a diferença para o site e para as pessoas utilizam. Faço artigos em três idiomas: sueco, cebuano, waray-waray. Espero que eu possa começar a contribuir em mais idiomas em breve, e estou testando meu bot em idioma persa.

TT: Como você criou seu sistema de publicação? Teve a ajuda de alguém?

SJ: O software Lsjbot [bot] reúne informações como, por exemplo, uma espécie animal, que são retiradas de bancos de dados públicos sobre biologia. Os dados são inseridas em um modelo de texto para preencher lacunas: XXX é uma espécie de animal YYY, e foi descoberto por ZZZ em 19XX, por exemplo. Quando as lacunas são substituídas com as informações corretas sobre as espécies, o texto será então enviado para Wikipedia e guardado como um artigo. As fontes utilizadas, das quais as informações são extraídas, ficam indicadas na parte inferior da página. Em seguida, o procedimento é repetido para as próximas espécies.

O trabalho com “bot” é tão preciso quanto os bancos de dados de referências, que reúnem as informações. Problemas de programação podem criar erros nos artigos, mas na maioria das vezes esse tipo de erro pode ser corrigido pelo bot. No total, os artigos bot não são perfeitos, mas eu diria que eles contêm menos erros, em média, do que os artigos escritos à mão - sem erros de ortografia ou digitação. Eu escrevi o software sozinho, sem a ajuda de ninguém. Outras pessoas no Wikipédia ajudaram com o controle de qualidade dos artigos produzidos, e sugeriram melhorias.

TT: Quais são as vantagens de usar bot? 

SJ: Usar um bot é eficaz em quantidade, mas há mais coisas. Um ponto importante no Wikipedia é que os conteúdos refletem um grupo de escritores. A maior parte deles são jovens nerds e, consequentemente, o site tem maior cobertura de temas nerds, mais masculinos do que femininos, melhor cobertura dos países do hemisfério norte do que os países do sul, etc.

O software é mais imparcial nesse sentido. Meu bots criam uma coleção equilibrada de artigos de origem animal, com uma boa cobertura tanto dos animais do Brasil quanto dos da Europa. A longo prazo, vejo bots como uma importante ferramenta para deixar o Wikipedia mais equilibrado e mais democrático.

TT: Já escreveu um artigo sobre o Brasil? Com qual tema?

SJ: A maioria dos artigos que eu criei são sobre as espécies de animais e plantas. Isso eu faço para todo o mundo, sem foco em algum país específico. Para o Brasil, meus esforços podem tornar o Wikipedia sueco na primeira enciclopédia a ter uma cobertura mais completa da biodiversidade conhecida da floresta Amazônica, da qual o Brasil é orgulhoso.

TT: Você conhece outras pessoas que produzem tanto quanto você no Wikipedia?

SJ: Há uma lista completa com o “ID de usuário” de todas as pessoas que produzem artigos em massa para o Wikipédia. Eu produzi mais do que qualquer pessoa, mas existem diversos colaboradores que se dedicam em produziu milhares de artigos também.

TT: Como você escolhe os temas para fazer os artigos no Wikipedia?

SJ: Os temas de artigos produzidos devem ser compatíveis com a escrita do bot. Isso significa um campo em que: ‘O conteúdo é composto por muitas unidades semelhantes, de modo que o mesmo texto do molde possa ser utilizado para muitos artigos’ e ‘os bancos de dados públicos estejam disponíveis e acessíveis’. Espécies animais e plantas atendem a esse sistema perfeitamente.

Tem alguma publicação favorita? 

SJ:
Não tenho um artigo predileto. Para mim, a grande vantagem do Wikipedia é a sua ambição de cobrir todo o conhecimento, ao invés de um assunto específico.

TT: Quais são os seus planos para o futuro com o Wikipedia? Novos artigos em vista?

SJ: Sim, eu vou continuar produzindo os artigos e planejo também estender meu projeto de “bot” para mais idiomas. Além disso, quero começar a produzir artigos em outros assuntos: estive pensando em fazer sobre todos os autores do mundo, por meio de informações disponibilizadas nos catálogos das bibliotecas nacionais.

Por exemplo, a biblioteca nacional brasileira, presumivelmente, tem os livros de todos os autores brasileiros. Eu posso usar esse catálogo para fazer artigos no Wikipedia sobre todos os autores do Brasil.

TT: Você já viajou para o Brasil? O que você acha sobre a cultura brasileira?

SJ: Não, nunca. O mais perto que cheguei do Brasil foi vendo a floresta Amazônica pelo avião, ao viajar para o Peru. 

TT: O Wikipedia já deu algum prêmio por sua colaboração? Você teve algum retorno financeiro ou de status?

SJ: Retorno em dinheiro, nada. Ninguém é pago para escrever Wikipedia, e eu também não. Tudo é feito por voluntários em seu tempo livre.

Sobre o status, bem, eu estou ficando muito conhecido na comunidade Wikipédia. Mas isso não significa muito em termos práticos.

Como converter documento PDF em Word? Veja no Fórum do TechTudo.

Seja o primeiro a comentar

Os comentários são de responsabilidade exclusiva de seus autores e não representam a opinião deste site. Se achar algo que viole os termos de uso, denuncie. Leia as perguntas mais frequentes para saber o que é impróprio ou ilegal.

recentes

populares

  • Jackson Costa
    2014-08-05T11:27:41  

    Isto é bom e ruim ao mesmo tempo. Se um programador web usar este artifício de forma errada, muitos sites podem ficar como uma colcha de retalhos de textos robotizados e as vezes sem sentidos ou sequência.

    recentes

    populares

    • Jackson Costa
      2014-08-05T11:27:41  

      Marcos muda pro inferno então, maldito. Criticar o pais qualquer um critica, fazer diferente nada né ?

  • André Nascimento
    2014-08-06T22:11:20

    Sensacional a entrevista! Jamais iria imaginar que uma única pessoa fosse responsável por uma parte tão significativa do conteúdo da Wikipedia. Curti muito saber!

  • Defer Knot
    2014-08-06T09:52:23

    A galera aqui poderia fazer algum comentario produtivo neh....... ao inves de so criticar e falar coco

  • Alisson Carvalho
    2014-08-06T09:15:36

    Visual Studio *--*

  • Elson Melaceta
    2014-08-05T17:26:23  

    Ou seja tem quantidade, mas não tem qualidade, já que a maioria dos artigos dele/bot, devem conter apenas informações básicas que muito provavelmente quem está pesquisando já tem noção.

    recentes

    populares

    • Elson Melaceta
      2014-08-05T17:26:23  

      Não, Elson. Está equivocado. Tem sim muita informação importante e relevante. Mais do que você vai encontrar em muitos outros lugares. Não pense que a coisa é tão simples que qualquer um poderia fazer.

    recentes

    populares

    • Elson Melaceta
      2014-08-05T17:26:23  

      o difícil de fazer foi bot. Mas impressão é que ele produziu artigos do tipo catálogo, do que tipo conhecimento. Constituídas mais de informações técnicas do que um estado da arte atual e profundo em relação a literatura do tema abordado.

  • Cristian Soares
    2014-08-06T08:38:48

    Coletar dados é só o primeiro passo em direção à sabedoria, mas compartilhar dados é o primeiro passo em direção à comunidade.

  • Pedro Junior
    2014-08-05T12:22:04  

    Esse aí não transa, selado!

    recentes

    populares

    • Pedro Junior
      2014-08-05T12:22:04  

      ahahahaha

    recentes

    populares

    • Pedro Junior
      2014-08-05T12:22:04  

      Pedro, e é por causa dessa sua mentalidade tosca que o Brasil é um país subdesenvolvido violento e a Suécia é um dos melhores lugares para se viver no mundo. Temos mentalidade de subdesenvolvidos, primatas primitivos, intelectuais aqui são tratados como desajustados e alienados. Lá são valorizados, respeitados e premiados por suas conquistas no campo do conhecimento. Ah, esquece, estou jogando pérolas aos porcos, vai lá beber cerveja e assistir futebol seu macaco.

  • Eduardo Pereira
    2014-08-05T12:35:13  

    Wikipédia é enciclopédia livre, pra mim não tem valor nenhum, acho que informação deve ser produzida com critérios, não de forma automatizada, e pior, por qualquer cidadão que nem sempre está bem informado.

    recentes

    populares

    • Eduardo Pereira
      2014-08-05T12:35:13  

      Rodrigo, não é exatamente assim não, tenho conta no Wikipédia e já editei e atualizei diversas publicações e elas são expostas na hora, mas o Eduardo realmente está equivocado, tbm não é tão simples assim, nem todas as publicações podem ser editadas assim.

    recentes

    populares

    • Eduardo Pereira
      2014-08-05T12:35:13  

      A wikipedia é livre e recebe contribuição de qualquer pessoa do planeta. Por isso deve-se tomar cuidado para não sair validando tudo o que existe lá. Mas sem dúvida é uma das maiores e mais confiáveis fontes de consulta hoje no planeta. Cada artigo possui suas fontes e seu grau de confiabilidade. É óbvio que se você precisa de alguma informação mais específica e mais importante, você não vai simplesmente engolir tudo o que ler ali ou em qualquer outra publicação que se diga científica. Você vai sempre consultar as fontes e procurar por outras pra se aprimorar naquele assunto.

  • Paulo Neto
    2014-08-05T22:15:06

    Quem veio aqui só pra ver os peitos da japonesa curti aqui.

  • Matheus Rodrigues
    2014-08-05T21:57:13

    esse wikipedia ja me ajudou em muito trabalho mas no tempo do meu pai era so na base da lascada

  • Julius Ferreira
    2014-08-05T18:43:32

    É, molecada.... na minha época não tinha essa moleza de wiki não.... no meu tempo era na boa e velha barsa. Quem lembra?

  • Richard Wright
    2014-08-05T17:55:24  

    Isso é o que se pode chamar em "não tem o que fazer não".

    recentes

    populares

    • Richard Wright
      2014-08-05T17:55:24  

      Isso é o que pode chamar de "estou tentando fazer a humanidade aprender algo, pq se depender da nova geração os livros serão queimados e nenhuma descoberta será armazenada.". Vlw Flws!!!

  • Daniel Vack
    2014-08-05T17:54:20

    Bizarro é ficar vendo novela!

  • Carlos Alberto
    2014-08-05T12:40:44  

    Mané...faz tudo de graça!

    recentes

    populares

    • Carlos Alberto
      2014-08-05T12:40:44  

      Esse seu comentario nem de graça eu queria

    recentes

    populares

    • Carlos Alberto
      2014-08-05T12:40:44  

      ai o espertao do carlos alberto vem comentar no g1 de graça gerando mais renda pro g1, tem que rir mesmo do mane que se acha espertao

  • Alfredo
    2014-08-05T15:54:20

    Uma iniciativa louvável e, para os críticos contrários, se não estão satisfeitos com a confiabilidade das informações disponíveis, basta ajudar na melhoria da qualidade das informações editando os textos.

  • David Silva
    2014-08-05T15:02:34

    Deveriam erguer uma estátua em homenagem a esse cara.. quantos alunos desesperados ele salvou?! milhões. agradeço desde já :v

  • Jeremias Klausner
    2014-08-05T14:37:40

    Esse sujeito é um gênio. Criou um sistema que automatiza a busca de informação alimentando a Wikipédia. Um uso prático da inteligência artificial para o bem da humanidade.

  • Bruno Rodrigues
    2014-08-05T14:14:49

    Tem louco pra tudo

  • Rodrigo
    2014-08-05T13:59:12

    filhovemver .com .br também é legal

  • Claudinei Correia
    2014-08-05T12:52:16  

    Podem falar o que for da wikipédia, mas todo mundo que não gosta de estudar recorre a ela na véspera de provas ou quando quer ter uma referência rápida sobre qualquer coisa. Sem hipocrisia. Eu também faço isso, confesso.

    recentes

    populares

    • Claudinei Correia
      2014-08-05T12:52:16  

      Concordo plenamente, primeiro vai no google, que joga no wikipédia. Podem notar é sempre o primeiro resultado de buscas.

  • Paulo Lorenzo
    2014-08-05T13:42:52

    Por issoq ue esse lixo de Wikipedia não pode ser usado nem como referencia num TCC. Apenas as Uniesquinas acham legal.

  • Rodrigo
    2014-08-05T13:24:13

    Eu acesso muito esse site

  • Baquara Mima
    2014-08-05T11:38:24  

    Vão procurar na barsa impressa!!!!

    recentes

    populares

    • Baquara Mima
      2014-08-05T11:38:24  

      aff maria

  • Marco
    2014-08-05T12:55:48

    G1 em mais um episódio de Notícias que vão mudar o mundo

  • Luis Paulo
    2014-08-05T12:51:27

    Bot..isso tudo não é de deus..vão queimar todos os redatores dessas pagina e de todas tecnologias q não alimentam o fogo de deus...vão todos sofrer a intervenção divina.;..ainda bem q eu e o pastor Juremias estamos selados