Um robô que usa inteligência artificial (IA) do Google foi aprovado em um exame para se tornar médico, nos Estados Unidos. O chatbot, denominado Med-PaLM, foi desenvolvido exclusivamente para atuar na área da saúde, e a proposta é que ele use a ofereça suporte aos médicos profissionais. Um dos parâmetros de avaliação do robô foi o USMLE (US Medical License Exam, ou “Exame de Licença Médica dos EUA”, em tradução livre do inglês para o português), um exame que todo médico deve fazer para exercer a profissão nos estados americanos.

De acordo com um estudo publicado na revista científica Nature, o robô acertou mais da metade das questões, e obteve uma nota suficiente para ser aprovado no exame em maio deste ano. Vale ressaltar que o MedPaLM 2 traz o modelo de linguagem PaLM 2, o mesmo utilizado no Bard –aposta do Google para rivalizar com o ChatGPT. A versão mais recente do chatbot focado na medicina já está sendo testada em alguns hospitais nos EUA. Segundo o Wall Street Journal, o hospital de pesquisa Mayo Clinic – considerado um dos melhores do país – iniciou uma fase de testes com a ferramenta em abril deste ano.

Nos primeiros testes do robô, realizados em 2022, os pesquisadores usaram a primeira versão do Med-PaLM como parâmetro, e ele foi capaz de acertar 67,4% das respostas. Em maio de 2023, a empresa apresentou o Med-PaLM 2, uma versão aprimorada do primeiro chatbot, que obteve respostas positivas em cerca de 86,5% do exame.

Para título de comparação, médicos em treinamento e recém-formados precisam acertar pelo menos 60% das questões para serem aprovados – ou seja, a primeira versão do chatbot já ultrapassou a média necessária. De acordo com o Google, o Med-PaLM é o primeiro chatbot de IA a ser aprovado no USMLE.

Segundo a empresa de tecnologia, o Med-PaLM utiliza o padrão LLM (Large Language Model ou “Modelo de Linguagem Grande”, traduzido para o português), e é alimentado por uma grande base de dados. O Google também ressalta que o chatbot pode gerar respostas em formatos variados, além de elas trazerem informações úteis e precisas sobre diferentes questões de saúde.

Durante o estudo, diversos parâmetros para medir a qualidade das respostas do robô foram levados em consideração. Além da precisão nas questões de múltipla escolha, médicos de diversos países revisaram as provas, para que critérios como compreensão e raciocínio também fossem avaliados.

Os pesquisadores concluíram que, apesar de ter um desempenho “encorajador”, o Med-PaLm forneceu respostas consideradas inferiores quando comparadas às desenvolvidas pelos médicos. No entanto, em um novo estudo realizado com o Med-PaLM 2, a instituição afirmou que as respostas da segunda versão do software foram superiores. Esse último estudo, porém, ainda não foi publicado.

