Sistemas Operacionais

20/10/2011 09h46 - Atualizado em 20/10/2011 09h46

Conheça dois bons serviços de reconhecimento de voz no Linux

Eduardo Moreira
por
Para o TechTudo
Através de comandos de voz é possível acessar programas no Linux. (Foto: Divulgação)Através de comandos de voz é possível acessar
programas no Linux. (Foto: Divulgação)

A tecnologia de reconhecimento de voz está na moda. O lançamento do iPhone 4S e do iOS 5 contam com o Siri, o assistente pessoal inteligente, que permite ao usuário ter algo próximo a uma "conversa inteligente", através de comandos de voz com o smartphone. O Google também tem bons resultados com suas propostas, através do recurso de busca por voz e comandos de voz do Android.

Porém... o que acontece com o Linux? Nada de novo nesse sentido? Pois bem, apresento pelo menos duas boas alternativas de tecnologia de comandos de voz, que merecem destaque por serem eficientes, interessantes e práticas.

1. Simon

O Simon é um sistema de reconhecimento de voz que pode ser utilizado para controlar a interface do usuário. O sistema funciona muito bem com o KDE, já que foi escrito em C++, usando Qt e KDE para a sua interface do usuário, o que garante uma maior integração com o KDE 4. Além disso, é possível usar o Simon para, por exemplo, fazer o gerenciamento de janelas da sua seção de trabalho.

O Simon está em desenvolvimento na Alemanha e, por enquanto, só possui suporte aos idiomas inglês e alemão. Na tentativa de utilização do recurso no idioma espanhol, os resultados foram ainda limitados, já que é necessário fazer transcrições fonéticas para que o sistema reconheça as palavras no idioma.

O VoxForge é um dos principais recursos de transcrição de voz que pode ser usado com esses sistemas de reconhecimento de voz, mas, no momento, não existe um modelo que possa captar todos os padrões de tons de voz e pronúncias possíveis (mas você pode ajudar a construir esse padrão, com uma amostra da sua voz; clique aqui). Para saber mais sobre o Simon, visite a página oficial do projeto.

Assista ao vídeo, em inglês, e confira os recursos do Simon:

2. Sphinx

O Sphinx (também conhecido como CMUSphinx) também está em desenvolvimento, na Universidade Carnegie Mellon, e a página do recurso na internet está cheia de informações, notícias e documentações sobre esse motor de reconhecimento de voz.

Os resultados são bem interessantes. O Sphinix usa um componente chamado SphinixTrain, que, combinado com alguns periféricos de reconhecimento de movimentos (como o Kinect, por exemplo), apresenta um desempenho ótimo para um sistema que ainda está em desenvolvimento, além de uma experiência de uso bem atraente. Vídeo abaixo.

O Sphinix pode controlar a sua área de trabalho completamente, além de assumir o controle de outros dispositivos, como celulares e videogames portáteis. A grande virtude desse sistema é sua versatilidade, justamente por poder ser combinado com outros sistemas, afim de oferecer uma experiência de uso realmente interessante.

Essas são apenas duas alternativas para Linux. Existem outros sistemas de reconhecimento de voz disponíveis entre os desenvolvedores, e opções como essas são apenas o início de um futuro promissor, onde poderemos comandar todo o nosso computador apenas através da nossa voz.

No vídeo, em ingês, você pode conferir alguns dos recursos do Sphinx:

 

Via: MuyLinux.com

Seja o primeiro a comentar

Os comentários são de responsabilidade exclusiva de seus autores e não representam a opinião deste site. Se achar algo que viole os termos de uso, denuncie. Leia as perguntas mais frequentes para saber o que é impróprio ou ilegal.

recentes

populares