
A central de whitepapers de tecnologia da COMPUTERWORLD
Tecnologia
Cientistas tentam aprimorar tecnologia de reconhecimento de voz
Universidade de Rochester está desenvolvendo pesquisas para que as máquinas conversem como os humanos e sejam menos frustrantes no atendimento aos clientes das empresas pelos call centers.
IDG News Service/Nova York
Aqueles que se irritam quando falam ao telefone com um sistema automático de reconhecimento de voz podem podem respirar aliviados. Os cientistas estão trabalhando para tornar esses sistemas mais parecidos com o mundo real e menos chatos de usar.
“Do ponto de vista do consumidor, as pessoas acham esses sistemas muito frustrantes”, reconhece James Allen, que é o responsável por ciência da computação na Universidade de Rochester. Allen falou ao IDG antes de sua palestra na conferência SpeechTEK 2010, ocorrida esta semana em Nova York (EUA).
Os sistemas mais computadorizados de reconhecimento de fala podem entender o que um humano diz em até 98% do tempo. Mesmo assim, as pessoas ainda reclamam dos programas automatizados de ajuda por telefone. Para tornar essas soluções menos frustrantes de usar, seria fundamental dar a ela uma melhor compreensão da linguagem e torná-las mais interativos, disse Allen.
Por enquanto, os departamentos de atendimento ao consumidor da maioria das grandes organizações oferece sistemas automáticos de ajuda por telefone. Um usuário liga para o número de auxílio e uma voz artificial faz uma série de perguntas. A maioria desses sistemas tem como base arcabouços que, de forma geral, são como árvores de decisão. Com tais sistemas, “você não descobre o que a pessoa quer, você está seguindo um roteiro”, disse.
Combinação
Os sistemas são, na verdade, uma combinação de tecnologias variadas. Uma é o reconhecimento de voz, ou a capacidade de um computador entender, ou traduzir com sucesso para texto, o que a pessoa está dizendo.
Outra tecnologia é o processamento de linguagem natural (NLP, na sigla em inglês). Ela tenta ou converter a mensagem falada em um comando que o computador possa executar, ou que possa ser repetida de forma concisa para um operador humano.
Grandes passos já foram dados nos dois campos durante as últimas décadas. Mas na maioria dos casos elas parecem ter causado mais frustração em seus usuários. “É só eu ligar para o banco para ter problemas e brigar com esses sistemas. Eu respondo o que for preciso para que seja atendido por uma pessoa o mais rapidamente possível”, disse Allen.
O trabalho de pesquisa acadêmica de Allen tem-se concentrado na busca de maneiras que “possamos falar com uma máquina do mesmo modo que falamos a uma pessoa”, disse.
As conversas entre duas pessoas podem ser precisas de um jeito que o computador dificilmente entenderia. Allen relembra um trabalho que desenvolveu como estudante de pós-graduação, no qual gravava conversas em um guichê de informações de uma estação de trem. Em uma dessas conversas, um passageiro caminha até o balcão e diz “oito e cinquenta para Windsor”, e o atendente responde “portão dez, atraso de vinte minutos”. O atendente respondeu exatamente o que o passageiro queria, mas para sistemas computadorizados tal diálogo seria completamente confuso.
Do modo como Allen vê a questão, faltam dois elementos aos sistemas modernos: a capacidade de analisar o que a pessoa está dizendo e a capacidade de conversar com a pessoa para aprender mais sobre o que ela quer dizer.
“Diversas soluções de prateleira de NLP tendem a ser superficiais. Nós não temos uma tecnologia que nos forneça um significado das sentenças”, disse. Ferramentas de processamento analítico e serviços de definição de palavras como a WordNet podem ajudar a definir uma palavra e também as relações entre palavras; dessa forma, um sistema saberá que, por exemplo, uma “subsidiária” é parte de uma “companhia”.
Outra adição necessária é a de sistemas de comunicação de duas vias entre usuários e computadores. Quando falam sobre suas necessidades, as pessoas podem fornecer informações sem seguir uma ordem particular. Cabe ao computador juntar os pedaços de informação e não aborrecê-lo com questões cujas respostas a pessoa já forneceu. Veja mais no IDG Now!
Cloud computing é difícil?
O ITBOARD materializa a nova plataforma de conversas do Século XXI. Concentra o diálogo sobre tecnologia e inovação movido a tweets de quem está imerso nesses assuntos. ENTRE NA CONVERSA




