Programa de computador vê cinco minutos no futuro


Programa de computador vê cinco minutos no futuro
A equipe usou uma Rede Neural Recorrente para que o programa pudesse aprender as tarefas mostradas nos vídeos.[Imagem: Yazan Abu Farha et al. (2018)]
Programa adivinha futuro
Cientistas da computação desenvolveram um programa de computador que consegue ver o futuro - alguns minutos no futuro.
Yazan Abu Farha e seus colegas da Universidade de Bonn, na Alemanha, desenvolveram um programa de autoaprendizagem que consegue estimar com um nível de precisão impressionante o tempo e a duração de atividades futuras - um futuro que cobre períodos de mais de três minutos, com boa precisão, e até cinco minutos com precisão aceitável.
O programa primeiro aprende uma sequência típica de ações, como cozinhar, assistindo a sequências de vídeo. Com base nesse aprendizado, ele então prevê em novas situações o que o cozinheiro deverá fazer em determinado momento.
"Nós queremos prever o tempo e a duração das atividades - minutos ou até horas antes que elas aconteçam," destacou o professor Jurgen Gall, orientador do trabalho.
Com isso, um robô assistente, por exemplo, poderia passar os ingredientes assim que eles forem necessários, pré-aquecer o forno no momento certo, e ainda avisar o cozinheiro se ele está prestes a esquecer um passo da preparação ou a colocação de um ingrediente.
A equipe também vislumbra aspiradores de pó automáticos que sabem que não podem atuar na cozinha na hora da preparação das refeições e vai então limpar a sala.
Programa de computador vê cinco minutos no futuro
As redes complexas são capazes de evoluir, o que as torna uma das ferramentas mais importantes da inteligência artificial para prever o futuro. [Imagem: Research on Complex Systems Group/Northwestern University]
Programa oráculo
Nós humanos somos muito bons em antecipar as ações dos outros. Para os robôs e computadores, no entanto, essa capacidade ainda está em sua infância. A vantagem é que eles são bem rápidos em aprender e não se entendiam durante as aulas.
Por exemplo, os dados de treinamento usados pela equipe estavam em 40 vídeos nos quais cozinheiros preparavam diferentes saladas. Cada uma das gravações tinha cerca de 6 minutos e continha uma média de 20 ações diferentes. Os vídeos também mostravam cronômetros, permitindo aferir o momento em que cada ação começou e quanto tempo demorou.
O programa de inteligência artificial "assistiu" a esses vídeos, totalizando cerca de quatro horas, sem intervalos. Com isso, o algoritmo aprendeu como as ações se encadeiam e quanto tempo cada uma delas dura. Parece fácil, mas não é nada trivial, já que cada cozinheiro tem seu próprio jeito de agir e as sequências variam dependendo da receita - para não complicar demais, a equipe só coletou vídeos de preparos de saladas.
Para testar se o programa havia mesmo aprendido a preparar saladas, a equipe o confrontou com vídeos que ele não havia visto antes. Depois de assistir entre 20 e 30% do vídeo, o programa devia prever passos que aconteceriam durante o resto do filme.
"A precisão foi superior a 40% para períodos de previsão curtos, mas depois caiu quanto mais o algoritmo tinha que olhar para o futuro," contou Gall.
Para atividades mais de três minutos no futuro, o oráculo informático acerta cada vez menos, prevendo 15% dos passos com precisão conforme se aproxima dos cinco minutos no futuro - mas é importante ressaltar que os pesquisadores só deram o prognóstico como correto quando tanto a ação quanto seu tempo de duração foram corretamente preditos pelo programa.

Bibliografia:

When will you do what? - Anticipating Temporal Occurrences of Activities
Yazan Abu Farha, Alexander Richard, Jurgen Gall
Proceedings of IEEE Conference on Computer Vision and Pattern Recognition 2018
http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_anticipation_cvpr18.pdf

Comentários

Postagens mais visitadas