O VLMS se destaca no ambiente 2D, mas o mundo visual está em 3D, e a MindJourney fornece melhores pontos de vista dos cenários do mundo real e, finalmente, pretende prever como as cenas mudam com o tempo, de acordo com os pesquisadores da Microsoft.
A MindJourney “esboça uma trajetória concisa da câmera, enquanto o modelo mundial sintetiza a visão correspondente em cada etapa. O VLM e depois argumenta nessas evidências de várias vistas reunidas durante a exploração interativa”, escreveram os pesquisadores em um artigo.
As tecnologias da Mindjourney podem melhorar os robôs assistivos e a inspeção remota e enriquecer experiências de realidade virtual e aumentada, escreveram os pesquisadores no artigo.
Fonte: Computer World













