A Microsoft registrou uma patente no WIPO IP Portal intitulada “ARTIFICIAL INTELLIGENCE MODELS FOR COMPOSING AUDIO SCORES”. A Microsoft está inventando uma tecnologia inteligente de composição de áudio para criar sons, músicas e outros elementos de áudio para todos os tipos de mídia, como filmes, programas de TV, jogos e até mesmo gravações ao vivo. A patente menciona momentos dinâmicos nos jogos, sugerindo que ela pode criar pontuações que mudam para se adequar às ações do jogador. O resumo da patente afirma que os parâmetros podem ser definidos usando recursos visuais, de áudio e textuais e prompts (denominados coletivamente como ‘Conjunto de dados’) para instruir a multiplicidade de modelos de IA a construir partituras de áudio.
O recente advento da IA foi revolucionário e cruzou várias disciplinas de arte e mídia. Embora mais do que algumas ferramentas de IA para geração de áudio já tenham sido lançadas, a patente mais recente da Microsoft parece sugerir que seu ecossistema proprietário de modelos de IA será o sistema mais abrangente e avançado de criação de áudio assistida por máquina até o momento.
EA patenteia sistema de conversão de texto em fala ‘expressivo’ para melhores vozes de videogame
A IA desempenha um papel fundamental nos videogames . Do comportamento do inimigo e encontros de combate à geração de nível processual e interações com NPCs e ambiente, a IA é indispensável em todos os níveis de desenvolvimento do jogo. Em termos de design de som, trilhas sonoras adaptativas/dinâmicas são apresentadas em muitos videogames como os jogos Doom modernos , Metal Gear Rising: Revengeance , Devil May Cry 5 , etc. Por exemplo, em Devil May Cry 5 , as músicas só começarão a carregam os vocais enérgicos à medida que a classificação do estilo atinge níveis mais altos.
Mas a nova IA da Microsoft para áudio pode ir muito além da utilização convencional de música dinâmica/adaptativa em jogos. As ações do jogador podem ser pontuadas dinamicamente com pistas de áudio e música apropriadas, tudo em tempo real. Portanto, a experiência de áudio seria diferente de pessoa para pessoa. Muitos jogos dão ênfase especial aos sons e à música . Esses jogos podem se beneficiar da heurística que essa tecnologia oferece.
A descrição da patente detalha a multiplicidade de mecanismos de IA encarregados de executar as partituras de áudio de acordo com os conjuntos de dados fornecidos. Eles podem analisar expressões e sentimentos humanos, coletar dados de localização, analisar o tom da situação e muito mais. A IA pode aprender sobre fotos, vídeos, filmes, eventos ao vivo e produzir um conjunto de arquivos de áudio que podem sobrepor os visuais com efeitos sonoros e música apropriados. Essa IA de alta tecnologia pode abrir muitos caminhos empolgantes para a criação de mídia. Pode-se produzir filmes, jogos, etc. com uma enorme biblioteca de todas as partituras de áudio crescentes. Projetando uma peça orquestral épica para a entrada do herói , compondo uma melodia melancólica para a passagem de um animal de estimação, desenvolvendo efeitos sonoros para tiros e explosões; tudo isso pode ser confiado ao algoritmo da IA. Como efeito colateral, os compositores e designers de som podem enfrentar alguma concorrência.
A tecnologia será alimentada por computação em nuvem . Resta saber quando o sistema estará realmente operacional. Com esse banco de dados em constante expansão, o sistema de IA exigirá uma infraestrutura substancialmente poderosa. Mas o futuro do design de áudio parece muito promissor e a Microsoft pode estar liderando uma revolução nesse sentido.