A AMD confirmou que em breve o monitoramento do sistema de suas unidades de processamento neural XDNA (NPUs) estará disponível no Gerenciador de tarefas do Windows, através do modelo de driver de computador da Microsoft. Atualmente, o Windows 11 só pode monitorar as unidades NPU nas novas CPUs Core Ultra Meteor Lake da Intel, mas isso mudará assim que essas atualizações chegarem. Ainda não foi divulgado um cronograma de lançamento exato, mas é razoável supor que a AMD provavelmente está visando a integração com o próximo patch focado em IA do Windows 11, 24H2.
A AMD usará o Compute Driver Model (MCDM) da Microsoft para permitir que o Windows 11 monitore a utilização de NPUs XDNA da AMD. MCDM é uma ramificação do WDDM (modelo de driver de vídeo do Microsoft Windows) projetado especificamente para processadores de microchip somente para computação, como um NPU. De acordo com a AMD, o MCDM também permite que o Windows gerencie o NPU, incluindo gerenciamento de energia e agendamento semelhante ao CPU e GPU. Isto será importante à medida que a adoção da NPU crescer e vários programas tentarem ser executados na NPU simultaneamente.
Se a implementação da AMD for semelhante à implementação da Intel, o Gerenciador de Tarefas mostrará a utilização de computação e cópia do NPU em dois gráficos separados, juntamente com a quantidade total e compartilhada de memória que o NPU está utilizando. Essas implementações de primeira geração não possuem memória dedicada, portanto compartilharão a RAM do sistema. Mas se iterações futuras implementarem memória NPU dedicada, o Gerenciador de Tarefas também deverá mostrar isso, semelhante à GPU.
A AMD afirma que o monitoramento de NPU do Gerenciador de Tarefas será muito importante para o futuro da computação. Ela acredita que o monitoramento de NPU pode facilitar o desenvolvimento de software, bem como melhorar a otimização do dispositivo do usuário, como maximizar a vida útil da bateria.
Estamos na infância do suporte a NPU, mas poderíamos muito bem ver muitos programas assistidos por IA sendo executados nessas novas unidades de processamento focadas em IA. A principal vantagem das Unidades de Processamento Neural são seus recursos de aceleração de hardware localizada, permitindo que programas de IA sejam executados na própria máquina local (como a Nvidia demonstrou com Chat com RTX) em comparação com uma solução baseada em nuvem que pode ser mais lenta e vazar informações confidenciais. As NPUs também permitem que cargas de trabalho de IA sejam executadas em ambientes onde não há conexão com a Internet ou onde o serviço de Internet é irregular ou não confiável.
A AMD já está em sua arquitetura NPU de segunda geração chamada XDNA2. A primeira implementação estreou com CPUs Ryzen 7040 Phoenix da AMD em 2023, apresentando 10 TOPS (INT8 teraops) de desempenho. A versão XDNA2 da AMD é três vezes mais rápida e vem nas CPUs móveis Strix Point da série Ryzen 8040 mais recentes. As APUs Ryzen 8000G para desktop da AMD também apresentam seu NPU, mas todos são baseados na arquitetura Phoenix mais antiga da AMD, com seu chip XDNA de primeira geração.