Pesquisadores em Universidade Carnegie Mellon testaram um sistema que usa sinais Wi-Fi para determinar a posição e a pose de humanos em uma sala. Nos testes, roteadores Wi-Fi comuns, especificamente dispositivos TP-Link Archer A7 AC1750, foram posicionados em cada extremidade da sala, junto com vários números de pessoas na sala. Algoritmos alimentados por IA analisaram a interferência do sinal Wi-Fi gerada pelas pessoas.
As imagens de wireframe geradas a partir do monitoramento Wi-Fi pareciam bastante precisas na maioria dos casos, com os pesquisadores afirmando que as estimativas são tão boas quanto algumas “abordagens baseadas em imagens”. Existem algumas vantagens e atrações para usar o Wi-Fi nas câmeras também. Em primeiro lugar, as estimativas de wireframe da pose humana respeitam mais a privacidade humana. Em segundo lugar, a percepção baseada em Wi-Fi não requer luz e é capaz de detectar poses corporais mesmo quando há objetos no caminho que obscureceriam a visão de uma câmera tradicional. Outra grande atração dessa descoberta é que os roteadores Wi-Fi usados eram baratos, custando apenas US$ 30 cada e, portanto, muito mais acessíveis do que soluções caras e que consomem muita energia, como radar e LiDAR.
Acima, você pode ver um conjunto de imagens sincronizadas, com as fotos do vídeo à esquerda e os wireframes detectados por Wi-Fi gerados por IA à direita. A detecção do número de pessoas, locais e poses parece muito precisa. O artigo publicado pelos pesquisadores da Carnegie Mellon fornece informações detalhadas sobre como isso é feito. Em resumo, a tecnologia de percepção baseada em Wi-Fi demonstrada aqui é baseada em informações de estado do canal de sinal Wi-Fi (CSI), que representa a relação entre a onda do sinal transmitido e a onda do sinal recebido. Esses dados são processados usando uma arquitetura de rede neural experiente em visão computacional que pode realizar uma estimativa de pose densa. Para simplificar e, assim, acelerar a geração das representações humanas no estilo wireframe, os pesquisadores dividiram a forma humana em 24 segmentos.
Os pesquisadores admitem que o método descrito acima para detectar humanos e seus posicionamentos/posturas não é isento de problemas, e eles ainda veem alguns erros óbvios em cenários de teste. Eles graciosamente forneceram algumas imagens de comparação que mostram “casos de falha”, que eles atribuem a problemas como humanos fazendo poses incomuns e muitos assuntos na sala ao mesmo tempo (o mecanismo suporta três ou menos indivíduos).
Ainda há muito trabalho a ser feito, com os pesquisadores sugerindo que a técnica descrita pode ser melhorada de várias maneiras, mas principalmente a partir de melhores dados de treinamento público para percepção baseada em Wi-Fi, especialmente em diferentes layouts de sala. Embora apresentado como uma maneira sensível à privacidade de monitorar a segurança de idosos que moram sozinhos e sendo uma solução muito acessível para esse fim, alguns sem dúvida ficarão preocupados com a nova ameaça de seu roteador Wi-Fi espionando-os.