Microsoft Cortana, mal o conhecíamos.
2023 parece ser um ano difícil em tecnologia, com demissões já atingindo várias grandes empresas, já que as previsões prevêem recessão em quase todo o mundo. Uma combinação de efeitos inflacionários da impressão de dinheiro durante a pandemia, a guerra de agressão da Rússia na Ucrânia e até mesmo as políticas de bloqueio COVID-Zero da China – estão contribuindo para uma tempestade econômica perfeita atingindo praticamente todos. Do preço da gasolina ao custo dos alimentos, estamos todos apertando os cintos e, para as maiores empresas do mundo, isso significa aceitar algumas duras realidades sobre alguns de seus departamentos mais experimentais.
Algumas das maiores histórias de tecnologia deste ano giraram em torno da queda impressionante do Facebook, com bilhões e bilhões varridos de seu valor de mercado devido a uma miscelânea de ventos contrários estratégicos e macroeconômicos. O foco em seu metaverso experimental fez com que a empresa mudasse de marca para Meta e imaginasse um futuro em que os usuários procurassem usar computadores VR volumosos em seus rostos para realizar tarefas básicas, em vez dos computadores de bolso do tamanho da palma da mão que já possuíam. A Amazon, da mesma forma, aceitou sua própria falha de interface humano-computador este ano, embora você provavelmente não tenha percebido o quão popular eles são.
Surpreendentemente, o maior buraco negro de dinheiro no portfólio da Amazon parece ser sua linha de alto-falantes Amazon Echo. O que foi um choque para mim inicialmente, considerando que possuo vários deles. Eu usei um Amazon Echo para controlar meu Xbox. Eu usei meu Amazon Echo para interagir com meu PC com Windows. Muitos PCs também vêm com o Alexa pré-instalado atualmente. Todo mundo que conheço também possui pelo menos um dos mini-microfones convenientes, mas preocupantes, para tudo, desde ouvir música até acender as luzes. No entanto, a divisão foi apontada como um dos maiores fracassos da Amazon nos últimos tempos, o que me lembrou que, uma vez, a Microsoft também buscou um pedaço desse bolo surpreendentemente pouco lucrativo.
Parece que a Microsoft viu a armadilha mais cedo do que a maioria e saiu do jogo antes que se tornasse uma grande monstruosidade na planilha de ganhos trimestrais. Mas há esperança para sistemas assistidos por voz em um mundo onde o aprendizado de máquina está se tornando cada vez mais acessível?
Uma breve história da Cortana
Estávamos entre os primeiros sites a relatar a Cortana depois que a Microsoft inadvertidamente vazou um Lumia de engenharia para o público. O aplicativo “zCortana” apareceu como um aplicativo de teste, ao lado de vários outros, conforme observado em meu antigo artigo “Uma breve história da Cortana” do ano passado. Naquela época, não tínhamos ideia do que a Cortana seria por, mas não demorou muito para que fosse formalmente anunciado.
Cortana foi inicialmente concebido para ser um codinome simples, mas o vazamento e a popularidade dele acabaram levando a Microsoft a adotá-lo. Cortana é o nome da inteligência artificial da popular franquia Halo da Microsoft, e nomear o assistente de voz da Microsoft depois que essa visão de ficção científica de um super intelecto artificial se tornou um símbolo da ambição da empresa. A Microsoft chegou a recrutar a dubladora do personagem, Jen Taylor, dos jogos para a versão americana, adicionando emoção ao projeto.
A Microsoft trabalhou com parceiros para integrar seus produtos domésticos inteligentes à Cortana enquanto a trabalhava no próprio Windows. A tela de configuração OOBE (experiência pronta para uso) do Windows 10 foi ditada inteiramente pela Cortana, por exemplo, apresentando aos usuários o assistente inteligente desde o início.
Cortana chegou ao Xbox com algum alarde. Integrada com a agora extinta plataforma Kinect, a Cortana oferecia assistência de comando de voz em uma TV conectada utilizando o IR blaster da plataforma. Hoje em dia, você ainda pode fazer isso usando um alto-falante Amazon Echo, Alexa e HDMI-CEC, mas a Cortana, assim como o Kinect, seguiram o caminho do dodô há algum tempo.
De fato, a Cortana agora está essencialmente morta. Embora o aplicativo ainda exista no Windows 10 e 11, ele não serve para nada. Ela não pode mais se integrar ao Bing para obter boletins meteorológicos ou notícias. Ela não tem mais acesso a calendários, Xbox ou Microsoft Store. Ela pode, no entanto, ainda contar piadas de mau gosto, o que talvez seja uma ironia adequada para o quão inútil a Cortana se tornou em 2022.
A morte da Cortana me irritou como alguém que investiu em coisas como o alto-falante Harman/Kardon Cortana para recursos domésticos inteligentes e música ativada por voz, mas talvez tenha sido uma dica do futuro de todo o conceito. Segundo relatos, o Alexa da Amazon, apesar de ser o líder no segmento de alto-falantes inteligentes, também está no caminho certo.
A realidade dos assistentes de voz em 2022
A Cortana é totalmente inútil em 2022, despojada de qualquer coisa que se pareça com “assistência inteligente”, mas os populares alto-falantes Echo da Amazon continuam vivos. No entanto, um relatório no Business Insider descreveu como o Alexa da Amazon foi um “fracasso colossal”, de acordo com ex-funcionários da divisão.
O relatório descreve como a Amazon já pensou que poderia suplantar os telefones celulares para direcionar o comércio para seu site, com os usuários fazendo compras por meio de seus alto-falantes Echo conectados, em vez da web. Todos nos lembramos das controvérsias do Amazon Echo, desde preocupações com a privacidade sobre o acesso dos funcionários da Amazon aos microfones em sua casa até erros que enviaram respostas incorretas aos usuários. “A Amazon promete consertar a risada assustadora da Alexa”, disse um velho artigo lê, daquele estranho bug em que os alto-falantes do Echo estavam assustando as pessoas aleatoriamente até a morte com cacarejos aleatórios de bruxa.
Mas espere, eles não venderam milhões dessas coisas? A Amazon não relata a venda de unidades para alto-falantes Echo, mas considerando que você mal consegue navegar na Amazon.com sem tropeçar em um anúncio de um alto-falante Echo, você pode imaginar o quão bem essas coisas realmente venderam. Como resultado, isso é continuamente classificado entre os itens mais vendidos na Amazon, mas, conforme observado pelo relatório, a Amazon vendeu esses dispositivos a preço de custo. Era o modelo de negócios errado para o produto errado.
Pode não ser surpresa descobrir que a Amazon estava, de fato, caçando a equipe do Xbox a torto, a direito e no centro de sua divisão Amazon Echo. E isso pode parecer estranho à primeira vista, mas o modelo de negócios do Xbox é algo que a Amazon erroneamente tentou cooptar aqui.
Os consoles Xbox (e todos os consoles, em geral) são vendidos com margens mínimas. A ideia é que você ganhe dinheiro com o serviço prestado. Para o Xbox, isso significa vendas de software – jogos, microtransações e serviços de assinatura. Parece que a Amazon queria algo semelhante para o Alexa, vendendo os dispositivos muito baratos com o objetivo de descobrir o aspecto de monetização mais tarde. Infelizmente para a equipe de lá, o “depois” nunca veio.
Os relatórios sugerem que, em 2019, tudo veio à tona quando todas as iniciativas para monetizar o Alexa falharam completamente. Para monetizar um serviço, você precisa de algo para vender, e o Alexa não. As pessoas não querem fazer compras no Alexa, caso ela interprete mal o seu pedido de uma “caixa de seis ovos” de $ 5 dólares como um “Xbox Series X” de $ 500 dólares. E claro, não é provável – mas as pessoas não querem fazer compras dessa forma. O Business Insider diz que a Amazon estava rastreando bilhões de interações por dia por meio de seus alto-falantes, todas com suas sobrecargas de servidor, usadas principalmente para acender interruptores de luz e receber pedidos de música.
Lembro que muitos (incluindo nós) criticaram o alto-falante Harman/Kardon Cortana por seu preço, mas, olhando para trás, fazia total e total sentido. Se nem a Amazon, com seu império de varejo, conseguiu monetizar a Alexa por meio de compras, que diabos a Microsoft fez pela Cortana?
O futuro da assistência de IA pode parecer muito diferente
Nos últimos meses, tenho trabalhado com as várias permutações de algoritmos de aprendizado de máquina emergentes da iniciativa OpenAI e de suas equipes concorrentes. A Microsoft tem uma divisão dedicada a pesquisar como transformar projetos de IA em produtos, e já vimos a IA aparecer em situações como moderação de conteúdo nas redes sociais, no Xbox Live e até mesmo em respostas rápidas no Outlook e LinkedIn. Vimos a Microsoft integrar coprogramadores de IA ao GitHub e ao Visual Studio. Ao mesmo tempo, expõe o potencial da IA para trabalhar ao lado de desenvolvedores que criam a próxima geração de videogames e serviços baseados em aplicativos. Isso parece bem diferente das ferramentas de conversação fortemente roteirizadas que Google, Apple e Amazon ainda estão desenvolvendo.
Até o momento, o Google Assistant e o Siri da Apple ultrapassaram o Alexa da Amazon em uso, de acordo com a análise do Business Insider. Até o Google, como líder de mercado, se comprometeu a cortes em seu segmento Assistente já que o modelo de negócios para monetização continua a iludir os players de tecnologia mais proeminentes do mundo. Esses assistentes são todos baseados em nuvem e têm custos contínuos para serem executados, e é difícil reconciliar esses custos sem pelo menos alguma forma de fluxo de receita diretamente associado. A equipe Alexa da Amazon supostamente tentou argumentar que o serviço gera um efeito halo positivo sobre a marca Amazon – e isso pode ser verdade, mas é simplesmente difícil de medir em uma planilha, muito menos justificar aos acionistas.
A Microsoft é um grande investidor na OpenAI e possui licenças exclusivas para aplicações comerciais de alguns de seus algoritmos. No entanto, ainda não os vimos se materializar em algo que possa ser descrito como um recurso matador. As respostas automáticas do LinkedIn são hilárias, mas tenho quase certeza de que minha vida continuaria sem elas.
Ainda considero meu Amazon Echo um dos melhores acessórios do Xbox e ainda o uso todos os dias, mas, claramente, esse não é mais um caso de uso viável para negócios. Aconteça o que acontecer com a tecnologia assistiva de voz no futuro, as visões de ficção científica do tipo Minority Report de IA completa permeando todos os aspectos de nossas vidas parecem mais distantes do que nunca. É um tanto irônico, dados os recentes avanços no texto preditivo de aprendizado de máquina. Mas é aí que reside o problema: nada do que temos aqui é indiscutivelmente verdadeiro, contextualmente consciente, verdadeiro intelecto. A “IA” de hoje é treinada em um pântano de conteúdo da Internet voltado para o público, incapaz de entender verdadeiramente as nuances de nossa comunicação que mal entendemos. O trabalho continua inabalável, no entanto. E eu me pergunto se há ou não uma oportunidade para a Microsoft voltar a entrar na briga de assistência por voz algum dia, com o modelo de negócios matador que Google, Amazon e Apple ainda precisam descobrir.