Neste artigo, você vai conhecer a previsão de Jordan Peterson sobre os perigos da inteligência artificial (IA) e como ela está se concretizando na atualidade.
Peterson, um psicólogo e escritor de sucesso do Canadá, denuncia como as redes sociais usam algoritmos para influenciar nossos sentimentos e ideias. Ele nos adverte sobre os perigos de nos tornarmos escravos e massificados por uma tecnologia que cresce em força e controle.
O tempo voou incrivelmente. Em dezembro, o prof. Jordan Peterson participou de uma ótima entrevista com Lord Conrad Blake, onde tratou de diversos temas. Um deles e ligado ao ChatGPT, que naquele momento era um lançamento, é a questão do “lado obscuro da IA”.
Peterson avisou sobre o seguinte:
"“Esteja preparado para coisas que surgirão na frente da IA no próximo ano e que deixarão seus cabelos em pé.
Agora já existe uma IA capaz de criar sua própria imagem do mundo apenas com base na análise de um colossal corpus de textos. E essa IA já é mais inteligente do que muitos de nós. Mas em um ano ela se tornará incomparavelmente mais inteligente do que a maioria de nós. Pois ela construirá sua imagem do mundo a partir de trilhões de padrões, extraídos não apenas dos textos das pessoas, mas também do próprio mundo (suas imagens visuais e outras). O conhecimento que está no centro da sua visão do mundo não virá apenas das estatísticas linguísticas dos textos que descrevem esse mundo (como o ChatGPT tem atualmente). Mas também das estatísticas dos padrões de formação e dinâmica das interações dos objetos neste mundo. Portanto, mantenham seus chapéus, senhoras e senhores. Como disse Jonathan Pajo, “gigantes virão à Terra novamente, e podemos vê-los se vivermos”.
Em menos de um trimestre, o aviso do prof. Peterson começou a se concretizar.
Pesquisadores de IA do Google e da Universidade Técnica de Berlim criaram o PaLM-E, um modelo gigante de 562 bilhões de parâmetros que une visão e linguagem para comandar robôs.
O PaLM-E pode seguir instruções como “pegue alguns chips de arroz na gaveta da cozinha” e fazer um plano de ação para um robô móvel com braço mecânico (feito pela Google Robotics) e realizar todas as ações planejadas.
O PaLM-E faz isso usando os dados da câmera do robô sem precisar de uma imagem pré-fabricada da cena. Isso evita o trabalho de pré-processamento ou marcação humana e permite que o robô atue sozinho.
PaLM-E é um modelo que prevê qual palavra vem a seguir. Ele usa o PaLM, um grande modelo de linguagem do Google, parecido com a tecnologia que faz o ChatGPT funcionar.
Mas o Google fez o PaLM mais “próximo da realidade” ao incluir dados dos sentidos e da movimentação de robôs.
Como ele usa um modelo de linguagem, o PaLM-E transforma continuamente o que vê ou sente em uma sequência de vetores do mesmo tamanho que as palavras. Isso faz com que o modelo “compreenda” os dados dos sentidos como se fossem linguagem.
O novo modelo mostra capacidades interessantes e surpreendentes.
Por exemplo, ele tem “transferência positiva”, ou seja, ele pode usar o que aprendeu em uma tarefa para fazer outra melhor do que modelos de robôs que só fazem uma tarefa.
Além disso, o modelo faz raciocínios multimodais (usando linguagem e visão para analisar uma sequência de entradas) e inferências multiimagem (usando várias imagens para tirar uma conclusão ou previsão), mesmo que o modelo tenha sido treinado só com imagens únicas.