A Renesas desenvolve tecnologia de processador embarcado para maior velocidade e eficiência em MPUs de IA de visão

A Renesas Electronics Corporation anunciou o desenvolvimento de tecnologia de processador embarcado que permite velocidades mais altas e menor consumo de energia em unidades de microprocessador (MPUs) que realizam IA de visão avançada. As tecnologias recentemente desenvolvidas são as seguintes: (1) Um acelerador de IA baseado em processador reconfigurável dinamicamente (DRP) que processa com eficiência modelos leves de IA e (2) Tecnologia de arquitetura heterogênea que permite processamento em tempo real operando cooperativamente IPs de processador, como o CPU. A Renesas produziu um protótipo de AI-MPU embarcado com essas tecnologias e confirmou sua operação em alta velocidade e baixo consumo de energia. Alcançou um processamento até 16 vezes mais rápido (130 TOPS) do que antes da introdução dessas novas tecnologias e eficiência energética de classe mundial (até 23,9 TOPS/W com alimentação de 0,8 V).

Em meio à recente disseminação de robôs em fábricas, logística, serviços médicos e lojas, há uma necessidade crescente de sistemas que possam ser executados autonomamente em tempo real, detectando os arredores usando IA de visão avançada. Como há restrições severas na geração de calor, particularmente para dispositivos embarcados, tanto maior desempenho quanto menor consumo de energia são necessários em chips de IA. A Renesas desenvolveu novas tecnologias para atender a esses requisitos e apresentou essas conquistas em 21 de fevereiro, na International Solid-State Circuits Conference 2024 (ISSCC 2024), realizada entre 18 e 22 de fevereiro de 2024 em São Francisco.

As tecnologias desenvolvidas pela Renesas são as seguintes:

(1) Um acelerador de IA que processa com eficiência modelos leves de IA
Como uma tecnologia típica para melhorar a eficiência do processamento de IA, a poda está disponível para omitir cálculos que não afetam significativamente a precisão do reconhecimento. No entanto, é comum que cálculos que não afetam a precisão do reconhecimento existam aleatoriamente em modelos de IA. Isso causa uma diferença entre o paralelismo do processamento do hardware e a aleatoriedade da poda, o que torna o processamento ineficiente.

Para resolver esse problema, a Renesas otimizou seu acelerador de IA baseado em DRP (DRP-AI) exclusivo para poda. Ao analisar como as características do padrão de poda e um método de poda estão relacionados à precisão do reconhecimento em modelos típicos de IA de reconhecimento de imagem (modelos CNN), identificamos a estrutura de hardware de um acelerador de IA que pode atingir alta precisão de reconhecimento e uma taxa de poda eficiente e a aplicamos ao design DRP-AI. Além disso, o software foi desenvolvido para reduzir o peso dos modelos de IA otimizados para este DRP-AI. Este software converte a configuração do modelo de poda aleatória em computação paralela altamente eficiente, resultando em processamento de IA de maior velocidade. Em particular, a tecnologia de suporte de poda altamente flexível da Renesas (tecnologia de poda N:M flexível), que pode alterar dinamicamente o número de ciclos em resposta a mudanças na taxa de poda local em modelos de IA, permite o controle fino da taxa de poda de acordo com o consumo de energia, velocidade operacional e precisão de reconhecimento exigidos pelos usuários.

Essa tecnologia reduz o número de ciclos de processamento do modelo de IA para apenas um décimo sexto da poda de modelos incompatíveis e consome menos de um oitavo da energia.

(2) Tecnologia de arquitetura heterogênea que permite processamento em tempo real para controle de robôs
As aplicações de robôs exigem processamento avançado de IA de visão para reconhecimento do ambiente ao redor. Enquanto isso, o julgamento e o controle de movimento do robô exigem programação detalhada de condições em resposta a mudanças no ambiente ao redor, então o processamento de software baseado em CPU é mais adequado do que o processamento baseado em IA. O desafio tem sido que as CPUs com processadores embarcados atuais não são totalmente capazes de controlar robôs em tempo real. É por isso que a Renesas introduziu um processador dinamicamente reconfigurável (DRP), que lida com processamento complexo, além do acelerador de CPU e IA (DRP-AI). Isso levou ao desenvolvimento de tecnologia de arquitetura heterogênea que permite velocidades mais altas e menor consumo de energia em AI-MPUs distribuindo e paralelizando processos apropriadamente.

Um DRP executa um aplicativo enquanto altera dinamicamente a configuração de conexão do circuito entre as unidades aritméticas dentro do chip para cada clock de operação de acordo com os detalhes do processamento. Como apenas os circuitos aritméticos necessários operam mesmo para processamento complexo, menor consumo de energia e velocidades mais altas são possíveis. Por exemplo, SLAM (Simultaneously Localization and Mapping), um dos aplicativos típicos de robôs, é uma configuração complexa que requer vários processos de programação para reconhecimento de posição do robô em paralelo com reconhecimento de ambiente por processamento de IA de visão. A Renesas demonstrou a operação deste SLAM por meio de troca instantânea de programa com o DRP e operação paralela do acelerador de IA e CPU, resultando em velocidades de operação cerca de 17 vezes mais rápidas e cerca de 12 vezes maior eficiência de energia operacional do que a CPU incorporada sozinha.

A Renesas criou um protótipo de um chip de teste com essas tecnologias e confirmou que ele atingiu a mais alta eficiência de energia de classe mundial de 23,9 TOPS por watt em uma tensão de energia normal de 0,8 V para o acelerador de IA e eficiência de energia operacional de 10 TOPS por watt para os principais modelos de IA. Também provou que o processamento de IA é possível sem um ventilador ou dissipador de calor.

A utilização desses resultados ajuda a resolver a geração de calor devido ao aumento do consumo de energia, que tem sido um dos desafios associados à implementação de chips de IA em uma variedade de dispositivos embarcados, como robôs de serviço e veículos guiados automaticamente. A redução significativa da geração de calor contribuirá para a disseminação da automação em vários setores, como os mercados de robótica e de tecnologia inteligente. Essas tecnologias serão aplicadas à série RZ/V da Renesas – MPUs para aplicações de IA de visão.

Conteúdo Relacionado

Voltar para o blog

Deixe um comentário

Os comentários precisam ser aprovados antes da publicação.