A Renesas desenvolve tecnologia de processador embarcado para maior velocidade e eficiência em MPUs de IA de visão

Renesas desarrolla tecnología de procesador integrado para mayor velocidad y eficiencia en MPU de IA de visión

28 de junio de 2024 Roberto Magalhães

Renesas Electronics Corporation anunció el desarrollo de una tecnología de procesador integrado que permite velocidades más altas y un menor consumo de energía en unidades de microprocesador (MPU) que realizan inteligencia artificial de visión avanzada. Las tecnologías recientemente desarrolladas son las siguientes: (1) Un acelerador de IA basado en un procesador reconfigurable dinámicamente (DRP) que procesa de manera eficiente modelos de IA livianos y (2) Tecnología de arquitectura heterogénea que permite el procesamiento en tiempo real mediante IP de procesador que operan de manera cooperativa, como la CPU. . Renesas ha producido un prototipo de AI-MPU integrado con estas tecnologías y ha confirmado su funcionamiento a alta velocidad y bajo consumo de energía. Logró un procesamiento hasta 16 veces más rápido (130 TOPS) que antes de la introducción de estas nuevas tecnologías y una eficiencia energética de clase mundial (hasta 23,9 TOPS/W con un suministro de 0,8 V).

En medio de la reciente proliferación de robots en fábricas, logística, servicios médicos y tiendas, existe una necesidad creciente de sistemas que puedan funcionar de forma autónoma en tiempo real, detectando su entorno mediante IA de visión avanzada. Dado que existen graves limitaciones en la generación de calor, particularmente para los dispositivos integrados, en los chips de IA se requieren tanto un mayor rendimiento como un menor consumo de energía. Renesas ha desarrollado nuevas tecnologías para cumplir con estos requisitos y presentó estos logros el 21 de febrero, en la Conferencia Internacional de Circuitos de Estado Sólido 2024 (ISSCC 2024), celebrada del 18 al 22 de febrero de 2024 en San Francisco.

Las tecnologías desarrolladas por Renesas son las siguientes:

(1) Un acelerador de IA que procesa de manera eficiente modelos de IA livianos
Como tecnología típica para mejorar la eficiencia del procesamiento de IA, la poda está disponible para omitir cálculos que no afectan significativamente la precisión del reconocimiento. Sin embargo, es común que en los modelos de IA existan cálculos que no afectan la precisión del reconocimiento de forma aleatoria. Esto provoca una diferencia entre el paralelismo del procesamiento del hardware y la aleatoriedad de la poda, lo que hace que el procesamiento sea ineficiente.

Para resolver este problema, Renesas ha optimizado su exclusivo acelerador de IA basado en DRP (DRP-AI) para la poda. Al analizar cómo las características del patrón de poda y un método de poda se relacionan con la precisión del reconocimiento en modelos típicos de IA de reconocimiento de imágenes (modelos CNN), identificamos la estructura de hardware de un acelerador de IA que puede lograr una alta precisión de reconocimiento de imágenes y una tasa de poda eficiente. aplicarlo al diseño DRP-AI. Además, el software está diseñado para reducir la carga de los modelos de IA optimizados para este DRP-AI. Este software convierte la configuración del modelo de poda aleatoria en computación paralela altamente eficiente, lo que resulta en un procesamiento de IA de mayor velocidad. En particular, la tecnología de soporte de poda altamente flexible de Renesas (tecnología de poda flexible N:M), que puede cambiar dinámicamente el número de ciclos en respuesta a cambios en la tasa de poda local en los modelos de IA, permite un control preciso de la tasa de poda según la potencia. consumo, velocidad de funcionamiento y precisión de reconocimiento requeridos por los usuarios.

Esta tecnología reduce la cantidad de ciclos de procesamiento de modelos de IA a solo una decimosexta parte de la poda de modelos incompatibles y consume menos de una octava parte de la energía.

(2) Tecnología de arquitectura heterogénea que permite el procesamiento en tiempo real para el control del robot
Las aplicaciones robóticas requieren un procesamiento avanzado de IA de visión para el reconocimiento del entorno circundante. Mientras tanto, el juicio y el control del movimiento del robot requieren una programación detallada de las condiciones en respuesta a los cambios en el entorno, por lo que el procesamiento de software basado en CPU es más adecuado que el procesamiento basado en IA. El desafío ha sido que las CPU integradas actuales no son completamente capaces de controlar robots en tiempo real. Es por eso que Renesas introdujo un procesador dinámicamente reconfigurable (DRP), que maneja procesamiento complejo, además de la CPU y el acelerador de IA (DRP-AI). Esto ha llevado al desarrollo de tecnología de arquitectura heterogénea que permite mayores velocidades y menor consumo de energía en AI-MPU mediante la distribución y paralelización de procesos de manera adecuada.

Un DRP ejecuta una aplicación mientras cambia dinámicamente la configuración de conexión del circuito entre las unidades aritméticas en el chip para cada reloj operativo de acuerdo con los detalles del procesamiento. Dado que, incluso en procesos complejos, sólo funcionan los circuitos aritméticos necesarios, es posible un menor consumo de energía y mayores velocidades. Por ejemplo, SLAM (localización y mapeo simultáneos), una de las aplicaciones robóticas típicas, es una configuración compleja que requiere múltiples procesos de programación para el reconocimiento de la posición del robot en paralelo con el reconocimiento del entorno mediante el procesamiento de IA visual. Renesas demostró el funcionamiento de este SLAM mediante la conmutación instantánea de programas con el DRP y el funcionamiento paralelo de la IA y el acelerador de la CPU, lo que da como resultado velocidades operativas aproximadamente 17 veces más rápidas y aproximadamente 12 veces mayor eficiencia energética operativa que la CPU incorporada sola.

Renesas creó un prototipo de un chip de prueba con estas tecnologías y confirmó que logró la eficiencia energética más alta de clase mundial de 23,9 TOPS por vatio a un voltaje de alimentación normal de 0,8 V para el acelerador de IA y una eficiencia energética operativa de 10 TOPS por vatio para el líder. Modelos de IA. También demostró que el procesamiento de IA es posible sin ventilador ni disipador de calor.

La utilización de estos resultados ayuda a abordar la generación de calor debido al mayor consumo de energía, que ha sido uno de los desafíos asociados con la implementación de chips de IA en una variedad de dispositivos integrados, como robots de servicio y vehículos guiados automáticamente. La importante reducción de la generación de calor contribuirá a la expansión de la automatización en diversos sectores, como los mercados de la robótica y la tecnología inteligente. Estas tecnologías se aplicarán a la serie RZ/V de Renesas: MPU para aplicaciones de IA de visión.