En el marco de los preparativos de GTC 2022, NVIDIA ha publicado un artículo donde aborda las nuevas oportunidades que han surgido para la IA de borde, que antes eran inimaginables: «desde ayudar a los radiólogos a identificar patologías en el hospital, hasta conducir coches por la autopista, pasando por ayudarnos a polinizar las plantas».
Son innumerables los analistas y las empresas que hablan e implementan la computación de borde, cuyos orígenes se remontan a la década de 1990, cuando se crearon las redes de entrega de contenidos para servir contenidos web y de vídeo desde servidores de borde desplegados cerca de los usuarios.
Hoy en día, casi todas las empresas tienen funciones de trabajo que pueden beneficiarse de la adopción de la IA de borde. De hecho, las aplicaciones de borde están impulsando la próxima ola de IA con miras a mejorar la vida cotidiana de los individuos en sus hogares, empleos, centros de estudio y en el tránsito.
La IA en el borde es el despliegue de aplicaciones de IA en dispositivos de todo el mundo físico. Se denomina «edge AI» porque el cálculo de la IA se realiza cerca del usuario en el borde de la red, cerca de donde se encuentran los datos, en lugar de hacerlo de forma centralizada en una instalación de computación en la nube o en un centro de datos privado.
Dado que Internet tiene un alcance global, el borde de la red puede connotar cualquier lugar. Puede ser una tienda, una fábrica, un hospital o los dispositivos que nos rodean, como semáforos, máquinas autónomas y teléfonos.
IA en el borde: ¿por qué ahora?
Las organizaciones de todos los sectores buscan aumentar la automatización para mejorar los procesos, la eficiencia y la seguridad.
Para ayudarles, los programas informáticos necesitan reconocer patrones y ejecutar tareas de forma repetida y segura. Pero el mundo no está estructurado y el abanico de tareas que realizan los humanos abarca infinitas circunstancias que son imposibles de describir completamente en programas y reglas.
Los avances en la IA de vanguardia han abierto oportunidades para que las máquinas y los dispositivos, estén donde estén, funcionen con la «inteligencia» de la cognición humana. Las aplicaciones inteligentes habilitadas por la IA buscan realizar tareas similares en diferentes circunstancias, de forma muy parecida a la vida real.
La eficacia de desplegar modelos de IA en el borde surge de tres innovaciones recientes.
1. La maduración de las redes neuronales: Las redes neuronales y la infraestructura de IA relacionada se han desarrollado finalmente hasta el punto de permitir el aprendizaje automático generalizado. Las organizaciones están aprendiendo a entrenar con éxito los modelos de IA y a desplegarlos en producción en el borde.
2. Avances en la infraestructura informática: Se necesita una potente potencia de cálculo distribuida para ejecutar la IA en el perímetro. Los recientes avances en GPUs altamente paralelas se han adaptado para ejecutar redes neuronales.
3. Adopción de dispositivos IoT: La adopción generalizada del Internet de las Cosas ha impulsado la explosión de big data. Con la repentina capacidad de recopilar datos en todos los aspectos de una empresa -desde sensores industriales, cámaras inteligentes y robots, entre otros-, ahora disponemos de los datos y dispositivos necesarios para desplegar modelos de IA en el borde. Además, el 5G está proporcionando al IoT un impulso con una conectividad más rápida, estable y segura.
Dado que los algoritmos de IA son capaces de comprender el lenguaje, las imágenes, los sonidos, los olores, la temperatura, las caras y otras formas analógicas de información no estructurada, son especialmente útiles en lugares ocupados por usuarios finales con problemas del mundo real. Estas aplicaciones de IA serían poco prácticas o incluso imposibles de desplegar en una nube centralizada o en un centro de datos empresarial debido a problemas relacionados con la latencia, el ancho de banda y la privacidad.
Los beneficios de la IA de borde incluyen
– Inteligencia: Las aplicaciones de IA son más potentes y flexibles que las aplicaciones convencionales que sólo pueden responder a las entradas que el programador había previsto. Por el contrario, una red neuronal de IA no está entrenada para responder a una pregunta específica, sino para responder a un tipo de pregunta en particular, incluso si la pregunta en sí es nueva. Sin la IA, las aplicaciones no podrían procesar entradas infinitamente diversas como textos, palabras habladas o vídeos.
– Información en tiempo real: Dado que la tecnología de borde analiza los datos localmente en lugar de en una nube lejana retrasada por las comunicaciones a larga distancia, responde a las necesidades de los usuarios en tiempo real.
– Coste reducido: Al acercar la potencia de procesamiento al borde, las aplicaciones necesitan menos ancho de banda de Internet, lo que reduce enormemente los costes de red.
– Mayor privacidad: La IA puede analizar información del mundo real sin exponerla nunca a un ser humano, lo que aumenta enormemente la privacidad de cualquier persona cuyo aspecto, voz, imagen médica o cualquier otra información personal deba ser analizada. La IA de borde mejora aún más la privacidad al contener esos datos localmente, subiendo sólo el análisis y los conocimientos a la nube. Incluso si algunos de los datos se cargan con fines de formación, pueden ser anónimos para proteger la identidad de los usuarios. Al preservar la privacidad, la IA de borde simplifica los retos asociados al cumplimiento de la normativa sobre datos.
– Alta disponibilidad: La descentralización y las capacidades offline hacen que la IA de borde sea más robusta, ya que no es necesario el acceso a Internet para procesar los datos. Esto se traduce en una mayor disponibilidad y fiabilidad para las aplicaciones de IA de misión crítica y de nivel de producción.
– Mejora constante: Los modelos de IA son cada vez más precisos a medida que se entrenan con más datos. Cuando una aplicación de IA de borde se enfrenta a datos que no puede procesar con precisión o confianza, suele cargarlos para que la IA pueda volver a entrenarse y aprender de ellos. Por lo tanto, cuanto más tiempo esté un modelo en producción en el borde, más preciso será el modelo.
Para que las máquinas vean, detecten objetos, conduzcan coches, entiendan el habla, hablen, caminen o emulen de alguna manera las habilidades humanas, necesitan replicar funcionalmente la inteligencia humana.
La IA emplea una estructura de datos llamada red neuronal profunda para replicar la cognición humana. Estas redes neuronales profundas se entrenan para responder a determinados tipos de preguntas mostrándoles muchos ejemplos de ese tipo de preguntas junto con las respuestas correctas.
Este proceso de entrenamiento, conocido como «aprendizaje profundo», suele ejecutarse en un centro de datos o en la nube debido a la gran cantidad de datos necesarios para entrenar un modelo preciso, y a la necesidad de que los científicos de datos colaboren en la configuración del modelo. Después del entrenamiento, el modelo se gradúa para convertirse en un «motor de inferencia» que puede responder a preguntas del mundo real.
En los despliegues de IA de borde, el motor de inferencia se ejecuta en algún tipo de computadora o dispositivo en lugares lejanos como fábricas, hospitales, coches, satélites y hogares. Cuando la IA tropieza con un problema, los datos problemáticos suelen subirse a la nube para seguir entrenando el modelo de IA original, que en algún momento sustituye al motor de inferencia en el borde. Este bucle de retroalimentación desempeña un papel importante en el aumento del rendimiento del modelo; una vez que se despliegan los modelos de IA de borde, sólo se vuelven más y más inteligentes.
La IA es la fuerza tecnológica más poderosa de nuestro tiempo. Nos encontramos en un momento en el que la IA está revolucionando las mayores industrias del mundo.
En los sectores de la fabricación, la sanidad, los servicios financieros, el transporte y la energía, entre otros, la IA de vanguardia está impulsando nuevos resultados empresariales en todos los sectores, como por ejemplo
– Previsión inteligente en energía: Para industrias críticas como la de la energía, en la que el suministro discontinuo puede amenazar la salud y el bienestar de la población en general, la previsión inteligente es clave. Los modelos Edge AI ayudan a combinar datos históricos, patrones meteorológicos, estado de la red y otra información para crear complejas simulaciones que informan sobre una generación, distribución y gestión más eficientes de los recursos energéticos para los clientes.
– Mantenimiento predictivo en la fabricación: Los datos de los sensores pueden utilizarse para detectar anomalías con antelación y predecir cuándo fallará una máquina. Los sensores de los equipos escanean los fallos y alertan a la dirección si una máquina necesita una reparación, de modo que el problema pueda abordarse con antelación, evitando costosos tiempos de inactividad.
– Instrumentos con IA en la sanidad: Los instrumentos médicos modernos en la periferia se están convirtiendo en dispositivos habilitados por la IA que utilizan la transmisión de vídeo quirúrgico de latencia ultrabaja para permitir cirugías mínimamente invasivas y conocimientos a la carta.
– Asistentes virtuales inteligentes en el comercio minorista: Los minoristas buscan mejorar la experiencia digital del cliente introduciendo los pedidos por voz para sustituir las búsquedas basadas en texto por comandos de voz. Con los pedidos por voz, los compradores pueden buscar fácilmente artículos, pedir información sobre los productos y hacer pedidos en línea utilizando altavoces inteligentes u otros dispositivos móviles inteligentes.
Las aplicaciones de IA pueden ejecutarse en un centro de datos como los de las nubes públicas, o en el borde de la red, cerca del usuario. Tanto la computación en la nube como la computación de borde ofrecen ventajas que pueden combinarse al desplegar la IA de borde.
La nube ofrece ventajas relacionadas con el coste de la infraestructura, la escalabilidad, la alta utilización, la resistencia a los fallos del servidor y la colaboración. La computación de borde ofrece tiempos de respuesta más rápidos, menores costes de ancho de banda y resistencia a los fallos de la red.
La computación en la nube puede respaldar la implantación de la IA en el borde de la red de varias maneras:
NVIDIA anuncia múltiples novedades, y más de 900 sesiones online con expertos de la industria para GTC 2022. Los interesados en asistir pueden inscribirse gratuitamente en este enlace.
Fuente: Diario TI