No todo es ChatGPT: La visión por computador

Ir a Blog
Ir a Neuromarketing y más

En los últimos meses se está hablando mucho sobre la inteligencia artificial. Los hay quienes lo hacen desde el rechazo, otros desde la expectación, y muchos más desde el recelo. Si bien es cierto que en los últimos tiempos se está avanzando muchísimo en ella, la inteligencia artificial no es nueva y tampoco se enfoca únicamente en la IA generativa.

Hoy vamos a hablaros de nuestra plataforma –Golineuro AI– y de la inteligencia artificial aplicada a la visión por computador.

La visión por computador (CV) es un área de la IA que se centra en permitir a los ordenadores identificar y procesar imágenes y vídeos de la misma manera que lo hacen los humanos.

Hasta hace poco, la visión por ordenador solo funcionaba de forma limitada, pero gracias a los avances en el aprendizaje profundo (AI), este campo ha sido capaz de dar grandes saltos en los últimos años y está revolucionando diferentes industrias.

¿Cómo funciona? Con redes neuronales convolucionales

Su funcionamiento consiste principalmente en la extracción de características de las diferentes capas en las que se divide una imagen. Supongamos que tenemos una imagen de un barco, junto con un conjunto de etiquetas como “humano”, “vehículo” y “planta”. La tecnología de visión por computador, tras analizar la capa de la imagen en la que se encuentra la forma del barco, clasificará asignando la imagen de un barco a la etiqueta de “vehículo”, ese proceso se denomina clasificación de imágenes.

Una vez el sistema ha clasificado todas las imágenes de barcos, podemos acceder al dato de, por ejemplo, cuántos vehículos ha clasificado, pero no a las imágenes originales de los barcos, que se perdieron en cuanto el sistema los clasificó. Es decir, no se guardan ni se almacenan imágenes, sólo los datos.

Se pueden crear tantas clasificaciones como se quiera, por lo que después se puede acceder a la información cuántos vehículos hay o cuántos eran de color rojo. Para ello, es importante una buena generación de taxonomías (organizaciones) para luego poder analizar los datos.

Las encargadas de realizar este análisis y clasificación son las redes neuronales convolucionales (CNN) cuyas dos principales aplicaciones en visión artificial -en nuestro caso- son la clasificación y la detección.

Aprende de sí misma

El aspecto más importante de los modelos de clasificación es su reutilización, de forma que la información extraída para cada taxonomía se puede utilizar para las demás. Así, la red neuronal utiliza su base de conocimiento para cada convolución, por lo que cuanto más uso tenga una red neuronal, más precisa será, puesto que usa su base de conocimiento anterior para mejorar.

En el caso de nuestra plataforma, Golineuro AI, las redes neuronales tienen una base de conocimiento adquirida en entornos multitudinarios como ciudades, ferias de muestras, grandes superficies y centros comerciales, de más ocho años de uso diario en estos entornos, por lo que cuenta con un conocimiento muy amplio.

Si quieres saber más, sólo tienes que ponerte en contacto con nosotros.


Ir a Blog
Ir a Neuromarketing y más