domingo, 27 de noviembre de 2011

REDES NEURONALES BASADAS EN LA OPTIMIZACION


La inmensa potencia de cálculo de los sistemas neuronales para resolver problemas de percepción, con gran cantidad de datos, alcanzan una gran capacidad de procesamiento. Las estrategias de el cálculo neuronal  se han adaptado estos últimos años para resolver problemas de optimización. Las redes neuronales son una gran red paralela de simples procesadores  interconectados (neuronas) donde cada neurona tiene un conjunto de entradas (para otras neuronas) y calcula una salida que es propagada a los nodos que se encargan de esta (salida). Así podemos decir que las redes neuronales están compuestas por la neurona individual, la red colectiva,  los pesos (ganancia) asociados con las interconexiones entre las neuronas y la activación de la función de cada neurona. En los mapas de las redes se muestra la entrada de un vector de un espacio a otro.

Considerando una neurona (como se muestra en la figura) 



La neurona tiene n entradas(XI , i= 1, 2,…..,n),  de sus neuronas vecinas y su valor tiende a ser igual a 1.cada entrada tiene un peso WI asociado a ella, la suma ponderada de las entradas determinada el estado o actividad de una neurona, y es dado por : 



Una funcion simple es proporcionada para realizar un mapa de n espacios de entrada con un espacio de salida dirigido hacia sus vecionos. La salida de una neurona es una funcion de sus estados y puede denotarse como f(a). Usualmente no se producira una salida a menos que el nivel de activacion del nodo exceda un valor de umbral.

La salida de cada neurona es usualmente descrita por la siguiente función:



Y se puede mostrar graficamente de la siguiente forma:



La funcion puede manejar grandes, medianas o pequeñas señales de entrada. La pendiente de la funcion f(a) representa la ganancia disponible. Ya que la salida de la neurona depende de las entradas y del valor umbral, cada neurona puede ser considerada como un procesador separado operando en paralelo con otras neuronas. El proceso consiste en determinar el valor de los pesos Wi  ya que estos nos conducen a una optima asociacion de las entradas y la salidas de la red neuronal.

Varios modelos de las redes neuronales se han propuesto para reflejar las caracteristicas fundamentales de una neurona, estas arquitecturas difieren unas de las otras en cuanto al numero de neuronas en la red, la naturaleza de las funciones de umbral, la conectividad de cada neurona y el aprendizaje del procedimiento.

Un tipico modelo es el multilayer feedforwars que mostramos a continuación:



En esta figura los arcos representan la unidireccional comunicacon feedforward (alimento hacia delante), como enlace entre cada neurona. Un peso o ganancia asociado con cada conexión, controla el paso de una salida a una conexión, el peso puede ser positivo o negativo dependiendo de lo exitada o inhibitoria que este una neurona. Las ventajas de tener varias interconexiones es que pueden actuar como depositos para la informacion que se contiene en la red.

La red tambien esta capacitada para minimizar el error cuadratico entre la actual salida y el destino de salida de todos los patrones de entrada, el error es minimizado por los ajustes del peso asociado con varias interconexiones, los pesos deben ser variados para minimizar el error en la salida de cada nodo.

Para apreciar mejor miremos esta ilustración



Esta red esta capacitada para trazar la relacion entre el desplazamiento angular, la velocidad angular y los angulos de transmicion. Las entradas a las 5 neuronas en la capa de entradas incluyen 3 longitudes de enlaces de el mecanismo (r1,r2 y r3) y el desplazamineto y velocidad angular del enlace de entrada (Ө1 y Ө2). Las salidas de las 6 neuronas en la capa de salidas incluyen la posicion y velocidad angular de los enlces de salida (Ө3,w3,Ө4 y w4), el angulo de transmicion (y) y la ventaja mecanica (n) de el mecanismo.

Las redes pueden insertar varias posibles combinaciones de valores de r2,r3,r4,Ө2 y w2 abasteciendo los correspondientes valores de Ө3,Ө4,w3,w4,y e n. La diferencia entre los valores previstos por las redes y la actual salida es usada para ajustar la interconeccion del peso, tal que el error cuadratico en la salida de los nodos es minimizado. Una vez capacitada, la red proporciona un rapido y eficiente esquema de los mapas de las entradas con las deseadas salidas en el mecanismo de 4 barras. Se puede notar que las explicitas ecuaciones relacionadas de r2,r3,r4,Ө2 y w2 y la cantidad de salidas Ө3,Ө4,w3,w4,y e n no han sido programadas en la red, mas bien, la red aprendio a relacionarlas en el proceso de capacitarse para ajustar los pesos asociados con las interconecciones.

Bibliografia: A. K. Dhingra and S. S. Rao, A neuronal network based approach to mechanical design optimization, Engineering Optimization, Vol 20

No hay comentarios:

Publicar un comentario en la entrada