U-net es una arquitectura de red neuronal utilizada principalmente en la segmentación de imágenes médicas, cómo . Sin embargo ha sido demostrada su utilidad en otras aplicaciones, cómo la colorización de imágenes [0] y su asistencia en microscopía [1]. Su arquitectura en forma U, con conexiones que transportan información de principio a fin, permite mantener información contextual, para no perder detalle en el resultado.
Debido a su tamaño y cantidad de parámetros, se requiere gran potencia de cómputo para su entrenamiento, siendo esta reemplazada por tiempo cuando el poder computacional disponible no es suficiente. Por suerte, utilizando transfer learning, podemos hacer uso de versiones ya entrenadas de esta red en nuestro dominio, realizando un entrenamiento acotado y más reducido, para lograr resultados más que satisfactorios. En esta charla veremos cómo, utilizando pytorch, podemos hacer uso de versiones de U-net ya entrenadas en nuestro trabajo y aprovechar su poder.
Se utilizará como principal ejemplo de librería Segmentation Models 2, que permite utilizar U-net con diferentes configuraciones de encoders y sus pesos para reentrenar para nuestro dominio.
[0]: Y. Ouyang, Y. Rao, D. Zhang and J. Cheng, "Cartoon Colorization with Gray Image Generated from Sketch," 2021 4th International Conference on Pattern Recognition and Artificial Intelligence (PRAI), 2021, pp. 70-74, doi: 10.1109/PRAI53619.2021.9551084.
[1]: Kandel, M. E., He, Y. R., Lee, Y. J., Chen, T. H. Y., Sullivan, K. M., Aydin, O., ... & Popescu, G. (2020). Phase imaging with computational specificity (PICS) for measuring dry mass changes in sub-cellular compartments. Nature communications, 11(1), 1-10.