Processando dados não estruturados com aprendizado profundo

Procesamiento de datos no estructurados con aprendizaje profundo

Cada tipo de datos presenta un nuevo problema para los científicos y analistas de datos, quienes necesitan descubrir la mejor manera de recopilarlos y limpiarlos antes de analizarlos.

Imagem em destaque

Tesseract es una herramienta de OCR que utiliza el aprendizaje profundo para reconocer palabras en imágenes, lo que, por simple que parezca, en realidad puede ser una tarea muy compleja.

Por ejemplo, algunas imágenes pueden estar en baja definición, o tal vez el texto esté desenfocado, o tal vez sea parte de un video y solo tenga unos pocos fotogramas. Es decir, cada imagen es un mundo en sí misma, y ​​en lugar de crear un algoritmo para cada caso, utilizamos el aprendizaje profundo para trabajar con todas las imágenes a la vez, ahorrando tiempo y esfuerzo.

Vivimos en un mundo desestructurado y los humanos rara vez pensamos en términos de datos estructurados, por lo que el aprendizaje profundo se ha convertido en una de las herramientas de inteligencia artificial más importantes en la industria de la tecnología. Para ser justos, todavía está en su infancia, pero es sólo cuestión de tiempo antes de que Siri y aplicaciones similares se conviertan en algo más que motores de búsqueda glorificados.

Fuente: BairesDev

Regresar al blog

Deja un comentario

Ten en cuenta que los comentarios deben aprobarse antes de que se publiquen.