Entradas

Mostrando entradas de abril, 2023

Proyecto2. Ocr Web.

Retomamos todo el trabajo realizado durante 2018, que tiempos, sobre el mundo del OCR. Siempre me ha gustado el mundo de la informática aplicada a los problemas reales, y no filosofar en proyectos de dudoso impacto cómo aplicaciones de uso general que han proliferado en  las llamadas startups de la última década, donde la recolección de datos es el objetivo final y de donde las empresas que han fallado al hacerlo han caído. En aquel 2018 estaba investigando como crear una solución de OCR con software libre con la suficiente utiilidad para poder ser mínimamente útil a los usuarios y los clientes que tienen que afrontar  la digitalización con los escasos medios de los que disponen. Hay 2 patas para hacer esto, uno es buscar localizar un mecanismo de OCR viable con el mínimo coste  como mínimo producto viable (proy.Tesseract) y por otro lado otro mecanismo de indexación de la información. En este último caso tenemos dos soluciones: a. software libre: Elasticsearch b. servici...