Dal Caos dei PDF a Dati Strutturati in Secondi
Hai 200 fatture fornitori sulla scrivania. Ognuna con un formato diverso. Normalmente significa un giorno intero di data entry. Con DataUnchain, servono 3 minuti.
Passo 1: Scansiona e rilascia
Il tuo scanner invia i PDF a una cartella di rete. Il servizio Watchdog di DataUnchain rileva ogni nuovo file istantaneamente. I PDF multipagina vengono automaticamente divisi in immagini singole.
Passo 2: L'AI legge ogni pagina
Qwen 3.5 VL analizza ogni immagine. A differenza dell'OCR, comprende il documento — sa dove si trova il numero fattura, dove sono i totali, e riesce a leggere note scritte a mano accanto alle righe prodotto.
Hai configurato il prompt di estrazione una volta sola:
p_iva, imponibile, iva, totale,
righe_prodotto. Rispondi in JSON."
Passo 3: Validazione matematica
Per ogni fattura, Python verifica: imponibile + iva == totale. Se non corrisponde entro una tolleranza di 2 centesimi, il record viene segnalato come DA_VERIFICARE invece di VALIDATO.
Su 200 fatture, tipicamente 3–5 vengono segnalate — o perché l'AI ha letto male una cifra, o perché la fattura originale ha effettivamente un errore.
Passo 4: Export pulito
Tutte le 200 fatture sono ora in PostgreSQL. Esporta in Excel con un click. Carica nel gestionale. Fatto.
Tempo totale: 3 minuti invece di 8 ore.