Perché DataUnchain Soluzioni Costi Tecnologia Blog GitHub ↗
Italiano English
Blog · 3 Marzo 2026

Dal Caos dei PDF a Dati Strutturati in Secondi

Hai 200 fatture fornitori sulla scrivania. Ognuna con un formato diverso. Normalmente significa un giorno intero di data entry. Con DataUnchain, servono 3 minuti.

Passo 1: Scansiona e rilascia

Il tuo scanner invia i PDF a una cartella di rete. Il servizio Watchdog di DataUnchain rileva ogni nuovo file istantaneamente. I PDF multipagina vengono automaticamente divisi in immagini singole.

Passo 2: L'AI legge ogni pagina

Qwen 3.5 VL analizza ogni immagine. A differenza dell'OCR, comprende il documento — sa dove si trova il numero fattura, dove sono i totali, e riesce a leggere note scritte a mano accanto alle righe prodotto.

Hai configurato il prompt di estrazione una volta sola:

"Estrai: numero_fattura, data, fornitore,
p_iva, imponibile, iva, totale,
righe_prodotto. Rispondi in JSON."

Passo 3: Validazione matematica

Per ogni fattura, Python verifica: imponibile + iva == totale. Se non corrisponde entro una tolleranza di 2 centesimi, il record viene segnalato come DA_VERIFICARE invece di VALIDATO.

Su 200 fatture, tipicamente 3–5 vengono segnalate — o perché l'AI ha letto male una cifra, o perché la fattura originale ha effettivamente un errore.

Passo 4: Export pulito

Tutte le 200 fatture sono ora in PostgreSQL. Esporta in Excel con un click. Carica nel gestionale. Fatto.

Tempo totale: 3 minuti invece di 8 ore.