Come Costruire un Workflow di Automazione Documenti con AI
Un workflow di automazione documenti non è solo "l'AI legge il PDF". È un processo end-to-end che va dall'acquisizione del documento alla scrittura dei dati nel sistema finale, con validazione, gestione degli errori e revisione umana per i casi dubbi.
Le 8 fasi del workflow
Fase 1: RICEZIONE
→ Email / Bot / API / Scanner
Fase 2: ACQUISIZIONE
→ Salvataggio, hash SHA256, deduplicazione
Fase 3: PREPROCESSING
→ PDF→immagini, normalizzazione
Fase 4: CLASSIFICAZIONE
→ Tipo documento: fattura / DDT / ordine / ...
Fase 5: ESTRAZIONE
→ Vision AI → JSON strutturato
Fase 6: VALIDAZIONE
→ Math check + formato + confidence score
Fase 7: ROUTING
→ VALIDATED: dispatch automatico
→ NEEDS_REVIEW: coda operatore
→ ERROR: notifica
Fase 8: DISPATCH
→ ERP / CRM / Gestionale / Webhook
Esempio reale 1: Ciclo passivo fatture
Il workflow più comune nelle aziende italiane. Ogni mese arrivano centinaia di fatture da fornitori diversi. Ecco il workflow completo:
Fornitore invia email con PDF allegato
↓
Email monitor rileva il nuovo messaggio
↓
PDF estratto dall'allegato e salvato in /data/incoming/
↓
Hash SHA256 calcolato → controllo duplicati
└── Duplicato? → Scartato + log
└── Nuovo? → Continua
↓
PDF convertito in immagini PNG (200 DPI)
↓
VLM classifica: "fattura_acquisto"
↓
VLM estrae: fornitore, P.IVA, numero, data,
scadenza, imponibile, IVA, totale, righe
↓
Validazione:
├── Math check: imponibile + IVA = totale? ✅/❌
├── P.IVA valida? ✅/❌
└── Confidence score: 0-100
↓
Score ≥ 85 + math OK?
├── SÌ → dispatch automatico:
│ Zucchetti (registrazione contabile)
│ + Email conferma al responsabile
│ + CSV log mensile
└── NO → coda revisione:
Dashboard operatore con highlights
dei campi problematici
Tempo medio per fattura: 8-15 secondi (vs 8 minuti manuale). Tasso di automazione completa: 88-92%. Le restanti 8-12% richiedono revisione rapida (<2 minuti).
Esempio reale 2: Gestione DDT logistica
Una società di distribuzione riceve 500 DDT/mese dai fornitori. I dati del DDT devono entrare nel WMS (Warehouse Management System) entro l'arrivo della merce.
Corriere consegna merce + DDT cartaceo
↓
Operatore magazzino fotografa DDT con app
↓
Foto inviata via bot Telegram
↓
Immagine ricevuta e preprocessata
↓
VLM classifica: "ddt"
↓
VLM estrae: mittente, destinatario, numero DDT,
data, righe articoli (codice, descrizione,
quantità, peso, unità misura)
↓
Validazione: somma pesi ≈ peso totale indicato
↓
Dispatch automatico:
→ WMS: crea entrata merce con tutte le righe
→ Odoo: registra movimento stock
→ Email: avviso ufficio acquisti
↓
Operatore conferma ricevimento nel WMS
Vantaggio chiave: L'operatore di magazzino usa solo il telefono. Nessun PC, nessun inserimento manuale. I dati del DDT sono nel WMS in <30 secondi dall'invio della foto.
Esempio reale 3: Gestione contratti
Uno studio legale o un ufficio acquisti riceve contratti da firmare. I dati chiave devono essere nel CRM per il monitoring delle scadenze.
Contratto firmato ricevuto via email (PDF)
↓
Email monitor acquisisce il PDF
↓
VLM classifica: "contratto"
↓
VLM estrae:
- Parti contraenti (nome, P.IVA, indirizzo)
- Data inizio, data fine, tacito rinnovo
- Valore contrattuale (annuo/totale)
- Oggetto del contratto
- Clausole di recesso (termine, preavviso)
- Penali (se presenti)
↓
Confidence score:
Alto (≥ 85): dispatch automatico
Medio (60-84): revisione rapida avvocato/ufficio
Basso (< 60): revisione completa
↓
Dispatch automatico (solo se confidence alto):
→ Salesforce: nuovo record Opportunity/Contract
→ Notion: database contratti con campi strutturati
→ Email: avviso responsabile con summary estratto
→ Calendar: reminder 60 giorni prima della scadenza
Come gestire la revisione umana
La revisione umana non deve essere un collo di bottiglia. Con il workflow giusto, rivedere un documento dubbio richiede meno di 2 minuti:
- Dashboard di revisione: Lista dei documenti in NEEDS_REVIEW, ordinata per priorità (data ricevimento, importo). Per ogni documento: anteprima PDF a sinistra, campi estratti a destra. I campi problematici sono evidenziati in rosso.
- Correzione rapida: L'operatore corregge solo i campi evidenziati. Non deve reinserire tutto. Click su "Approva" e il documento viene inviato in dispatch. Click su "Scarta" con nota per il caso irrecuperabile.
- Feedback loop: Ogni correzione viene salvata nel feedback store. Periodicamente, queste correzioni vengono usate per fine-tuning del modello, riducendo il tasso di revisione nel tempo.
- SLA: Definire un tempo massimo di revisione per tipo documento. Es: fatture <4 ore lavorative, contratti <24 ore. Alert automatico al responsabile se la coda supera il threshold.
5 errori comuni nella progettazione del workflow
- 1. Nessuna deduplicazione: Un fornitore invia la stessa fattura via email E via PEC. Senza controllo hash SHA256, viene elaborata due volte e registrata due volte nel gestionale.
- 2. Dispatch sincrono senza retry: Se il gestionale è offline durante il dispatch, il documento si perde. Serve una dead-letter queue con retry automatico.
- 3. Soglia di confidence troppo bassa: Abbassare il threshold per ridurre la revisione manuale aumenta gli errori nel gestionale. Il 90% di automazione con 5% di errori è peggio dell'85% di automazione con 0.5% di errori.
- 4. Nessun alert sulla coda di revisione: I documenti rimangono bloccati in NEEDS_REVIEW per giorni perché nessuno sa che sono lì. Serve un alert email giornaliero alla persona responsabile.
- 5. Test solo su PDF perfetti: Il workflow funziona in test ma si rompe in produzione perché i documenti reali sono scansioni di bassa qualità, foto storte, PDF con password. Testare sempre con documenti reali raccolti dagli utenti finali.
DataUnchain implementa tutti e 3 i workflow descritti, configurabili dalla dashboard senza codice.
Scopri DataUnchain →