Come Funziona — DataUnchain

📂 Fase 1 — Ingestione Automatica

Rilascia i file. DataUnchain automatizza.

Il motore di ingestione usa librerie di automazione per monitorare caselle email o volumi montati in rete. class="text-white">Watchdog di Python per monitorare un volume montato (/app/ingest). Nel momento in cui appare un nuovo file — via condivisione di rete, scanner o copia manuale — l'elaborazione inizia automaticamente.

I PDF multipagina vengono divisi intelligentemente in immagini singole ad alta risoluzione. Ogni pagina viene messa in coda per l'analisi AI.

Formati supportati

PDF, JPG, PNG, TIFF — inclusi PDF multipagina

Metodo input

Condivisione rete, scanner, copia manuale o upload API

Watchdog · monitoraggio /app/ingest

✓ Nuovo file rilevato: fattura_2026_001.pdf

✓ PDF diviso: 3 pagine estratte

→ Invio pagina 1/3 a Qwen 3.5 VL...

✓ Pagina 1 elaborata (0.8s)

→ Invio pagina 2/3 a Qwen 3.5 VL...

✓ Pagina 2 elaborata (0.6s)

→ Invio pagina 3/3 a Qwen 3.5 VL...

✓ Pagina 3 elaborata (0.7s)

✓ Spostato in /app/processed/

Qwen 3.5 VL · analisi documento

👁️

Visione Nativa — nessun OCR

Lettura diretta del layout fattura

                    # Prompt di estrazione (configurabile):
                    "Estrai: numero_documento,
                     data_emissione, fornitore,
                     partita_iva, totale_lordo,
                     elenco_prodotti.
                     Rispondi solo in JSON."
                

👁️ Fase 2 — Visione AI

Il modello "vede" il documento

A differenza dell'OCR tradizionale, Qwen 3.5 VL è un Vision Language Model nativo. Non legge solo il testo — comprende layout spaziale, tabelle, scrittura a mano e persino scansioni ruotate o sfocate.

Controlli cosa viene estratto con un semplice prompt testuale nel file .env. Stesso codice, prompt diverso = settore diverso.

Multimodale: legge immagini nativamente (nessun layer OCR)

Finestra di contesto 1M token per documenti lunghi

Comprende tabelle, scrittura a mano, timbri

Esegue via Ollama — nessun internet necessario

✅ Fase 3 — Validazione Ad Alta Precisione

Fidati, ma verifica. Automaticamente.

Nessuna AI è perfetta al 100%. Per questo DataUnchain esegue tre livelli di validazione automatica prima di salvare qualsiasi risultato:

🧮 Check Matematico

Python verifica l'aritmetica: Imponibile + IVA = Totale. Se non torna, il record viene segnalato per revisione umana.

📊 Score di Confidenza

Qwen riporta la confidenza per campo. I campi sotto la soglia dell'85% vengono marcati con ⚠ per verifica manuale.

🔀 Double-Check (Opzionale)

Elabora lo stesso documento con due modelli diversi (es. Qwen 4B + Llama 3.2). Se i risultati divergono, segnala per revisione.

validation_engine.py

                    # Check Matematico — "Il Revisore"
                    def valida_dati(estratti):
                    imponibile = estratti['imponibile']
                    iva = estratti['iva']
                    totale = estratti['totale']

                    if abs((imponibile + iva) - totale) > 0.02:
                    estratti['stato'] = 'DA_VERIFICARE'
                    else:
                    estratti['stato'] = 'VALIDATO'

                    return estratti
                

📊 Fase 4 — Integrazione ERP

Dati caricati direttamente nel tuo Gestionale

I dati validati vengono scritti direttamente sul database del tuo gestionale, oppure innescano l'API per registrare l'ingresso merce e la contabilità in pochi millisecondi.

💾

PostgreSQL + JSONB

Ogni estrazione salvata con dati grezzi, dati validati, percorso file sorgente e timestamp.

📊

Export Excel

Export in .xlsx con un click — pronto per il commercialista, il magazziniere o l'ufficio legale.

🔗

Integrazione Legacy

Creazione di middleware per passaggi bidirezionali con SAP, Zucchetti, TeamSystem, Microsoft Dynamics e gestionali AS400.

Pronto per automatizzare?

Tre passi. Tre minuti. Zero data entry.

← Torna alla Home Richiedi una Demo Integrata

Come Funziona DataUnchain