Perché DataUnchain Soluzioni Costi Tecnologia Blog GitHub ↗
Italiano English
🏗️ Architettura Applicativa

Come Funziona DataUnchain

Quattro fasi coordinate — Ingestione, Estrazione AI, Validazione Scientifica ed Integrazione — per inviare dati perfetti al tuo ERP.

Ingestione
Visione AI
Validazione
Integrazione ERP
📂 Fase 1 — Ingestione Automatica

Rilascia i file. DataUnchain automatizza.

Il motore di ingestione usa librerie di automazione per monitorare caselle email o volumi montati in rete. class="text-white">Watchdog di Python per monitorare un volume montato (/app/ingest). Nel momento in cui appare un nuovo file — via condivisione di rete, scanner o copia manuale — l'elaborazione inizia automaticamente.

I PDF multipagina vengono divisi intelligentemente in immagini singole ad alta risoluzione. Ogni pagina viene messa in coda per l'analisi AI.

Formati supportati

PDF, JPG, PNG, TIFF — inclusi PDF multipagina

Metodo input

Condivisione rete, scanner, copia manuale o upload API

Watchdog · monitoraggio /app/ingest
✓ Nuovo file rilevato: fattura_2026_001.pdf
✓ PDF diviso: 3 pagine estratte
→ Invio pagina 1/3 a Qwen 3.5 VL...
✓ Pagina 1 elaborata (0.8s)
→ Invio pagina 2/3 a Qwen 3.5 VL...
✓ Pagina 2 elaborata (0.6s)
→ Invio pagina 3/3 a Qwen 3.5 VL...
✓ Pagina 3 elaborata (0.7s)
✓ Spostato in /app/processed/
Qwen 3.5 VL · analisi documento
👁️
Visione Nativa — nessun OCR
Lettura diretta del layout fattura
# Prompt di estrazione (configurabile): "Estrai: numero_documento, data_emissione, fornitore, partita_iva, totale_lordo, elenco_prodotti. Rispondi solo in JSON."
👁️ Fase 2 — Visione AI

Il modello "vede" il documento

A differenza dell'OCR tradizionale, Qwen 3.5 VL è un Vision Language Model nativo. Non legge solo il testo — comprende layout spaziale, tabelle, scrittura a mano e persino scansioni ruotate o sfocate.

Controlli cosa viene estratto con un semplice prompt testuale nel file .env. Stesso codice, prompt diverso = settore diverso.

Multimodale: legge immagini nativamente (nessun layer OCR)
Finestra di contesto 1M token per documenti lunghi
Comprende tabelle, scrittura a mano, timbri
Esegue via Ollama — nessun internet necessario
Fase 3 — Validazione Ad Alta Precisione

Fidati, ma verifica. Automaticamente.

Nessuna AI è perfetta al 100%. Per questo DataUnchain esegue tre livelli di validazione automatica prima di salvare qualsiasi risultato:

🧮 Check Matematico

Python verifica l'aritmetica: Imponibile + IVA = Totale. Se non torna, il record viene segnalato per revisione umana.

📊 Score di Confidenza

Qwen riporta la confidenza per campo. I campi sotto la soglia dell'85% vengono marcati con ⚠ per verifica manuale.

🔀 Double-Check (Opzionale)

Elabora lo stesso documento con due modelli diversi (es. Qwen 4B + Llama 3.2). Se i risultati divergono, segnala per revisione.

validation_engine.py
# Check Matematico — "Il Revisore" def valida_dati(estratti): imponibile = estratti['imponibile'] iva = estratti['iva'] totale = estratti['totale'] if abs((imponibile + iva) - totale) > 0.02: estratti['stato'] = 'DA_VERIFICARE' else: estratti['stato'] = 'VALIDATO' return estratti
📊 Fase 4 — Integrazione ERP

Dati caricati direttamente nel tuo Gestionale

I dati validati vengono scritti direttamente sul database del tuo gestionale, oppure innescano l'API per registrare l'ingresso merce e la contabilità in pochi millisecondi.

💾

PostgreSQL + JSONB

Ogni estrazione salvata con dati grezzi, dati validati, percorso file sorgente e timestamp.

📊

Export Excel

Export in .xlsx con un click — pronto per il commercialista, il magazziniere o l'ufficio legale.

🔗

Integrazione Legacy

Creazione di middleware per passaggi bidirezionali con SAP, Zucchetti, TeamSystem, Microsoft Dynamics e gestionali AS400.

Pronto per automatizzare?

Tre passi. Tre minuti. Zero data entry.

← Torna alla Home Richiedi una Demo Integrata