La roadmap di DataUnchain — dal v2.1 alla v3.0 e oltre. Ogni funzionalità nasce dal feedback reale delle aziende che usano il prodotto ogni giorno.
Ultimo aggiornamento: Marzo 2026 · Ciclo trimestrale · Priorità guidate dagli Early Adopter
DataUnchain non costruisce funzionalità in isolamento. Ogni trimestre raccogliamo i dati di utilizzo, i ticket di supporto e le richieste dei nostri Early Adopter per decidere cosa sviluppare. Se una funzionalità non risolve un problema reale di almeno due aziende pilota, non entra nella roadmap. Questo approccio ci permette di costruire un prodotto che funziona davvero — non un catalogo di feature inutili.
La nostra visione a lungo termine resta chiara: eliminare ogni forma di data entry manuale da documenti, ovunque, per qualsiasi formato e in qualsiasi lingua. Ogni release ci avvicina a questo obiettivo, un passo concreto alla volta. Qui sotto trovi il dettaglio di ciò che abbiamo già completato, di ciò su cui stiamo lavorando adesso e di ciò che arriverà nei prossimi 12 mesi.
Tutto ciò che DataUnchain fa oggi, in produzione, testato su documenti reali di aziende italiane. Nessun vapor-ware, nessuna promessa: solo funzionalità che girano adesso.
Il nostro VLM proprietario analizza i documenti come immagini, pagina per pagina. Nessun OCR tradizionale, nessun template, nessun layout fisso. Il modello "vede" il documento e ne comprende la struttura semantica — tabelle, intestazioni, note a piè di pagina, timbri e scritte a mano incluse. Supporto completo multi-pagina per fatture, DDT e contratti di qualsiasi lunghezza.
Non un benchmark su dataset sintetici. Abbiamo testato DataUnchain su 219 documenti reali — fatture cartacee scannerizzate, PDF digitali, XML FatturaPA, formati misti — provenienti da fornitori diversi, con layout diversi, qualità diverse. Il risultato: 95,5% di accuratezza end-to-end senza alcun intervento manuale. Ogni estrazione è verificata con validazione matematica automatica (imponibile + IVA = totale).
Ogni dato estratto deve finire da qualche parte. DataUnchain include 18 connettori pronti all'uso: CSV, Excel, JSON, XML FatturaPA, PostgreSQL, MySQL, REST API, webhook, FTP/SFTP e connettori specifici per i gestionali italiani più diffusi. L'architettura ad adapter permette di aggiungerne di nuovi in poche ore, senza toccare il core della pipeline.
I documenti arrivano da ovunque. DataUnchain li intercetta automaticamente da 5 canali: cartella locale/di rete con file watcher, API REST per integrazione programmatica, bot Telegram per invio da smartphone, email IMAP per PEC e caselle dedicate, e canale SDI/PEC per fatture elettroniche. Ogni canale converte il documento nel formato interno e lo inserisce nella pipeline senza intervento umano.
Non ci fidiamo ciecamente dell'AI. La dashboard operativa mostra ogni documento elaborato con il suo punteggio di confidenza. L'operatore può verificare, correggere e approvare ogni estrazione con un'interfaccia pulita e veloce. I documenti con confidenza sotto soglia vengono automaticamente segnalati per la revisione umana. Il tempo medio di revisione è sotto i 30 secondi per documento.
Ogni correzione umana diventa un dato di addestramento. Il sistema salva automaticamente le coppie documento-correzione in formato JSONL, pronte per il fine-tuning periodico del VLM. Più usi DataUnchain, più diventa preciso — senza bisogno di data scientist. È il ciclo virtuoso che rende il sistema progressivamente migliore nel tempo, specificamente per i tuoi fornitori e i tuoi formati.
Per le fatture elettroniche italiane, DataUnchain valida automaticamente l'output contro lo schema XSD ufficiale dell'Agenzia delle Entrate. Ogni campo viene controllato: formato partita IVA, codice destinatario, codici natura IVA, date e importi. Questo garantisce che i dati estratti siano non solo corretti, ma anche conformi alle specifiche normative italiane.
Non tutti i gestionali hanno API. Il nostro motore RPA vision-guided pilota direttamente le interfacce dei software legacy: apre finestre, compila campi, clicca pulsanti — tutto guidato dalla visione AI, senza bisogno di selettori CSS o XPath fragili. Funziona con qualsiasi software che abbia un'interfaccia grafica, inclusi i gestionali DOS-like ancora diffusi nelle PMI italiane.
Un singolo comando: docker compose up. L'intera infrastruttura — VLM, processor, PostgreSQL, dashboard, file watcher — si avvia in contenitori isolati. Aggiornamenti con docker compose pull. Nessuna dipendenza esterna, nessun conflitto, nessuna configurazione manuale del sistema operativo. Funziona su Linux, Windows con WSL e macOS.
Nessun dato esce dalla tua rete. Mai. Il VLM gira localmente sulla tua GPU, i dati restano nel tuo PostgreSQL, i documenti restano nel tuo filesystem. Non c'è nessun server remoto, nessuna telemetria, nessuna chiamata API esterna. Conformità GDPR nativa, senza bisogno di DPA con terze parti. Il tuo dato è tuo — punto.
Il trimestre in cui DataUnchain incontra le prime aziende reali. Onboarding assistito, fine-tuning su documenti veri e il primo connettore gestionale italiano dedicato.
Il programma Early Adopter entra nel vivo. Cinque aziende italiane selezionate riceveranno l'installazione completa di DataUnchain, con supporto diretto dal fondatore. Ogni azienda porterà i propri documenti reali, i propri gestionali e le proprie esigenze specifiche. Questo ci permetterà di validare la pipeline su scenari diversi e di raccogliere dati preziosi per migliorare il prodotto.
Ogni Early Adopter riceverà un percorso di onboarding personalizzato: installazione guidata, configurazione dei canali input specifici dell'azienda, mapping dei campi verso il gestionale esistente, e formazione dell'operatore sulla dashboard di revisione. Il goal è rendere ogni azienda completamente autonoma entro 5 giorni lavorativi dall'avvio.
Con le correzioni accumulate durante le prime settimane di utilizzo, eseguiremo il primo ciclo di fine-tuning del VLM sui documenti reali di ogni azienda pilota. L'obiettivo è portare l'accuratezza sopra il 98% per i fornitori ricorrenti di ciascuna azienda. Il modello impara i layout specifici, le peculiarità tipografiche e le convenzioni di ciascun fornitore.
Nuova interfaccia di revisione con confronto side-by-side documento/dati estratti, filtri avanzati per stato, confidenza e fornitore, e statistiche di performance per operatore. La dashboard diventerà il cockpit quotidiano dell'ufficio amministrativo, con notifiche in tempo reale per documenti che richiedono attenzione e report settimanali automatici.
Guida di installazione passo-passo, documentazione API con esempi, troubleshooting delle configurazioni comuni, video tutorial per ogni funzionalità e changelog dettagliato. L'obiettivo è che qualsiasi system administrator possa installare e configurare DataUnchain senza assistenza diretta, seguendo solo la documentazione online.
Il primo connettore dedicato per un gestionale italiano specifico. Danea EasyFatt è usato da decine di migliaia di PMI italiane. Il connettore importerà automaticamente i dati estratti nel formato nativo di EasyFatt, mappando ogni campo — dalla ragione sociale ai singoli articoli di riga, incluse aliquote IVA e condizioni di pagamento. Zero copia-incolla, zero errori di trascrizione.
Il trimestre della maturità tecnica. Auto-learning avanzato, elaborazione parallela, classificazione automatica dei documenti e supporto multi-lingua per le aziende che operano con l'estero.
Il sistema di apprendimento progressivo diventa completamente automatico. Quando il dataset JSONL di un fornitore raggiunge una soglia critica di correzioni, il fine-tuning parte da solo — senza intervento umano. Il modello viene aggiornato, testato automaticamente contro un validation set, e promosso in produzione solo se l'accuratezza migliora. È il circolo virtuoso dell'AI che si affina da sola.
Ogni fornitore ricorrente avrà il proprio profilo di estrazione ottimizzato. Il sistema riconosce automaticamente il fornitore dalla partita IVA o dal layout e applica il modello fine-tuned specifico. L'obiettivo è superare il 99% di accuratezza per i fornitori che inviano almeno 10 documenti al mese. I fornitori nuovi partono dal modello base e vengono progressivamente specializzati.
Per le aziende che elaborano centinaia o migliaia di documenti al giorno, il processing diventa parallelo. Più GPU lavorano in contemporanea, con un load balancer intelligente che distribuisce i documenti in base alla complessità stimata. L'obiettivo è elaborare 1.000 pagine all'ora su un setup con due GPU consumer-grade. Nessun cloud, nessun costo variabile.
DataUnchain non chiederà più all'utente che tipo di documento sta elaborando. Il VLM classificherà automaticamente ogni documento — fattura, nota di credito, DDT, ordine, contratto, ricevuta — e applicherà lo schema di estrazione corretto. Un unico canale input per tutti i tipi di documento, con smistamento intelligente e automatico.
Le aziende italiane che lavorano con l'estero ricevono documenti in inglese, tedesco, francese e spagnolo. Il VLM verrà esteso per supportare le principali lingue europee mantenendo la stessa accuratezza. Ogni lingua avrà il proprio set di validazioni specifiche — formati data, codici fiscali, formati di partita IVA — per garantire estrazioni corrette indipendentemente dall'origine del documento.
La nuova API v2 sarà completamente RESTful con autenticazione JWT, rate limiting configurabile, documentazione OpenAPI 3.1 interattiva e webhook bidirezionali. Ogni evento della pipeline — documento ricevuto, estrazione completata, revisione approvata, dato esportato — potrà triggherare webhook verso sistemi esterni. Perfetta per integrazioni con N8N, Make, Zapier o workflow custom.
La release che trasforma DataUnchain da strumento per PMI a piattaforma enterprise. Marketplace connettori, multi-tenant, analytics avanzati e certificazioni di sicurezza per i clienti più esigenti.
Un ecosistema aperto di connettori. Sviluppatori terzi — system integrator, software house, VAR — potranno creare e pubblicare connettori per qualsiasi gestionale o ERP. Ogni connettore sarà testato, documentato e installabile con un click dalla dashboard. L'architettura ad adapter che abbiamo costruito fin dal giorno uno rende tutto questo possibile senza modificare il core del prodotto.
Per gli studi commercialisti e i centri servizi che gestiscono documenti per conto di più clienti. Ogni tenant avrà il proprio spazio isolato con dati, modelli fine-tuned, connettori e utenti separati. L'amministratore dello studio potrà gestire tutti i clienti da un'unica dashboard centralizzata, con fatturazione e statistiche per singolo tenant.
Il VLM è eccellente, ma per documenti con qualità estremamente bassa — fax, fotocopie di fotocopie, scansioni a 72 DPI — un layer OCR tradizionale come fallback può fare la differenza. Il sistema rileverà automaticamente quando la confidenza del VLM è troppo bassa e attiverà un pipeline ibrida VLM + OCR, combinando i punti di forza di entrambi gli approcci per massimizzare l'accuratezza.
Supporto nativo per la verifica delle firme digitali P7M e PAdES. Ogni fattura elettronica firmata verrà verificata automaticamente contro le authority di certificazione italiane prima dell'elaborazione. Questo aggiunge un ulteriore livello di sicurezza e compliance, particolarmente importante per la pubblica amministrazione e per le aziende che gestiscono documenti legali.
Quanto ti sta facendo risparmiare DataUnchain? La nuova dashboard analytics calcolerà automaticamente il ROI: documenti elaborati, tempo risparmiato per documento, errori evitati, FTE equivalenti liberati, costo per documento. Report mensili esportabili in PDF per giustificare l'investimento con la direzione. Grafici di trend per monitorare il miglioramento nel tempo.
Per i clienti enterprise, la certificazione ISO 27001 sulla gestione della sicurezza delle informazioni è spesso un requisito non negoziabile. Avvieremo il percorso di certificazione con audit trail completo, crittografia at-rest e in-transit, gestione accessi RBAC, log di ogni operazione e documentazione delle procedure di sicurezza. L'obiettivo è ottenere la certificazione entro Q1 2027.
Oltre il prodotto attuale. Il 2027 porta DataUnchain verso nuovi mercati, nuovi modelli di business e nuovi verticali. Queste sono le direttrici strategiche su cui stiamo ragionando.
Per le aziende che preferiscono non gestire infrastruttura, offriremo un'opzione SaaS ibrida. Il VLM girerà nel nostro data center europeo (GDPR compliant), ma il cliente potrà scegliere di mantenere i dati estratti solo nel proprio database locale. Un modello flessibile che preserva la privacy dei dati sensibili pur offrendo la comodità del cloud per l'inferenza AI. L'opzione on-premise resterà sempre disponibile per chi la preferisce.
Dopo mesi di dati raccolti dagli Early Adopter, avremo abbastanza esempi per creare un modello VLM specificamente ottimizzato per i documenti italiani. Fatture, DDT, note di credito, F24, CU, visure camerali — ogni tipologia documentale italiana avrà il suo training dedicato. L'obiettivo è un modello che capisca il contesto normativo e fiscale italiano nativamente, non come traduzione dall'inglese.
Per la pubblica amministrazione e per le aziende che interagiscono con enti pubblici, supporto nativo per i bollettini PagoPA. Estrazione automatica dei dati di pagamento, riconciliazione con le fatture corrispondenti, e generazione automatica delle disposizioni di pagamento. Un verticale specifico per il settore pubblico italiano che nessun competitor internazionale può offrire.
DataUnchain diventa una piattaforma verticale. Per la sanità: referti, ricette, cartelle cliniche. Per il legal: contratti, atti notarili, visure. Per la PA: determine, delibere, mandati di pagamento. Ogni verticale avrà i propri schemi di estrazione, le proprie validazioni e i propri connettori verso i software di settore. La pipeline AI resta la stessa — cambiano i modelli e le regole di business.
Non possiamo raggiungere tutte le PMI italiane da soli. Costruiremo un programma partner per VAR (Value Added Reseller) e system integrator che potranno installare, configurare e rivendere DataUnchain ai propri clienti. Formazione certificata, margini competitivi, supporto di secondo livello e co-marketing. L'obiettivo è creare un ecosistema di partner che moltiplichi la nostra capacità di distribuzione capillarmente sul territorio italiano.
Oltre l'estrazione dati. La nostra ricerca si muove verso la comprensione semantica profonda dei documenti: identificare clausole contrattuali anomale, segnalare incongruenze tra documenti correlati (ordine vs fattura vs DDT), e suggerire azioni automatiche basate sul contenuto. Non solo "cosa dice il documento", ma "cosa significa per la tua azienda".
Questa roadmap non è scolpita nella pietra. È un documento vivo che evolve con il feedback delle aziende che usano DataUnchain ogni giorno. Gli Early Adopter hanno un potere concreto sulle priorità di sviluppo.
Ti candidi al programma, ricevi l'installazione gratuita di DataUnchain e inizi a elaborare i tuoi documenti reali. Zero costi per 6 mesi, supporto diretto dal fondatore.
Ogni mese facciamo una call di 30 minuti per capire cosa funziona e cosa no. Ogni richiesta viene tracciata, discussa e valutata. Il tuo caso d'uso reale guida le nostre decisioni.
Le funzionalità richieste da almeno due Early Adopter salgono automaticamente nella priorità della roadmap. Il tuo bisogno reale diventa la nostra prossima feature. Costruiamo per te, non per un mercato astratto.
Tutto il percorso in una vista verticale. Verde = completato, teal = in corso, grigio = pianificato.
Pipeline AI vision-native, 95,5% accuratezza, 18 connettori output, 5 canali input, dashboard human-in-the-loop, auto-learning JSONL, validazione FatturaPA XSD, Universal RPA Engine, Docker Compose, 100% on-premise.
5 aziende pilota, onboarding assistito, fine-tuning su documenti reali, dashboard migliorata con side-by-side, documentazione completa, connettore Danea EasyFatt.
Auto-learning avanzato, fine-tuning per fornitore (99%+), batch parallelo multi-GPU, classificazione automatica tipo documento, multi-lingua europeo, API v2 con webhook.
Marketplace connettori, architettura multi-tenant, OCR ibrido fallback, verifica firma digitale P7M/PAdES, dashboard analytics ROI, percorso certificazione ISO 27001.
SaaS ibrido opzionale, modello VLM fine-tuned italiano, PagoPA, verticali sanità/legal/PA, partnership VAR e system integrator, comprensione documentale profonda.
Tutto quello che potresti chiederti sul nostro percorso di sviluppo.
Gli Early Adopter non sono semplici utenti. Sono co-creatori del prodotto. Le loro esigenze reali diventano le nostre priorità di sviluppo. Se la tua azienda elabora documenti ogni giorno e vuole smettere di farlo a mano, questo è il momento giusto per salire a bordo.
Installazione gratuita · 6 mesi senza costi · Supporto diretto dal fondatore · Nessun vincolo