Seconda puntata

Dati Bene Comune. Covid-19 e aree territoriali: i dati contano, se rac-contano bene

di Fulvio Ananasso, Presidente Stati Generali Innovazione, Socio onorario UNINFO e Consigliere CDTI - Domenico Natale, Presidente Commissione UNI CT 504 Ingegneria del software, Socio onorario UNINFO, Consigliere CDTI e Socio SGI |

Considerazioni sui cluster delle aree territoriali in Italia secondo i 21 indicatori del Ministero della Salute / Istituto Superiore di Sanità e l’”indice di morbosità” Covid-19.

Si propone un confronto tra le recenti aree gialle e arancioni individuate con l’utilizzo dei 21 indicatori dal Ministero della Salute (MS) / Istituto Superiore di Sanità (ISS) e l’indice sulla morbosità Covid-19, già introdotto nell’articolo di key4biz del 27 ottobre, adeguato con diverse soglie.

I dati disponibili – open data del Dipartimento della Protezione Civile (DPC) con il coinvolgimento del MS e ISS – consentono una visione armonizzata degli indicatori, convergendo verso una più attenta interpretazione dei fenomeni e degli interventi attuati.

DATI BENE COMUNE

Come sottolineato nel precedente articolo del 25 novembre scorso, il dato riveste fondamentale importanza per ogni processo gestionale, in particolare come strumento di valutazione, decisione, attuazione e gestione di procedure di monitoraggio dell’epidemia ed elemento cruciale per la trasformazione digitale della Sanità. Sulla base di dati di qualità si può pervenire ad una medicina “personalizzata” con cure e terapie decise con il supporto della data analytics, di allocazione dei territori a zone differenziate decise da algoritmi che processano i dati territoriali, di cui è essenziale la massima trasparenza.

Da qui la petizione #datiBeneComune del 12 novembre scorso sulla richiesta al Governo di dati aperti, aggiornati e facilmente utilizzabili sull’emergenza Covid-19, alla quale Stati Generali dell’Innovazione ha prontamente aderito quale metodo da adottare per il contrasto alla pandemia e un auspicabile Piano Nazionale di e-health. Processi organizzativi data-driven giocano un ruolo fondamentale per l’ottimizzazione dei protocolli sanitari ed evitare di dover agire in maniera emergenziale ed affannosa in ogni situazione di difficoltà operativa.

DATI E INFORMAZIONE

La Società civile ha bisogno di informazioni chiare e trasparenti sulle motivazioni delle decisioni delle Istituzioni competenti, per poter riporre fiducia nelle stesse econdividerne e rispettarne le disposizioni. In questa linea è di ausilio il poter disporre di dati pubblici, disaggregati, continuamente aggiornati, ben documentati e facilmente accessibili a tutti gli interessati relativamente a indicatori e algoritmi alla base delle decisioni.

Il piano di monitoraggio messo in atto dalle Istituzioni preposte, catalogando le Regioni e Province autonome in diversi colori attraverso 21 indicatori, pur rappresentando un sostanziale pregio tecnico-scientifico, può presentare ai più qualche difficoltà illustrativa, rappresentando un concetto complesso principalmente riferito alla pressione di rischio sulle strutture sanitarie.

D’altronde è raro che, in alternativa, un solo indicatore possa riassumere l’andamento di fenomeni così complessi, pervenendo ad un risultato frutto di diverse componenti, alcune eventualmente anche in controtendenza tra loro.

INDICE DI MORBOSITA’

Tuttavia, similmente al PIL per l’economia, si ritiene che l’indice di morbosità (“rapporto percentuale tra numero dei casi di una determinata malattia e popolazione in cui si è verificata”) possa costituire un indicatore importante per fotografare aspetti della salute nel contesto reale.

L’indice di morbosità rappresenta la probabilità che una persona, facendo un percorso casuale tra gli abitanti di un luogo (e tra ambienti di prossimità come famiglie, comunità, ospedali, ecc.), possa entrare in contatto con una persona infetta e venirne contagiata.

Ovviamente tale indicatore, che si sta manifestando con tendenze abbastanza stabili nel tempo, andrà perfezionato in futuro tenendo presente che:

  • i tamponi effettuati sono di diverso tipo e non se ne conosce sempre la proporzione di applicazione influenzando il calcolo del numero degli attuali positivi;
  • andrà migliorato il conteggio degli asintomatici positivi;
  • non si conosce sistematicamente a livello regionale, in una prospettiva standardizzata, il rapporto dei casi positivi sui tamponi per Regione (finora variabile tra il 5% e il 15%) con trend decrescente.

Pur rilevandosi tali limiti, variabili da territorio a territorio, tra città e campagna o montagna, nelle varie stagioni e nelle diverse situazioni contestuali, l’indice di morbosità può essere considerato un indicatore sintetico “conclusivo” degli effetti cumulati di tutti gli interventi di contenimento epidemico.

Il presente articolo intende mostrare la connessione tra i risultati ottenuti attraverso i 21 indicatori e i valori dell’indice di morbosità del Covid-19 sulla popolazione. Il confronto consente di evidenziare in modo strutturato i casi in cui i 21 indicatori pervengono alla stessa conclusione di gravità o meno dell’indice di morbosità ed i casi in cui invece i 21 indicatori, che devono accompagnare l’indice suddetto, evidenziano diversi rischi di emergenza o addirittura impossibilità di cura nelle strutture disponibili.

Le due componenti principali (epidemia effettiva e rischi relativi a possibilità di cura delle strutture) possono a volte presentarsi in contrapposizione. Tali casi, analizzati approfonditamente, potranno far comprendere molti fattori utili non solo ad individuare attuali cause ed effetti, ma anche per futuri interventi di ottimizzazione di cura e pianificazione dell’offerta del Sistema Sanitario sul territorio.

Nelle analisi statistiche riportate si cerca di descrivere i livelli di malattia territoriale, cioè la morbosità della popolazione, collegandoli alle zone determinate con i 21 indicatori riguardanti gli aspetti organizzativo-sanitari sulla disponibilità di strutture e fattori di rischio.

METODOLOGIA ATTUALE

In una strategia orientata a facilitare la comprensibilità dei dati, ed in vista della redazione di un glossario apposito (nazionale e internazionale), occorre chiarire meglio alcuni concetti, come ad esempio:

  • la morbosità che è un dato di oggi, ad una certa data — valore istantaneo-giornaliero, pari agli attuali positivi (totale casi registrati positivi meno i dimessi-guariti e i deceduti) rapportati alla popolazione di riferimento;
  • il parametro RT, legato ad una situazione contingente, che esprime la contagiosità di una persona ed è un anticipatore del fenomeno di morbosità di domani, a seconda dell’efficacia delle misure di contrasto;
  • il numero dei casi positivi sui tamponi effettuati, variabili nel tempo e che potranno essere normalizzati per zona, raccogliendo le singole serie storiche (attualmente pari a circa il 10% a livello nazionale);
  • il numero dei decessi che pur appartenendo alla gravità di oggi, per le complicanze o le cure intervenute, sono correlati ai casi positivi di qualche tempo prima;
  • il numero dei guariti, seguiti con attenzione, che danno informazioni sulle efficaci cure domiciliari e ospedaliere.

Il piano attuale risulta sofisticato, e probabilmente unico a livello mondiale, a causa delle specifiche caratteristiche territoriali del nostro Paese, che hanno spinto gli studiosi al mantenimento dell’abitudine di storiche osservazioni delle differenze geo-politiche a partire dalla tradizionale  distinzione statistica del Nord, Centro, Sud e Isole.

Fin dal 1975 in Italia sono stati in voga metodi di calcolo dello sviluppo socio-economico e sanitario delle regioni, basati non solo sul PIL ma su più indicatori analizzati e aggregati da analisi tassonomiche e di cluster.

E’ il caso ad esempio evidenziato da Domenico Natale in alcuni suoi studi (cfr. sezione Smart Land la lettera a: sviluppo socio economico delle Regioni e sanitario), basato su 22 indicatori che, determinando una teorica “Regione ideale”, aggregava con il metodo tassonomico di Wroclaw le Regioni in gruppi omogenei.

DIFFERENZE TERRITORIALI

Nella prima ondata epidemica di marzo-maggio si era distinta l’Italia del Sud, con maggiore salvaguardia rispetto al Nord, penalizzato da alta morbosità (cfr. l’andamento della prima ondata di epidemia, lettera b: correlazione tra sviluppo territoriale e epidemia Covid-19). Appariva un Sud più isolato nei mesi invernali, e quindi più salvo dai contagi, che ora invece è meno distante dal Nord in quanto questa distinzione si è persa, essendosi verificata una seconda ondata epidemica più diffusa ovunque.

Molti studi sono stati condotti sulle differenze delle Regioni dagli anni ottanta in poi, comprendendo indicatori sanitari, ma mai era stato necessario finalizzare la quantificazione delle differenze territoriali con lo scopo di un più urgente controllo epidemico. Questa novità sta mettendo in primo piano il fattore salute, ponendo quasi in secondo piano l’aspetto economico del PIL e altri aspetti come quelli del monitoraggio ambientale. Una nuova visione della gestione dei dati statistici potrà realisticamente far porre maggiore attenzione in futuro su tutti e tre i fenomeni correlati tra loro: economia, salute, ambiente.

VISIONE TELESCOPICA

E’ auspicabile sviluppare in Italia, per il controllo epidemico, una visione statistica, si potrebbe dire “telescopica”, dal generale al particolare, con dati a livello regionale generati dalla somma dei livelli provinciali, a loro volta desunti da dati comunali.

Si auspica un processo dal basso verso l’alto che fornisca ulteriore granularità delle informazioni, sempre nel rispetto del cosiddetto “segreto statistico” nei casi di evidenza di casi singoli. Ciò richiederebbe, oltre alla standardizzazione dei dati, già avviata da apposite task force e da alcune Regioni e Province autonome, di automatismi di raccolta che non aggravino il personale addetto con ulteriori adempimenti burocratici, ma che si servano di avanzate piattaforme informatiche.

E’ importante, prima di scendere di livello dalle aree territoriali più grandi fino a quelle più piccole, aumentare la possibilità di confronto dei dati, al fine di comprendere gli elementi distintivi caratterizzanti il territorio e far emergere eventuali anomalie dei dati. Ciò varrebbe anche per salire di livello e spingere il confronto nazionale con gli altri Paesi europei.

Una piattaforma innovativa di raccolta di dati, dai livelli comunali ai livelli superiori provinciali e regionali, potrebbe portare a dati affidabili di alta qualità e più tempestivi.

OPEN DATA

Alcuni portali regionali iniziano a produrre dati sul Covid-19, ma è lecito aspettarsi una programmazione sistematica e standardizzata anche a livello provinciale e comunale, con una certa omogeneità e seguendo le impostazioni anche terminologiche, dei portali open data del DPC, MS e ISS.

Si potrebbe in futuro disporre di portali “linked open data”, non solo per la raccolta e supervisione di dati sanitari, ma anche per lo studio di molteplici fenomeni collaterali, come le modalità di trasporto pendolare, affluenza ai centri commerciali, partecipazioni ad eventi sportivi, movimenti interregionali, ecc.

La necessità di quantificare le vicinanze interpersonali e le individuazioni dei fenomeni di prossemica sociale potrebbe far pensare alla possibilità d’uso di un ulteriore tipo di app.

COMPORTAMENTI CHE CAMBIANO

Questa dovrebbe essere basata su individuazioni di aggregazioni localizzate e temporanee, periodicamente ricorrenti, di gruppi potenzialmente a rischio – ad es. raggruppamenti degli studenti all’esterno delle scuole, trasporti pubblici nei casi in cui non è possibile ottimizzare agevolmente come gli scuolabus, trasporti del pendolarismo, organizzazioni degli uffici, code di attesa in locali pubblici o privati, ecc.

Se i comportamenti delle famiglie e dei singoli individui sembrano ben orientati dalle ormai usuali raccomandazioni delle Autorità, occorrerebbero maggiori orientamenti per tutte le occasioni di assembramento critico anche da parte delle imprese, pubbliche e private.

D’altronde, non si può ignorare come la presente situazione potrà determinare in futuro cambi sociologici di comportamento, urbano e rurale, nella prospettiva di migliori pianificazioni delle Smart City, senza trascurare gli effetti nell’ambito delle Smart Land o Smart Region.

C’è ormai condivisione sull’esigenza che i dati dovrebbero essere oggettivi e di elevata qualità, come già trattato nei precedenti articoli degli autori. Come definito dal modello di qualità dei dati UNI CEI ISO / IEC 25012, si ricorda che i dati sono di qualità, nei vari contesti, se: accurati (cioè aderenti alla realtà), attuali, coerenti, completi, credibili, accessibili, comprensibili, conformi a leggi e regolamenti, efficienti, precisi, riservati in certi casi, tracciabili, disponibili alle persone autorizzate per un periodo di tempo specificato, portabili e ripristinabili. I vari processi di coordinamento dei dati (data management) dovrebbero avere l’obiettivo di garantire tutti gli aspetti connessi alla raccolta dei dati e alla loro gestione e organizzazione.

UN ESEMPIO DI APPLICAZIONE DELLA METODOLOGIA TELESCOPICA

Come esempio di analisi dei dati auspicabilmente utile ad una migliore descrizione dei fenomeni, si riporta nella Tabella 1 un confronto a livello regionale e inter-regionale tra l’assegnazione del “colore” arancione e giallo alle aree territoriali secondo i 21 indicatori MS / ISS e la situazione evidenziata dall’indice di morbosità, secondo le soglie individuate. L’esempio potrà essere replicato non solo a livello nazionale (con righe costituite da Regioni e Province autonome), ma anche a livello degli oltre 100 Province e 7.900 Comuni, anche in funzione delle disponibilità di open data al riguardo.

La Tabella 1 fornisce i valori dell’indice di morbosità relativi al 9 dicembre scorso,per aree territoriali ordinate in ordine crescente dell’indice, con indicazione delle zone gialle e arancioni dove si collocano le aree stesse sulla base dei 21 indicatori sanitari – non ci sono più zone rosse.

Tabella 1. Morbosità e zone di rischio al 9 dicembre

* I valori con asterisco presentano una probabilità di sottostima in quanto, in rapporto alla popolazione, risultano con bassa percentuale sia di persone testate che di tamponi effettuati, rispetto alla media nazionale.

Le aree di morbosità sono suddivise in tre gruppi determinati con una ripartizione definita dal metodo statistico dei “terzili”. In statistica si intende per terzile di una serie ordinata di dati, ciascuna delle tre parti uguali in cui la serie può essere divisa per 1°, 2°, 3° terzile oppure per terzile basso, medio, alto. Essendo le aree 21, i tre gruppi sono costituiti da 7 aree ciascuno.

Si può notare una parziale coincidenza di valutazione tra le aree territoriali (Regioni e Province autonome) individuate dai 21 indicatori e i valori dell’indice di morbosità. I casi difformi sono motivati da specifiche motivazioni sanitarie strutturali, non oggetto della presente analisi.

I valori dell’ indice di morbosità sono distinte per classi, le cui soglie sono determinate dal metodo dei terzili:

  • Grigio: morbosità bassa, tra 46 e 78 attuali positivi su 10.000 abitanti;
  • Celeste: morbosità media, tra 84 e 123 attuali positivi su 10.000 abitanti;
  • Blu: morbosità alta, tra 125 e 205 attuali positivi su 10.000 abitanti.

Si può notare che per le aree del primo gruppo, con bassi livelli di morbosità, 4 aree territoriali sono in zona gialla, come è lecito attendersi, mentre 3 (Calabria, Toscana, Sicilia) sono state “penalizzate” in zona arancione per motivazioni di maggiore rischio sanitario.

Per le aree del secondo gruppo, con livelli di morbosità al centro della distribuzione, 5 aree risultano in zona gialla e 2 in zona arancione.

Per le aree del terzo gruppo con livelli di morbosità più alti, 3 risultano in zona gialla, valutate con meni rischi sanitari pur avendo elevati valori di morbosità (Emilia Romagna, Lazio, Veneto) e 4 in zona arancione.

Le motivazioni territoriali dei posizionamenti o ri-posizionamenti possono fornire utili indicazioni per un riesame delle potenzialità dell’offerta sanitaria rispetto alle esigenze della popolazione, denotando situazioni di relativo vantaggio / svantaggio territoriale, non escludendo eventuali necessità di ottimizzazione della corretta e standardizzata rilevazione dei dati.

I valori dell’indice di morbosità sono anche riportati nella Tabella 2, disposti per serie storica dal 6 novembre all’9 dicembre.

Si nota come alcuni valori in determinate aree presentano una maggiore stabilità, altre aree denotano una graduale recente diminuzione dei valori, altre ancora presentano un leggero recente aumento, probabilmente connesso con RT elevati.

Tabella 2. Aree e indici di morbosità (attuali positivi su 10.000 abitanti)

La morbosità nazionale complessiva denota un picco avvenuto il 24 novembre, per poi scendere pur in un momento di un abbastanza stabile incremento giornaliero dei tamponi (espressi in milioni). La serie storica dei tamponi lascia un probabile spazio di attendibilità del numero degli attuali positivi a livello nazionale, ma non sempre a livello delle regioni. In genere un calo repentino degli attuali positivi in una singola regione, va investigato se dovuto ad un calo effettivo dei positivi o del numero dei tamponi o a ritardi di comunicazione degli stessi.

CONCLUSIONI

Quanto illustrato nella Tabella 1 è un esempio esplicativo della connessione di valori tra l’indice di morbosità del Covid-19 e il posizionamento delle relative aree nelle zone suggerite dai 21 indicatori MS / ISS.

L’analisi delle cause degli adattamenti potrà fornire elementi utili per future pianificazioni che possano equilibrare domanda e offerta delle strutture sanitarie rispetto alle esigenze della  popolazione.

La Tabella 2 è un esempio di approfondimento “telescopico” dei dati di morbosità dal livello nazionale a quello regionale e delle Province autonome. Analisi disaggregate risulteranno utili per distinguere le problematiche delle grandi città da quelle generali delle regioni.

Un alto valore aggiunto per la comprensione dei fenomeni si avrebbe con analoghi prospetti a livello anche provinciale, comunale o realtà locali. I casi eventualmente risultanti potrebbero essere di ulteriore stimolo al dialogo e approfondimento delle cause ed effetti di disomogeneità o criticità. Come sottolineato nel precedente articolo del 25 novembre scorso, come Stati Generali dell’Innovazione stiamo preparando un piano di azione sulla qualità, armonizzazione e trasparenza dei datialla base dei processi decisionali, e proposte di piattaforme tecnologiche per un Piano Nazionale strutturato di e-health “data driven” in linea con gli obiettivi della petizione #datiBeneComune.

Un prossimo contributo potrà aggiornare il confronto dell’andamento tra le classificazioni delle Regioni e Province autonome secondo i 21 indicatori e l’indice di morbosità. Se gli open data lo consentiranno, si valuterà un caso provinciale e comunale, a livello più analitico “con ottica telescopica”, provando ad esplorare una modalità di maggiore standardizzazione della raccolta e visualizzazione dei dati. Si illustrerà infine un possibile concept di piattaforma tecnologica per il progetto “POST-SaF (Processi Organizzativi e Soluzioni Tecnologiche da adottare per la Sanità del Futuro).

A partire dalla nostra adesione alla petizione #datiBeneComune, intenderemmo pertanto fornire ai decisori istituzionali ulteriori contributi per una possibile metodologia che possa facilitare  standardizzazione, centralizzazione, territorialità, trasparenza e accesso ai dati sulla salute dei cittadini. La condivisione dei dati tra i vari attori designati, potrà consentire di disporre di dati disaggregati e analizzabili a parità di condizioni, onde rendere più agevole tracciare andamenti e motivazioni dei risultati degli “algoritmi” alla base delle disposizioni di contrasto alla pandemia Covid-19.

Leggi la Prima puntata:
Dati bene comune. Qualità, indicatori territoriali e Sanità digitale del futuro

Leggi le altre notizie sull’home page di Key4biz