Torna al blog
MatematicaData scienceIndustria

Inferenza bayesiana e modelli probabilistici nell'industria

MUSTNODE SRL12 min di lettura

Perche la probabilita conta in fabbrica

Nei contesti industriali i dati sono rumorosi, incompleti e spesso ambigui. Un sensore puo guastarsi, una misura puo essere alterata da interferenze, un processo puo comportarsi in modo diverso da quanto previsto. In questi scenari l'inferenza bayesiana offre un framework rigoroso per ragionare sotto incertezza: invece di fornire una risposta secca, restituisce una distribuzione di probabilita che esprime quanto siamo sicuri di una certa conclusione.

Il teorema di Bayes

Il punto di partenza e il teorema di Bayes, che lega la probabilita a posteriori di un'ipotesi HH dato un insieme di dati DD alle quantita note:

P(HD)=P(DH)P(H)P(D)P(H \mid D) = \frac{P(D \mid H)\, P(H)}{P(D)}

dove:

  • P(H)P(H) e la prior, la nostra conoscenza iniziale sull'ipotesi;
  • P(DH)P(D \mid H) e la likelihood, quanto i dati sono compatibili con l'ipotesi;
  • P(D)P(D) e l'evidenza, che funge da costante di normalizzazione;
  • P(HD)P(H \mid D) e la posterior, la conoscenza aggiornata dopo aver osservato i dati.

L'evidenza si calcola marginalizzando su tutte le ipotesi possibili:

P(D)=iP(DHi)P(Hi)P(D) = \sum_{i} P(D \mid H_i)\, P(H_i)

Un esempio: diagnosi di un guasto

Supponiamo che un macchinario abbia una probabilita a priori di guasto pari all'1 percento, quindi P(guasto)=0.01P(\text{guasto}) = 0.01. Un sistema di monitoraggio emette un allarme con queste caratteristiche:

  • se la macchina e guasta, l'allarme scatta nel 99 percento dei casi: P(Aguasto)=0.99P(A \mid \text{guasto}) = 0.99;
  • se la macchina e sana, l'allarme scatta comunque nel 5 percento dei casi (falsi positivi): P(Asana)=0.05P(A \mid \text{sana}) = 0.05.

Qual e la probabilita che la macchina sia davvero guasta, dato che e scattato l'allarme?

P(guastoA)=0.990.010.990.01+0.050.990.167P(\text{guasto} \mid A) = \frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.05 \cdot 0.99} \approx 0.167

Il risultato e sorprendente: nonostante un allarme molto sensibile, la probabilita reale di guasto e solo del 16.7 percento. Questo accade perche i guasti sono rari e i falsi positivi, applicati a una grande popolazione di macchine sane, generano molti allarmi non veritieri. E un esempio classico del perche l'intuizione, da sola, non basta.

Aggiornamento sequenziale

Il vero potere dell'approccio bayesiano emerge quando i dati arrivano nel tempo. La posterior di oggi diventa la prior di domani:

P(HD1,D2)P(D2H)P(HD1)P(H \mid D_1, D_2) \propto P(D_2 \mid H)\, P(H \mid D_1)

Questo permette di costruire sistemi che imparano in modo incrementale, raffinando le stime man mano che arrivano nuove misure dal campo, senza dover rielaborare l'intero storico.

def aggiorna(prior, likelihood_guasto, likelihood_sana):
    num = likelihood_guasto * prior
    den = num + likelihood_sana * (1 - prior)
    return num / den

# Allarme ripetuto su due letture indipendenti
p = 0.01
for _ in range(2):
    p = aggiorna(p, 0.99, 0.05)
    print(round(p, 4))
# 0.1667
# 0.7984

Dopo due allarmi consecutivi la probabilita di guasto sale a circa il 80 percento: l'evidenza si accumula e la nostra convinzione cambia di conseguenza.

Dall'inferenza ai modelli probabilistici

In produzione raramente abbiamo due sole ipotesi. Si usano quindi modelli piu ricchi:

  • filtri di Kalman per stimare lo stato di un sistema dinamico a partire da misure rumorose;
  • reti bayesiane per rappresentare dipendenze causali tra variabili di processo;
  • inferenza variazionale e MCMC per approssimare posterior complesse.

Conclusione

L'inferenza bayesiana non e solo teoria: e uno strumento operativo per costruire sistemi di monitoraggio che quantificano l'incertezza, riducono i falsi allarmi e migliorano nel tempo. In MUSTNODE integriamo questi modelli nelle nostre soluzioni di monitoraggio, trasformando dati grezzi di campo in decisioni affidabili.

Articoli correlati

Altri approfondimenti dalla categoria Dati & AI.