Azure Istanza gestita per il modello di responsabilità condivisa di Apache Cassandra

Introduzione

Questo documento definisce la divisione delle responsabilità tra Microsoft e i clienti quando si usa Azure Istanza gestita per Apache Cassandra (Cassandra MI).

L'obiettivo è fornire chiarezza su:

  • Limiti di proprietà operativa
  • Aspettative di prestazioni e disponibilità
  • Responsabilità di sicurezza e conformità

Importante

  • Non esiste alcun contratto di servizio per latenza. Le prestazioni dipendono dallo SKU selezionato e dalle caratteristiche del carico di lavoro.
  • Microsoft garantisce il tempo di attività del processo Cassandra, non le prestazioni a livello di API o la latenza delle query.
  • I problemi causati dalla saturazione delle risorse (CPU, disco, memoria, rete) devono essere esaminati e mitigati dal cliente. Microsoft fornisce metriche e log per supportare questa analisi.

responsabilità Microsoft

Microsoft opera e gestisce l'infrastruttura sottostante per Cassandra MI. Questa responsabilità include:

Infrastruttura e piattaforma

  • Provisioning di cluster, data center e nodi Cassandra
  • Gestione, applicazione di patch e aggiornamenti della sicurezza del sistema operativo
  • Gestione del ciclo di vita dell'infrastruttura hardware e host
  • Isolamento della rete tramite reti virtuali (VNet) Azure

Disponibilità e contratto di servizio

  • Disponibilità supportata dal contratto di servizio solo per i data center di produzione
  • Il contratto di servizio si applica a:
    • Sistema operativo
    • Processo Cassandra
    • Errori hardware
  • Il contratto di servizio non copre:
    • Esaurimento delle risorse (CPU, disco, memoria, rete)
    • Errori a livello di applicazione o a livello di query
  • Nessun contratto di servizio per:
    • Cluster o data center non di produzione o deallocati

Ridimensionamento e controllo delle versioni

  • Ridimensionamento dei nodi (aggiunta o rimozione di nodi) attivato tramite il portale di Azure o le API
  • Disponibilità delle nuove versioni di Cassandra dopo le versioni stabili del sistema operativo
  • Rimozione delle versioni deprecate dalle opzioni di provisioning

Sicurezza e crittografia

  • Crittografia dei dati inattivi e in transito
  • Gestione e rotazione dei certificati per TLS o SSL
  • Analisi e correzione continue delle vulnerabilità

Monitoraggio e supporto

  • Integrazione con Monitoraggio di Azure per log e metriche
  • Avvisi proattivi per interruzioni a livello di piattaforma
  • Analisi della causa principale (RCA) per gli incidenti della piattaforma che interessano l'ambiente di produzione

Backup e ripristino

  • Backup online automatizzati in base alle preferenze di pianificazione e conservazione
  • Ripristino del backup tramite una richiesta di supporto

Note

  • Le chiavi gestite dal cliente (CMK) sono supportate per i dati archiviati.
  • CMK non è attualmente supportato per i backup.

Responsabilità dell'utente

Si è responsabili di tutte le operazioni a livello di dati, schemi e applicazioni.

Progettazione di query e modellazione dei dati

  • Progettazione di chiavi di partizione e modelli di dati ottimali
  • Evitare partizioni ad accesso frequente e query inefficienti
  • Ottimizzazione delle query e ottimizzazione delle prestazioni

Schema e configurazione

  • Gestione di keyspace, fattori di replica e livelli di coerenza
  • Esecuzione di modifiche dello schema
  • Ottimizzazione della compattazione e delle strategie di garbage collection (GC)
  • Override delle configurazioni predefinite di Cassandra quando necessario

Prestazioni e monitoraggio

  • Monitoraggio:

    • Utilizzo della CPU
    • Utilizzo della memoria
    • Utilizzo del disco
    • Operazioni di I/O al secondo e velocità effettiva
  • Analisi della latenza tramite:

    • Monitoraggio di Azure
    • Prometheus
    • Metriche di Cassandra
  • Esecuzione di azioni correttive e preventive

Pianificazione della capacità

  • Pianificazione della crescita della capacità effettiva e dello storage
  • Aumento o riduzione dei data center in base alle esigenze

Note

Limitazione del ridimensionamento dell'archiviazione Non è possibile modificare direttamente le dimensioni del disco. Per modificare le dimensioni del disco, è necessario:

  • Creare un nuovo data center con le dimensioni del disco desiderate
  • Eseguire la migrazione dei carichi di lavoro

Aggiornamenti della versione

  • Avvio di aggiornamenti principali e secondari (ad esempio, Cassandra 3.x → 5.x)
  • Convalida della compatibilità delle applicazioni prima degli aggiornamenti

Note

Sei responsabile dei tempi di inattività dovuti a versioni obsolete o deprecate.

Strategia di backup

  • Definire le pianificazioni e i criteri di conservazione dei backup.
  • Implementazione della strategia di ripristino di emergenza

Networking

  • Configurazione:

    • Reti virtuali, subnet e gruppi di sicurezza di rete
    • Risoluzione DNS
    • Regole del firewall
  • Configurazione:

    • VPN / ExpressRoute (in caso di configurazione ibrida)

Sicurezza e accesso

  • Gestione di utenti e ruoli del database
  • Implementazione della crittografia a livello di applicazione (se necessario)
  • Garantire la conformità ai requisiti normativi

Operations

  • Gestione dei problemi a livello di applicazione:

    • Timeout delle query
    • Accumulo di lapide
    • Incoerenze dei dati
  • Uso di strumenti approvati (nessun accesso SSH/JMX)

  • Esaminare i log e agire sulle anomalie


Responsabilità condivise

Alcune aree richiedono la collaborazione tra Microsoft e il cliente:

Monitoraggio della sicurezza

  • Microsoft fornisce log e dati di telemetria
  • I clienti devono:
    • Avvisi di revisione
    • Indaga sulle anomalie
    • Eseguire azioni correttive

Note

Se viene usato mTLS (TLS reciproco):

  • Il ciclo di vita e il rinnovo dei certificati lato client sono responsabilità del cliente

Distribuzioni ibride

  • Microsoft gestisce i nodi ospitati Azure
  • I clienti gestiscono i nodi Cassandra locali
  • La connettività tra ambienti è una responsabilità condivisa

Compliance

  • Microsoft garantisce la conformità a livello di piattaforma
  • Di proprietà dei clienti:
    • Conformità a livello di applicazione
    • Criteri di governance dei dati

Linee guida per la configurazione

I clienti sono tenuti a seguire le configurazioni consigliate da Microsoft, tra cui:

  • Regole di rete in uscita necessarie
  • Procedure consigliate per la sicurezza e la rete

Matrice di responsabilità

Attività Microsoft Customer
Provisioning e gestione dell'infrastruttura
Applicazione di patch a OS & Cassandra
Backup (gestito dalla piattaforma)
Pianificazione dei backup a lungo termine
Progettazione e ottimizzazione del modello di dati
Aggiornamenti della versione
Configurazione di rete
Monitoraggio e revisione degli avvisi
Conformità e governance
Disponibilità (contratto di servizio della piattaforma)
Security

Alternativa: Azure Cosmos DB per l'API di NoSQL

Azure Cosmos DB (API NoSQL) è un'alternativa completamente gestita e nativa del cloud con vantaggi aggiuntivi:

Benefit Description
Disponibilità dell'SDK nativo SDK per Java, .NET, Python Node.js
Supporto di livello aziendale 24×7 Microsoft supporto con percorsi di escalation
Esperienza completamente gestita Applicazione automatica di patch, backup, conformità
Garantisce <Latenza di 10 ms, 99,999% di disponibilità, garanzie di coerenza, vedere Contratti di servizio di Azure
Sicurezza e conformità integrate Crittografia, identità, certificazioni di conformità globali
Distribuzione globale e scalabilità automatica Replica in più aree e scalabilità automatica