/ / Datastax Cassandra - Istanza Amazon EC2 - Cluster con tre nodi che attraversano la regione Amazon - amazon-ec2, cassandra, datastax

Datastax Cassandra - Istanza Amazon EC2 - Cluster con tre nodi spanning in tutta la regione Amazon - amazon-ec2, cassandra, datastax

Sto progettando di creare un cluster con tre nodi e ciascun nodo verrà lanciato in tre diverse zone Amazon EC2.

Come da documentazione Datastax, userò Ec2MultiRegionSnitch e la replica stragey è NetworkTopologyStrategy. Di seguito è necessario raggiungere i miei obiettivi

Dimensione del cluster: 3 (spanning in Amazon EC2 Region).

Fattore di replica: 3

Livello di lettura e scrittura: QUORUM.

Sulla base della configurazione di cui sopra, posso sopravvivere alla perdita di un singolo nodo (nel senso che in uno qualsiasi della regione amazon. Correggimi se sbaglio).

Per ottenere la configurazione di cui sopra, ho due opzioni

Opzione 1 : Utilizzando Datastax è stata fornita l'immagine AMI di Amazon EC2.

Questa opzione avvia l'istanza con quasi tutti i componenti necessari per eseguire cassandra con alcuni strumenti di monitoraggio (opscenter..etc)

Ma memorizza tutti i dati su EC2 Instance Store quindi i dati persistono solo durante la vita dell'istanza e la dimensione della memoria dipende dal tipo di istanza.

Opzione 2 : Utilizzo dell'installazione personalizzata

In questa opzione, devo avviare Amazon EC2 Ubuntu AMI, installare JAVA, installare Datastax community edition.

Questa opzione mi consente di archiviare tutti i miei dati su EBS. Quindi posso espandere EBS ogni volta che ne ho bisogno e allo stesso tempo posso ripristinare qualsiasi nodo usando l'istantanea EBS.

La mia domanda:

Quale delle opzioni è adatta alle mie esigenze?

Nota:

Ho letto la documentazione fornita da Datastax e la novità di Cassandra. Quindi, qualunque input tu abbia fornito mi sarà molto utile.

Grazie

risposte:

0 per risposta № 1

Non è vero che ottieni Datastax AMI solo con l'archiviazione effimera EC2. A partire dalla versione 2.5 sostengono che puoi scegliere anche EBS: Presentazione di AMI 2.5 Auto-Clustering DataStax. Questo è un modo relativamente semplice di iniziare che ho scelto personalmente.

Dovresti scegliere l'archiviazione effimera EBS o EC2?

La risposta è, dipende...

Il passato (~ 2012-2013):

Le istanze EC2 con memoria temporanea erano ascelta migliore. Nel corso degli anni ci sono stati benchmark dettagliati sulle prestazioni che indicavano che EBS stava migliorando, ma che comunque le unità fisiche collegate erano migliori.

Il passato (~ 2014):

La scelta di EC2 è ancora migliore. Datastax ha scritto un bel post su prezzi, rete e resilienza ai guasti: Qual è la storia con lo storage AWS?

Presente (~ 2016):

instaclustr afferma:

Eseguendo Cassandra su Amazon EBS, puoi correre più denso, più economico Cluster di Cassandra con la stessa disponibilità della memoria effimera le istanze.

Bella presentazione qui: AWS re: Invent 2015 | (BDT323) Amazon EBS e Cassandra: 1 milione di scritture al secondo su 60 nodi

Tutto sommato, ti consiglio di fare un'analisi del TCOe se non c'è una grande differenza di prezzo, scegli EBS - a causa della capacità immediata di creare uno snapshot. Inoltre, è probabile che EBS migliorerà nel tempo.