Cos’è il Cloud File Directory?
Il Cloud File Directory è un metodo di archiviazione di file nel cloud che permette a server e applicazioni di accedere ai dati tramite file system condivisi. Questa caratteristica di compatibilità rende questo servizio ideale per i carichi di lavoro che fanno affidamento su file system condivisi. Fornisce integrazione semplificata per non dover modificare il codice.
Cos’è un file system nel cloud?
Un file system nel cloud è un sistema di storage gerarchico che fornisce accesso condiviso ai dati. Gli utenti possono creare, eliminare, modificare, leggere e scrivere file e organizzarli logicamente in strutture a directory per semplificarne l’accesso.
Cos’è la condivisione di file nel cloud?
La condivisione di file nel cloud si definisce come un servizio che fornisce accesso simultaneo a più utenti a un set di file comune nel cloud. In questo caso, la sicurezza viene gestita assegnando le autorizzazioni a utenti e gruppi. Permettendo agli amministratori di controllare in modo preciso chi può accedere ai file condivisi.
Vantaggi del Cloud File Directory
Memorizzare i file nel cloud offre vantaggi su tre livelli:
1. Scalabilità: sebbene non tutte le soluzioni di storage di file nel cloud siano scalabili, le soluzioni più avanzate permettono di sfruttare tutte le possibilità del cloud. Consentendo la scelta di configurazioni iniziali di capacità e prestazioni che possono essere potenziate in base alla crescita aziendale. Non è più necessario acquisire risorse in eccesso in previsione di esigenze future.
2. Interoperabilità: molte applicazioni esistenti richiedono l’integrazione con servizi di condivisione di file che seguano semantica file system esistente. Le soluzioni di storage di file nel cloud offrono il vantaggio di non dover compilare nuovo codice per ottenere accesso sicuro e condiviso.
3. Budget e risorse: per l’uso di servizi di file in locale è necessario destinare una quota del basket a hardware, manutenzione, alimentazione, raffreddamento e spazio fisico. Lo storage di file nel cloud permette di ridistribuire le risorse tecniche in altri progetti che portano maggiore valore aggiunto all’azienda.
Casi d’uso per il Cloud File Directory
Ad esempio, repository di grandi dimensioni, ambienti di sviluppo, store di file multimediali e directory home degli utenti.
Le soluzioni di Cloud File Directory offrono grande flessibilità perché si integrano con le applicazioni esistenti e sono semplici da distribuire, gestire e mantenere, perciò sono ideali per un’ampia gamma di casi d’uso e mercati verticali.
1)Distribuzione Web:
Le applicazioni di distribuzione Web richiedono storage di file condiviso; questa necessità può costituire una problematica importante al momento dell’integrazione di applicazioni di back-end. In genere, sono presenti diversi server Web che distribuiscono i contenuti di un sito, e ognuno di essi deve poter accedere allo stesso set di file. Poiché le soluzioni di storage di file nel cloud sono compatibili con semantica file system, convenzioni di denominazione dei file e autorizzazioni già familiari agli sviluppatori, sono semplici da integrare nelle applicazioni Web esistenti.
2) Gestione dei contenuti:
I sistemi di gestione dei contenuti o CMS (Content Management System) richiedono un namespace comune e l’accesso a una gerarchia di file system. Analogamente ai casi d’uso di distribuzione Web, gli ambienti CMS dispongono in genere di diversi server che accedono allo stesso set di file per poter fornire i contenuti. Poiché le soluzioni di storage di file nel cloud sono compatibili con semantica file system, convenzioni di denominazione dei file e autorizzazioni già familiari agli sviluppatori, è semplice integrare lo storage di documenti e di altri file in flussi di lavoro CMS esistenti.
3) Analisi di Big Data:
I Big Data necessitano di prodotti di storage in grado di gestire enormi volumi di dati. Inoltre devono mantenere la scalabilità necessaria per supportare la crescita e fornire prestazioni adeguate agli strumenti di analisi a cui i dati vengono inoltrati. Molti carichi di lavoro di analisi interagiscono con i dati tramite un’interfaccia di file, si basano su semantica di file che include blocchi file e richiedono la scrittura di porzioni di file. Dal momento che lo storage di file nel cloud supporta la semantica file system necessaria e può ricalibrare la capacità e le prestazioni, è una soluzione ideale per la distribuzione di una soluzione di condivisione di file semplice da integrare con i flussi di dati per Big Data esistenti.
4) Media e intrattenimento:
I flussi di lavoro del settore di media digitali e intrattenimento sono in costante evoluzione. Molti di loro si avvalgono di distribuzioni cloud ibride che necessitano di accessi standardizzati tramite protocolli di file di rete, ad esempio NFS. Questi flussi di lavoro richiedono accesso flessibile, costante e sicuro ai dati tramite soluzioni generiche, personalizzate e di partner. Poiché lo storage di file nel cloud è compatibile con la semantica file system esistente, è semplice integrare lo storage di contenuti multimediali per l’elaborazione e la collaborazione in casi d’uso quali produzione di contenuti, catene di fornitura digitali, streaming multimediale, riproduzione di trasmissioni, analisi e archiviazione.
5) Directory home:
L’utilizzo di directory home accessibili solo a determinati utenti o gruppi di utenti per lo storage di file può risultare utile in molti flussi di lavoro nel cloud. Le aziende che desiderano sfruttare la scalabilità e i vantaggi in termini di costo del cloud spesso estendono l’accesso alle directory home di molti utenti. Poiché le soluzioni di storage di file nel cloud sono compatibili con modelli di autorizzazione standard e semantica file system, i clienti possono trasferire le loro applicazioni direttamente nel cloud.
6) Backup di database:
L’esecuzione di un backup dei dati con procedure, software e semantica esistenti può dare origine a scenari di ripristino isolati con flessibilità molto limitata. Molte aziende desiderano sfruttare la flessibilità garantita dallo storage dei backup di database nel cloud, sia per maggiore sicurezza durante gli aggiornamenti sia a scopo di sviluppo e testing. Poiché le soluzioni di storage di file nel cloud presentano un file system standard semplice da montare su server di database, possono costituire piattaforme ideali per creare backup di database portabili utilizzando strumenti nativi o applicazioni di backup aziendali.
7) Strumenti di sviluppo:
Gli ambienti di sviluppo devono poter condividere file in modo sicuro durante le operazioni di collaborazione necessarie per innovare. Quando è necessario condividere codice e altri file in modo semplice e preciso, lo storage di file nel cloud garantisce repository organizzati e sicuri a cui è possibile accedere con facilità dagli ambienti di sviluppo nel cloud. Lo storage di file nel cloud fornisce una soluzione scalabile e altamente disponibile, ideale per la collaborazione.
8) Storage di container:
I container Docker sono ideali per la creazione di microservizi, perché garantiscono provisioning rapido, portabilità e isolamento di processi. I container a cui occorre l’accesso ai dati originali ad ogni avvio potrebbero richiedere un file system condiviso a cui connettersi, indipendentemente dalla loro distanza. Lo storage di file nel cloud offre accesso condiviso persistente ai dati per tutti i container in un cluster.
Requisiti per il Cloud File Directory
Una soluzione di storage di file nel cloud di qualità deve offrire capacità e prestazioni ottimali oggi e scalabilità ottimizzata domani.
- Servizio completamente gestito: Offre un file system completamente gestito che può essere avviato in pochi minuti
- Prestazioni: Fornisce throughput e bassa latenza costanti.
- Compatibilità: Si integra in modo ottimizzato con le applicazioni esistenti senza compilare nuovo codice.
- Sicurezza: Fornisce autorizzazioni per controllo degli accessi e sicurezza di rete.
- Disponibilità: Ridondanza su più siti, con accessibilità costante.
- Costi ridotti: Vengono addebitati solo i costi della capacità utilizzata, senza spese anticipate.
Non tutte le soluzioni di Cloud File Directory sono uguali
I vantaggi dello storage di file nel cloud sono chiari, ma è importante specificare che non tutte le soluzioni di questo tipo sono uguali. Le soluzioni esistenti possono essere di diverso tipo: file server a nodo singolo su un’istanza di elaborazione sostenuta da storage a blocchi, senza scalabilità o con ridondanza limitata; soluzioni personalizzate in cluster che richiedono lunghi tempi di configurazione, manutenzione e gestione; soluzioni completamente gestite, ad esempio Amazon EFS, Amazon FSx for Windows File Server richiedono configurazione, manutenzione e prestazioni molto limitate per soddisfare i requisiti dei carichi di lavoro più esigenti.
Il Cloud File Directory può essere offerto in due modi: mediante soluzioni completamente gestite che richiedono interventi di configurazione e di manutenzione minimi, oppure tramite soluzioni personalizzate con elaborazione, storage e licenze separati. Questa seconda opzione richiede però richiedono l’intervento di personale specializzato per la configurazione e la manutenzione. Amazon Elastic File System (Amazon EFS), FSx for Windows File Server e FSx for Lustre sono un esempio di soluzione completamente gestita che offre storage di file semplice e scalabile da utilizzare con le istanze Amazon EC2 nel cloud AWS e in locale.
Tipi di storage nel cloud
Esistono tre tipi di storage nel cloud: di oggetti, di file e a blocchi. Ognuno di questi metodi offre vantaggi differenti.
1. Storage di oggetti: le applicazioni sviluppate nel cloud spesso sfruttano le caratteristiche dei metadati e l’elevata scalabilità dello storage di oggetti. Le soluzioni di storage di oggetti come Amazon Simple Storage Service (Amazon S3) sono ideali per creare da zero applicazioni moderne basate su scalabilità e flessibilità. Inoltre possono essere impiegate per importare datastore esistenti a scopo di analisi, backup o archiviazione.
2. Storage di file: a molte applicazioni occorre accedere a file condivisi e richiedono pertanto un file system. Questo tipo di storage è spesso supportato da un server NAS (Network Attached Storage). Soluzioni di storage di file come Amazon Elastic File System (EFS), Amazon FSx for Windows File Server e Amazon FSx for Lustre sono perfette per casi d’uso come repository di grandi contenuti, ambienti di sviluppo, archivi multimediali, directory home utente; Amazon FSx for Lustre è anche la soluzione ideale per elaborazioni ad alte prestazioni e carichi di lavoro di machine learning.
3. Storage a blocchi: altre applicazioni aziendali, ad esempio database o sistemi ERP, spesso necessitano di uno storage dedicato a bassa latenza per ogni host. Questo tipo di storage è simile allo storage su dispositivi DAS (Direct-Attached Storage) e su dispositivi SAN (Storage Area Network). Il provisioning delle soluzioni di archiviazione nel cloud basate su blocchi come Amazon Elastic Block Store (EBS) viene effettuato per ciascun server virtuale; le soluzioni offrono latenza estremamente bassa, necessaria per i carichi di lavoro a elevate prestazioni.
In che modo il Cloud File Directory è differente?
Benché le soluzioni di storage a blocchi permettano lo storage di file come oggetti, per accedere con le applicazioni esistenti è necessario compilare nuovo codice. In secondo luogo, è fondamentale impiegare API e avere una conoscenza approfondita della semantica dei denominazione. Le soluzioni di storage di file che supportano modelli di autorizzazione e semantica file system esistenti presentano il vantaggio di non richiedere nuovo codice. Questo perché configurare le applicazioni per l’utilizzo di storage di file condivisi è semplice.
Lo storage a blocchi può essere utilizzato come componente secondario di una soluzione di storage di file gestita manualmente. Tuttavia, la relazione univoca necessaria tra host e volume rende più complesso ottenere la scalabilità, la disponibilità e i costi di una soluzione completamente gestita; inoltre, sarebbe necessario allocare ulteriore budget e coinvolgerebbe ulteriori risorse di gestione. Una soluzione di storage di file nel cloud completamente gestita è meno complessa, riduce i costi e semplifica la gestione.
Quali sono i servizi di Cloud File Directory in AWS?
Esiste un’innumerevole quantità di dati basati su file nel mondo e AWS fornisce servizi completamente gestiti di file system che permettono di soddisfare facilmente le diverse esigenze di applicazioni e carichi di lavoro basati su file.
Storage di applicazioni aziendali
Le organizzazioni hanno bisogno che le proprie applicazioni aziendali mission critical siano altamente disponibili e la gran parte di queste applicazioni utilizzano storage di file condivisi. Migrare queste applicazioni sul cloud garantisce scalabilità, disponibilità elevata, durabilità, sicurezza, costi ridotti e al contempo agilità crescente.
AWS offre due servizi di file system ottimizzati per le applicazioni aziendali.
- Amazon EFS fornisce file system completamente gestito nativo per il cloud che offre storage di file scalabile ed elastico per una vasta gamma di applicazioni basate su Linux.
- Amazon FSx for Windows File Server fornisce file system completamente gestito nativo per Windows con funzionalità e prestazioni ottimizzate per applicazioni aziendali basate su Windows.
Questi permettono ai clienti di migrare le proprie applicazioni basate su Linux e Windows ad AWS utilizzando i file system completamente gestiti con funzionalità, compatibilità, prestazioni e sicurezza su cui tali applicazioni fanno affidamento.
Storage ottimizzato per il calcolo
Le applicazioni di elaborazione intensiva come il calcolo ad alte prestazioni, machine learning e l’elaborazione multimediale, spesso necessitano di throughput elevato e basse latenze nel file system. Questi carichi di lavoro spesso vengono eseguiti per brevi periodi di tempo utilizzando dati di input archiviati in data lake a basso costo.
AWS offre Amazon FSx for Lustre per queste applicazioni di elaborazione intensiva. Amazon FSx for Lustre permette ai clienti di elaborare facilmente i propri dati con un file system ottimizzato per le prestazioni e i costi di lavori di elaborazione brevi e intensivi, con input e output archiviati in Amazon S3.
Andrea Netti – Innovation Manager