Questa pagina fornisce una panoramica dello spazio dei nomi gerarchico, incluse le sue funzionalità chiave, i casi d'uso comuni, i vantaggi e le limitazioni da considerare.
Panoramica
Lo spazio dei nomi gerarchico è una funzionalità offerta da Cloud Storage che consente di organizzare gli oggetti in cartelle e archiviare i dati in una struttura logica del file system. L'archiviazione dei dati in una struttura del file system migliora le prestazioni, garantisce la coerenza e semplifica la gestione dei carichi di lavoro orientati ai file e con un utilizzo intensivo dei dati.
Le operazioni sulle cartelle offrono funzionalità di affidabilità e gestione, tra cui la creazione, l'eliminazione, l'elenco e la ridenominazione delle cartelle. L'organizzazione gerarchica degli oggetti semplifica l'organizzazione dei dati e ottimizza le attività di gestione dei dati. Una cartella in un bucket con lo spazio dei nomi gerarchico abilitato può contenere oggetti, altre cartelle o una combinazione di entrambi.
Per utilizzare le cartelle in un bucket, devi abilitare lo spazio dei nomi gerarchico quando crei il bucket. L'impostazione dello spazio dei nomi gerarchico del bucket non può essere modificata dopo la creazione del bucket. Per informazioni sull'abilitazione dello spazio dei nomi gerarchico per il bucket, consulta Creare e gestire bucket con lo spazio dei nomi gerarchico abilitato.
Il seguente diagramma mostra un esempio di un bucket con lo spazio dei nomi gerarchico abilitato in cui gli oggetti sono organizzati in una struttura gerarchica di cartelle.
Funzionalità principali
Lo spazio dei nomi gerarchico fornisce le seguenti funzionalità:
Query al secondo (QPS) iniziali più elevate: i bucket con lo spazio dei nomi gerarchico abilitato offrono limiti QPS iniziali fino a 8 volte superiori per la lettura e la scrittura di oggetti rispetto ai bucket senza lo spazio dei nomi gerarchico abilitato. Il QPS iniziale più elevato semplifica lo scaling dei carichi di lavoro che richiedono un uso intensivo dei dati e offre una velocità effettiva migliorata. Per informazioni sui metodi di ottimizzazione del rendimento durante l'utilizzo di cartelle nei bucket con lo spazio dei nomi gerarchico abilitato, vedi Gestione delle cartelle.
Cartelle: le cartelle fungono da contenitore per oggetti e altre cartelle, con supporto per operazioni come la creazione, l'eliminazione e il recupero di cartelle.
Rinomina cartelle: l'operazione di ridenominazione delle cartelle consente di rinominare in modo atomico il percorso di una cartella e delle relative cartelle sottostanti senza eliminare alcun oggetto. Questa tecnica è efficiente e consente di risparmiare tempo, soprattutto per le cartelle di grandi dimensioni con più oggetti.
Elenca cartelle: l'operazione di elenco delle cartelle elenca tutte le cartelle nel bucket o sotto una cartella specifica, aiutandoti a gestire e comprendere la struttura dei dati archiviati in un bucket.
Quando devi abilitare lo spazio dei nomi gerarchico per il bucket
Ti consigliamo di attivare lo spazio dei nomi gerarchico quando utilizzi applicazioni che prevedono una gerarchia e una semantica simili a quelle di un file system. Lo spazio dei nomi gerarchico è utile per attività con uso intensivo dei dati come i carichi di lavoro di analisi, AI e ML. Ecco alcuni scenari comuni in cui è consigliabile utilizzare lo spazio dei nomi gerarchico:
Elaborazione basata su Hadoop: i carichi di lavoro Hadoop e Spark si aspettano tradizionalmente una struttura di archiviazione simile a un file system e una denominazione basata sul tempo per file e cartelle. Lo spazio dei nomi gerarchico si integra con il connettore Cloud Storage per fornire un throughput migliorato e ridenominazioni atomiche delle cartelle, migliorando l'integrità e la coerenza dei dati per molte pipeline di elaborazione dei dati.
Elaborazione di workload orientati ai file: i workload come l'elaborazione batch di analisi, i servizi finanziari o il computing ad alte prestazioni sono strutturati in partizioni in base a una gerarchia di cartelle e file. Lo spazio dei nomi gerarchico consente di gestire questi ambienti con un'API dedicata per la gestione delle cartelle. Inoltre, lo spazio dei nomi gerarchico semplifica la gestione delle cartelle che contengono altre cartelle e oggetti. Con un unico comando API, puoi rinominare rapidamente una cartella insieme a tutti i suoi contenuti, risparmiando tempo e risorse preziosi.
Elaborazione AI e ML: gli strumenti di AI e ML come TensorFlow, Pandas e PyTorch prevedono l'accesso e la semantica simili a quelli di un file system. Lo spazio dei nomi gerarchico, soprattutto se combinato con Cloud Storage FUSE, offre un throughput maggiore e un accesso efficiente ai dati. Di conseguenza, lo spazio dei nomi gerarchico migliora le prestazioni e l'affidabilità dell'iterazione del modello ML.
Prima di abilitare lo spazio dei nomi gerarchico per il bucket, devi considerare le limitazioni dello spazio dei nomi gerarchico. Per informazioni sulle limitazioni dello spazio dei nomi gerarchico, vedi Limitazioni.
Vantaggi dello spazio dei nomi gerarchico
Quando abiliti lo spazio dei nomi gerarchico per i tuoi bucket, puoi eseguire le seguenti operazioni:
Ottimizzare l'organizzazione: puoi organizzare i dati in una struttura di cartelle gerarchica, che ti aiuta a gestire e individuare file o set di dati.
Crea un ecosistema simile a un file system: lo spazio dei nomi gerarchico introduce funzionalità simili a un file system, come cartelle, ridenominazione delle cartelle e elenco delle cartelle, utili per le applicazioni orientate ai file, inclusi l'ecosistema Hadoop e i carichi di lavoro di AI e ML.
Miglioramento delle prestazioni: scalando i workload a uso intensivo di dati per gestire una velocità effettiva più elevata, puoi migliorare le prestazioni complessive della tua applicazione.
Supporto piattaforme
I bucket con spazio dei nomi gerarchico supportano le seguenti funzionalità della piattaforma Cloud Storage:
Tutte le API degli oggetti Cloud Storage e le funzionalità di Cloud Storage più utilizzate. Per informazioni dettagliate sulle funzionalità non supportate, vedi Limitazioni.
Trasferimento di dati da un bucket standard a un bucket con spazio dei nomi gerarchico utilizzando Storage Transfer Service.
Integrazione con i seguenti prodotti:
Connettore Cloud Storage, gestito da Dataproc per i carichi di lavoro Hadoop. Per saperne di più, vedi Utilizzare i bucket con spazio dei nomi gerarchico abilitato per i workload Hadoop.
Cloud Storage FUSE per l'accesso ai bucket simile a un file system utilizzando i client.
Compatibilità con operazioni e funzionalità di Cloud Storage
I bucket con lo spazio dei nomi gerarchico abilitato hanno le seguenti interazioni con altre operazioni Cloud Storage:
Operazioni sugli oggetti
I bucket con lo spazio dei nomi gerarchico abilitato gestiscono le operazioni sugli oggetti nei seguenti modi:
- Operazioni come
Upload
,Rewrite
eCompose
creano automaticamente le cartelle principali mancanti, a condizione che tu disponga delle autorizzazioni necessarie. Di conseguenza, non è necessario creare cartelle prima di caricare gli oggetti. - Sebbene le cartelle possano essere create automaticamente durante le operazioni sugli oggetti, devi eliminarle in modo esplicito utilizzando l'operazione
DeleteFolder
. - Quando utilizzi l'operazione
ListObjects
con il parametrodelimiter
, i bucket restituiscono ogni cartella secondaria comeprefix.
. Tuttavia, le cartelle vuote vengono escluse per impostazione predefinita. Per includere le cartelle vuote, in modo simile a un elenco tipico di file di sistema, devi impostare il parametroincludeFoldersAsPrefixes
. Per informazioni sui metodi di ottimizzazione del rendimento durante l'elenco degli oggetti nei bucket con lo spazio dei nomi gerarchico abilitato, consulta Elenco degli oggetti.
Operazioni sulle cartelle gestite
I bucket con lo spazio dei nomi gerarchico abilitato gestiscono le operazioni sulle cartelle gestite nei seguenti modi:
- I bucket con lo spazio dei nomi gerarchico abilitato offrono un controllo dell'accesso granulare tramite le cartelle gestite. Per gestire l'accesso all'interno di una cartella, devi creare una cartella gestita con lo stesso nome della cartella e poi applicarvi i criteri IAM. Una cartella gestita non può esistere senza la cartella corrispondente.
- La creazione di una cartella gestita crea automaticamente le cartelle padre mancanti, inclusa la cartella con lo stesso nome.
- L'eliminazione di una cartella comporta l'eliminazione automatica della cartella gestita associata.
- Se rinomini una cartella, vengono rinominate automaticamente anche le cartelle gestite associate.
- I bucket con spazio dei nomi gerarchico devono rispettare le regole per i nomi delle cartelle gestite e le regole per i nomi delle cartelle. Sebbene i nomi delle cartelle possano essere nidificati fino a 50 livelli, i nomi delle cartelle gestite possono essere nidificati solo fino a 15 livelli. La dimensione massima del nome della cartella gestita è limitata dalla dimensione massima del nome della cartella, ovvero 512 byte se codificata in UTF-8.
Operazioni sui bucket
Puoi eliminare un bucket con lo spazio dei nomi gerarchico abilitato nello stesso modo di qualsiasi altro bucket. Se un bucket abilitato con spazio dei nomi gerarchico contiene solo cartelle vuote e nessun oggetto o cartella gestita, il bucket può essere eliminato.
Gestione del ciclo di vita degli oggetti
Gestione del ciclo di vita degli oggetti ti consente di automatizzare le azioni sugli oggetti
in base a condizioni, ad esempio età o prefisso. Tuttavia, le regole di gestione del ciclo di vita degli oggetti possono comportarsi in modo diverso nei bucket con spazio dei nomi gerarchico e nei bucket con uno spazio dei nomi piatto a causa dell'operazione RenameFolder
:
Regole di gestione del ciclo di vita degli oggetti per i bucket con uno spazio dei nomi piatto: l'operazione di ridenominazione prevede la ridenominazione di ogni oggetto utilizzando strumenti copiando ogni oggetto in una posizione di destinazione ed eliminando l'oggetto originale dalla posizione di origine. Di conseguenza, nella località di destinazione vengono creati nuovi oggetti con nuovi orari di creazione. Se vengono applicate regole di gestione del ciclo di vita degli oggetti basate sull'età per la posizione di destinazione, queste non verranno applicate immediatamente ai nuovi oggetti perché i relativi orari di creazione vengono reimpostati.
Regole di gestione del ciclo di vita degli oggetti per i bucket con spazio dei nomi gerarchico abilitato: la ridenominazione di una cartella opera a livello di cartella, senza dover rinominare ogni singolo oggetto. Di conseguenza, l'ora di creazione degli oggetti viene mantenuta, il che significa che le regole di Gestione del ciclo di vita degli oggetti basate sull'età vengono applicate immediatamente agli oggetti rinominati se soddisfano i criteri di età.
Come gestire i bucket con lo spazio dei nomi gerarchico abilitato
Puoi elencare tutti i bucket con lo spazio dei nomi gerarchico abilitato, indipendentemente dal layout di archiviazione. Il layout di archiviazione di un bucket descrive la modalità di organizzazione degli oggetti all'interno di un bucket, in uno spazio dei nomi piatto o gerarchico. Per istruzioni su come visualizzare il layout di archiviazione di un bucket, consulta Visualizzare il layout di archiviazione di un bucket. Per elencare tutti i bucket, segui le istruzioni riportate in Elencare i bucket.
Puoi eliminare un bucket con lo spazio dei nomi gerarchico abilitato nello stesso modo di qualsiasi altro bucket. Ai fini dell'eliminazione, se un bucket con spazio dei nomi gerarchico abilitato contiene solo cartelle vuote e nessun oggetto o cartella gestita, allora il bucket viene considerato vuoto. Per istruzioni sull'eliminazione dei bucket, vedi Eliminare i bucket.
Prezzi
Per informazioni sui prezzi, consulta la pagina Prezzi di Cloud Storage.
Limitazioni
Di seguito sono riportate le limitazioni dello spazio dei nomi gerarchico:
Devi scegliere se utilizzare o meno lo spazio dei nomi gerarchico quando crei il bucket. L'impostazione dello spazio dei nomi gerarchico del bucket non può essere modificata dopo la creazione del bucket.
Per abilitare lo spazio dei nomi gerarchico, un bucket deve abilitare anche l' accesso uniforme a livello di bucket.
Le seguenti funzionalità di Cloud Storage non sono supportate per i bucket che utilizzano lo spazio dei nomi gerarchico:
- Autoclass
- Blocco bucket
- Blocchi degli oggetti
- Blocco conservazione degli oggetti
- Controllo delle versioni degli oggetti
- Spostamento dei bucket
Passaggi successivi
- Crea bucket con lo spazio dei nomi gerarchico abilitato.
- Creare e gestire cartelle.
- Rinominare le cartelle.
- Utilizza lo spazio dei nomi gerarchico per i carichi di lavoro Hadoop.
- Ottimizzare il rendimento.
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Cloud Storage in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti senza addebiti per l'esecuzione, il test e il deployment dei workload.
Prova Cloud Storage gratuitamente