Grundlegendes zu Cachenutzungsmodellen

Mithilfe von Cachenutzungsmodellen können Sie anpassen, wie Ihr Azure HPC-Cache Dateien speichert, um Ihren Workflow zu beschleunigen.

Grundlegende Konzepte für das Zwischenspeichern von Dateien

Das Dateicaching ist, wie der Azure HPC-Cache Clientanforderungen beschleunigt. Es verwendet die folgenden grundlegenden Methoden:

  • Lesen der Zwischenspeicherung – Der Azure HPC-Cache behält eine Kopie von Dateien bei, die Clients vom Speichersystem anfordern. Wenn ein Client das nächste Mal dieselbe Datei anfordert, kann HPC Cache die Version im Cache bereitstellen, anstatt die Datei erneut aus dem Back-End-Speichersystem abrufen zu müssen. Schreibanforderungen werden an das Back-End-Speichersystem übergeben.

  • Schreibzwischenspeicherung – Optional kann der Azure HPC-Cache eine Kopie aller geänderten Dateien speichern, die von den Clientcomputern gesendet werden. Wenn mehrere Clients innerhalb kurzer Zeit Änderungen an derselben Datei vornehmen, kann der Cache alle Änderungen im Cache sammeln, anstatt jede Änderung einzeln in das Back-End-Speichersystem schreiben zu müssen. Nach einer bestimmten Zeitspanne ohne Änderungen verschiebt der Cache die Datei in das langfristige Speichersystem.

  • Überprüfungszeitgeber – Die Einstellung für den Überprüfungszeitgeber bestimmt, wie häufig der Cache seine lokale Kopie einer Datei mit der Remoteversion im Back-End-Speichersystem vergleicht. Wenn die Back-End-Kopie neuer als die zwischengespeicherte Kopie ist, ruft der Cache die Remotekopie ab und speichert sie für zukünftige Anforderungen.

    Die Überprüfungszeitgebereinstellung wird angezeigt, wenn der Cache seine Dateien automatisch mit Quelldateien im Remotespeicher vergleicht. Sie können jedoch erzwingen, dass Der Azure HPC-Cache Dateien vergleicht, indem Sie einen Verzeichnisvorgang ausführen, der eine readdirplus-Anforderung enthält. Readdirplus ist eine standardmäßige NFS-API (erweiterter Lesevorgang), die Verzeichnismetadaten zurückgibt. Durch diesen Vorgang wird erzwungen, dass der Cache Dateien vergleicht und aktualisiert.

  • Write-Back-Timer – Für einen Cache mit Lese-/Schreib-Cache ist der Write-Back-Timer die maximale Zeit in Sekunden, die der Cache wartet, bevor eine geänderte Datei in das Back-End-Speichersystem kopiert wird.

Die in Azure HPC Cache integrierten Verwendungsmodelle weisen unterschiedliche Werte für diese Einstellungen auf, sodass Sie die beste Kombination für Ihre Situation auswählen können.

Auswählen des richtigen Verwendungsmodells für Ihren Workflow

Sie müssen ein Verwendungsmodell für jedes von Ihnen verwendete NFS-Protokollspeicherziel auswählen. Azure Blob Storage-Ziele verfügen über ein integriertes Verwendungsmodell, das nicht angepasst werden kann.

MITHILFE von HPC Cache-Nutzungsmodellen können Sie auswählen, wie Sie schnelle Reaktionen mit dem Risiko abwägen, veraltete Daten zu erhalten. Wenn Sie die Geschwindigkeit von Dateilesevorgängen optimieren möchten, spielt es für Sie möglicherweise keine Rolle, ob die Dateien im Cache mit den Back-End-Dateien abgeglichen werden. Wenn Sie andererseits sicherstellen möchten, dass Ihre Dateien immer auf dem neuesten Stand mit dem entfernten Speicher sind, wählen Sie ein Modell aus und legen Sie den Überprüfungszeitgeber auf eine niedrige Zahl fest, um häufige Überprüfungen durchzuführen.

Dies sind die Verwendungsmodelloptionen:

  • Schreibgeschütztes Zwischenspeichern – Verwenden Sie diese Option, wenn Sie den Lesezugriff auf Dateien beschleunigen möchten. Wählen Sie diese Option aus, wenn Ihr Workflow minimale Schreibvorgänge wie 0% bis 5%umfasst.

    Mit dieser Option werden Clientlesevorgänge zwischengespeichert, aber keine Schreibvorgänge zwischengespeichert. Schreibvorgänge werden an den Backendspeicher übergeben.

    Im Cache gespeicherte Dateien werden nicht automatisch mit den Dateien auf dem NFS-Speichervolume verglichen. (Lesen Sie die Beschreibung des obigen Überprüfungszeitgebers, um zu erfahren, wie sie manuell verglichen werden.)

    Wenn Sie die Option "Schreibgeschütztes Zwischenspeichern " auswählen, können Sie den Überprüfungszeitgeber ändern. Der Standardwert beträgt 30 Sekunden. Der Wert muss eine ganze Zahl (keine Dezimalstellen) zwischen 1 und 31536000 Sekunden (einschließlich 1 Jahr) sein.

  • Zwischenspeichern von Lese- und Schreibvorgängen – Diese Option speichert sowohl Lese- als auch Schreibvorgänge zwischen. Bei Verwendung dieser Option wird erwartet, dass die meisten Clients über den Azure HPC-Cache auf Dateien zugreifen, anstatt den Back-End-Speicher direkt zu installieren. Die zwischengespeicherten Dateien haben zuletzt vorgenommene Änderungen, die noch nicht in das Back-End kopiert wurden.

    In diesem Verwendungsmodell werden Dateien im Cache standardmäßig alle acht Stunden mit den Dateien im Back-End-Speicher überprüft. Die zwischengespeicherte Version der Datei wird als aktueller angenommen. Eine geänderte Datei im Cache wird in das Back-End-Speichersystem geschrieben, nachdem sie standardmäßig eine Stunde lang im Cache gespeichert wurde.

    Wenn Sie die Option "Lese-/Schreib-Caching" auswählen, können Sie sowohl den Überprüfungszeitgeber als auch den Schreib-Cache-Timer ändern. Der Standardwert für den Überprüfungszeitgeber beträgt 28.800 Sekunden (8 Stunden). Der Wert muss eine ganze Zahl (keine Dezimalstellen) zwischen 1 und 31536000 (einschließlich) sein. Der Standardwert für den Write-back-Timer beträgt 3600 Sekunden (1 Stunde). Der Wert muss eine ganze Zahl (keine Dezimalstellen) zwischen 1 und 31536000 Sekunden (einschließlich 1 Jahr) sein.

In dieser Tabelle werden die Unterschiede des Verwendungsmodells zusammengefasst:

Nutzungsmodell Cachemodus Überprüfungstimer Schreibschutztimer
Zwischenspeichern mit Schreibschutz Lesen 30 Sekunden Nichts
Zwischenspeichern mit Lese- und Schreibzugriff Lesen/Schreiben 8 Stunden 1 Stunde

Warning

Durch das Ändern von Nutzungsmodellen wird eine Dienstunterbrechung verursacht. HPC-Cacheclients erhalten keine Antworten, während das Verwendungsmodell umgestellt wird. Wenn Sie Nutzungsmodelle ändern müssen, wird empfohlen, dass die Änderung während eines geplanten Wartungsfensters vorgenommen wird, um Clientunterbrechungen zu verhindern.

Wenn Sie Fragen zum besten Nutzungsmodell für Ihren Azure HPC-Cacheworkflow haben, wenden Sie sich an Ihren Azure-Vertreter, oder öffnen Sie eine Supportanfrage für Hilfe.

Tip

Ein Hilfsprogramm ist verfügbar, um bestimmte einzelne Dateien wieder in ein Speicherziel zu schreiben, ohne den gesamten Cacheinhalt zu schreiben. Erfahren Sie mehr über das skript flush_file.py in Customize file write-back in Azure HPC Cache.

Nächste Schritte