Portal: Prelude RTX ist eine beeindruckende Demonstration der RTX-Remix-Technologie von Nvidia, die einen ehemaligen Source-Mod für Portal übernimmt und ihm visuelle Funktionen und Technologien verleiht, die mit High-End-Triple-AAA-Veröffentlichungen mithalten und diese sogar übertreffen. Es ist wirklich spektakulär – und hoffentlich eines von vielen bahnbrechenden Remastern, die in Zukunft erscheinen werden, wenn die Veröffentlichung der RTX-Remix-Modding-Tools näher rückt.
Interessanter ist jedoch, dass Prelude auch das erste Spiel ist, das RTX IO unterstützt, ein GPU-beschleunigtes Dekomprimierungsschema, das unter Vulkan läuft. Hierbei handelt es sich im Wesentlichen um eine Nvidia-gebrandete Version von Direct Storage 1.2, die auch in Ratchet and Clank: Rift Apart enthalten ist, das später in diesem Monat auf dem PC erscheint. Sein Zweck besteht darin, das Laden von Spielen und das Streamen von Assets auf der PC-Plattform zu beschleunigen, und seine Einbeziehung hier bietet uns einen guten Vorwand, um zu sehen, wie die Technologie funktioniert.
In der Vergangenheit wurden beim Laden Spieldaten wie Texturen oder Modelle von einer Festplatte in den Systemspeicher und dann unter der Kontrolle der CPU auf die GPU übertragen. Dies war ein ziemlich latenzintensiver, serieller Ansatz, da die Festplatte die Spindel physisch hochdrehen, die Daten lokalisieren und die Daten dann Block für Block laden musste, so dass der erforderliche Suchaufwand minimiert wurde.
Diese Technik funktionierte bei relativ kleinen Spielressourcen, die von Festplatten geladen wurden, gut, aber da Spiele mittlerweile Hunderte von Gigabyte groß sind und extrem detaillierte Assets aufweisen, müssen alle diese Daten komprimiert werden, um den verfügbaren Speicherplatz und die Bandbreite optimal zu nutzen. Das bedeutet, dass Assets von der CPU dekomprimiert werden müssen, bevor sie auf der GPU verwendet werden können, und die damit verbundene zusätzliche Zeit und CPU-Belastung führt dazu, dass der traditionelle Ansatz zu scheitern beginnt.
Glücklicherweise bedeutet das Aufkommen von schnellem Flash-Speicher mit geringer Latenz in SSDs, dass wir Daten nicht mehr sequenziell lesen müssen, um Suchzeiten zu minimieren – wir können einen neuen Standard schaffen. Erstens wollen wir parallel auf Daten zugreifen, um die Ladezeiten im Vergleich zum alten Windows-I/O-Standard massiv zu verkürzen. Zweitens möchten wir sicherstellen, dass Daten vom Speicher zur GPU verschoben werden Vor es ist dekomprimiert. GPUs haben viele Kerne und erledigen massiv parallele Aufgaben wie die Dekomprimierung besser als CPUs, sodass dieser Ansatz viel Zeit spart. Dies ist das neue System, das für RTX IO und Direct Storage 1.2 vorgesehen ist. Es bietet schnellere Ladezeiten und, wenn es im Gameplay für Streaming-Zwecke verwendet wird, eine Reduzierung der CPU-Last, was möglicherweise die Leistung verbessern kann.
Für RTX IO, wie hier in Portal Prelude RTX, werden die Daten auf der Festplatte mit dem GDeflate-Format komprimiert und vorübergehend in den Systemspeicher verschoben, dann in den VRAM und dort von der GPU dekomprimiert. Dieses GDeflate-Format ist ein offener GPU-Komprimierungsstandard von Nvidia, der an Microsoft und die Kronos-Gruppe übergeben wurde, und ist das Format, das meiner Erwartung nach in Direct Storage 1.2-Spielen mit DirectX auf dem PC verwendet wird – wobei GPUs von Nvidia, AMD und Intel alle unterstützt werden.
Im Gegensatz dazu verwendet Portal: Prelude RTX die Vulkan-Grafik-API, die keine vereinbarten herstellerunabhängigen Standardaufrufe für die GPU-Dekomprimierung hat; Soweit ich weiß, gibt es derzeit nur die vorgeschlagenen Erweiterungen von Nvidia. Diese Erweiterungen von Nvidia für die GPU-Dekomprimierung könnten möglicherweise diejenigen sein, die von der Kronos-Gruppe im großen Stil für Vulkans Direct Storage-Äquivalent angepasst werden. In der Zwischenzeit funktioniert die schnelle GPU-Dekomprimierung in Portal Prelude: RTX nur auf Treibern, die diese spezifischen Erweiterungen unterstützen, also auf Nvidia RTX-Grafikkarten.
Allerdings arbeitet Portal Prelude RTX immer noch nach einem traditionelleren Ladeparadigma, was bedeutet, dass RTX IO die Bildraten nicht steigert. Schließlich ersetzt RTX Remix nicht die Spiel-Engine und ändert auch nicht die Art und Weise, wie Level aufgeteilt und geladen werden; RTX Remix ändert stattdessen lediglich die Art und Weise, wie das Rendering durchgeführt wird und wie Assets geladen werden, um dieses Rendering zu versorgen. Dies unterscheidet sich von Ratchet and Clank: Rift Apart, das ebenfalls GPU-Dekomprimierung verwenden sollte, um das Gameplay zu beschleunigen. Portal Prelude RTX profitiert daher vor allem in Bezug auf dedizierte Ladezeiten und sichtbare Texturladezeiten.
Um zu testen, welchen Einfluss die Technologie hier hat, habe ich einen Build des Spiels getestet, der mit ausgeschaltetem RTX IO und einer SATA-SSD mit einer Höchstgeschwindigkeit von 500 MB/s läuft. Das Spiel lädt relativ schnell, aber die Texturen brauchen einige Zeit, um ihre höchste Qualität zu erreichen – ohne die GDeflate-Komprimierung von RTXIO ist das Spiel auf der Festplatte vollständig unkomprimiert und etwa 60 Prozent größer. Daher wird die Bandbreite entsprechend belastet, um die Texturen in den VRAM zu verschieben, wobei es etwas mehr als eine Sekunde dauert, bis die letzte Textur geladen ist. Wenn RTX IO aktiviert ist, wird dieselbe Textur auf einer SATA-SSD in weniger als der Hälfte der Zeit geladen.
| Aufbau | Ins Spiel laden | Textur laden |
|---|---|---|
| 12900K + 500 MB/s SATA SSD + RTX IO aus | 1,13s | 2,36s |
| 12900K + 500 MB/s SATA SSD + RTX IO an | 0,67 s | 1,16s |
| 12900K + 3,5 GB/s NVMe SSD + RTX IO aus | 0,57 s | 1,45s |
| 12900K + 3,5 GB/s NVMe SSD + RTX IO an | 0,53 s | 1,07 s |
Das ist nicht gerade der größte Unterschied in der realen Welt, da eine halbe Sekunde wie im Flug vergangen ist, aber die Halbierung der Zeit ist dennoch beeindruckend. Nachdem ich eine Reihe von Tests in verschiedenen Konfigurationen durchgeführt habe, habe ich zwei interessante Erkenntnisse gewonnen. Erstens schlägt ein 500-MB/s-SATA-Laufwerk mit aktiviertem RTX IO ein 3,5-GB/s-NVMe-Laufwerk mit ausgeschaltetem RTX IO – ziemlich herausragend. Zweitens hatten Unterschiede in der CPU- und GPU-Hardware keine dramatischen Auswirkungen auf die Ladezeiten, da das RTX 2060 Super + Core i9 12900K-System weitgehend die gleiche Leistung erbrachte wie die gleiche CPU mit dem Flaggschiff RTX 4090; Auch bei den Ladezeiten lagen ein RTX 4070- und Ryzen 5 3600-System sehr nah beieinander.
Portal: Prelude RTX ist also ein vielversprechender erster Einsatz dieser Technologie auf dem PC, aber gleichzeitig auch banal, da es sich auf ein Spiel bezieht, das von vornherein ein altes Ladeparadigma verwendet. Bei Spielen, die aktives Streaming und keinerlei Ladebildschirme nutzen, wie Ratchet and Clank: Rift Apart und andere zukünftige Spiele, wird diese Technologie hier ihr Bestes zeigen. Natürlich freuen wir uns darauf, diesen Titel bald zu veröffentlichen, da das Spiel am 26. Juli auf dem PC erscheint – also bleiben Sie dran.
Quelle : https://www.eurogamer.net/digitalfoundry-2023-portal-prelude-rtx-brings-a-classic-source-mod-to-the-forefront-of-graphics-technology





