PyTorch für Deep Learning. Ian Pointer
Sie die Bootfestplatte auf SSD Persistent Disk.
9 Klicken Sie auf die Option Bereitstellen. Die vollständige Bereitstellung der VM dauert etwa fünf Minuten.
10 Um auf der Instanz eine Verbindung zu Jupyter herzustellen, vergewissern Sie sich zunächst, dass Sie im richtigen Projekt in gcloud eingeloggt sind, und geben Sie den folgenden Befehl ein:
gcloud compute ssh _INSTANCE_NAME_ -- -L 8080:localhost:8080
Die Gebühren für Google Cloud sollten sich auf etwa 45 US-Cent pro Stunde belaufen, was das Produkt zum günstigsten der drei großen Cloud-Anbieter macht.
Welchen Cloud-Anbieter sollte ich wählen?
Wenn Sie in keine Richtung tendieren, empfehle ich Ihnen, die Google Cloud Platform (GCP) zu nutzen. Sie ist die preiswerteste Variante und kann bei Bedarf sogar mithilfe von TPUs skaliert werden. Außerdem bietet sie bedeutend mehr Flexibilität als AWS oder Azure. Wenn Sie jedoch bereits Erfahrungen mit einer der beiden anderen Plattformen gemacht haben, können Sie auch in diesen Umgebungen absolut problemlos arbeiten.
Sobald Ihre Cloud-Instanz läuft, können Sie sich bei deren Kopie von Jupyter Notebook anmelden. Schauen wir uns das also als Nächstes an.
Verwendung von Jupyter Notebook
Falls Sie bislang noch nicht auf Jupyter Notebook gestoßen sind, hier die Kurzfassung: Diese browserbasierte Umgebung ermöglicht Ihnen, Livecode mit Text, Bildern und Visualisierungen zu kombinieren, und ist zu einem der wichtigsten Tools von Datenwissenschaftlern auf der ganzen Welt geworden. In Jupyter erstellte Notebooks können leicht gemeinsam genutzt werden; dementsprechend sind auch alle Notebooks in diesem Buch (https://oreil.ly/pytorch-github) leicht zugänglich. Abbildung 1-2 zeigt einen Screenshot von Jupyter Notebook in Betrieb.
Wir werden in diesem Buch keine fortgeschrittenen Funktionen von Jupyter einsetzen; alles, was Sie wissen müssen, ist, wie man ein neues Notebook erstellt und dass Sie den Inhalt einer Zelle durch gleichzeitiges Drücken der Umschalt- und der Enter-Taste ausführen (und vielleicht, dass Kommandozeilenbefehle direkt mit einem vorangestellten ! ausgeführt werden können). Sollten Sie es noch nie benutzt haben, schlage ich vor, die Jupyter-Dokumentation (https://oreil.ly/-Yhff) zu lesen, bevor Sie zu Kapitel 2 übergehen.
Bevor wir uns mit der Benutzung von PyTorch beschäftigen, widmen wir uns noch einer letzten Sache: wie man alles manuell installiert.
Abbildung 1-2: Jupyter Notebook
PyTorch selbst installieren
Vielleicht möchten Sie etwas mehr Kontrolle über Ihre Programme behalten als mit einem der eben beschriebenen von der Cloud bereitgestellten Images. Oder Sie benötigen für Ihren Code eine bestimmte Version von PyTorch. Oder aber Sie möchten die Programme tatsächlich – all meinen kritischen Anmerkungen zum Trotz – auf Ihrem System zu Hause ausführen. Schauen wir uns an, wie man PyTorch im Allgemeinen auf einem Linux-Server installiert.
|
Sie können PyTorch mit Python 2.x verwenden, aber ich empfehle dringend, das nicht zu tun. Während die Upgrade-Saga von Python 2.x auf 3.x nun schon seit über einem Jahrzehnt andauert, beginnen immer mehr Pakete, die Unterstützung für Python 2.x einzustellen. Wenn Sie also keinen besonderen Grund haben, stellen Sie sicher, dass Ihr System mit Python 3 läuft. |
CUDA downloaden
Obwohl PyTorch durchaus auf einer CPU ausgeführt werden kann, ist für den praktischen Gebrauch in den meisten Fällen der Einsatz einer GPU erforderlich. Dementsprechend benötigt PyTorch eine GPU-Unterstützung. Dies lässt sich ziemlich einfach umsetzen – vorausgesetzt, Sie haben eine NVIDIA-Karte. Die GPU-Unterstützung wird von deren CUDA-Schnittstelle (Compute Unified Device Architecture) zur Verfügung gestellt. Laden Sie für Ihre Linux-Variante das passende Paketformat herunter (https://oreil.ly/Gx_q2) und installieren Sie das Paket.
Für Red Hat Enterprise Linux (RHEL) 7:
sudo rpm -i cuda-repo-rhel7-10-0local-10.0.130-410.48-1.0-1.x86_64.rpm
sudo yum clean all
sudo yum install cuda
Für Ubuntu 18.04:
sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
Anaconda
Python beinhaltet eine Vielzahl von Paketverwaltungssystemen, die allesamt gute und weniger gute Eigenschaften besitzen. Wie die Entwickler von PyTorch empfehle ich Ihnen, Anaconda zu installieren. Anaconda ist ein Paketierungssystem, das darauf ausgerichtet ist, die optimale Zusammenstellung von Paketen für Datenwissenschaftler zu gewährleisten. Wie CUDA ist es ziemlich einfach zu installieren.
Gehen Sie auf die Webseite von Anaconda (https://oreil.ly/9hAxg) und suchen Sie die Installationsdatei für Ihren Rechner heraus. Da es sich um ein riesiges Archiv handelt, das über ein Shell-Skript auf Ihrem System ausgeführt wird, empfehle ich Ihnen, die heruntergeladene Datei md5sum auszuführen und sie mit der Liste der Signaturen (https://oreil.ly/anuhu) zu vergleichen. Prüfen Sie, ob die Signatur auf Ihrem Rechner mit der auf der Webseite übereinstimmt, bevor Sie den Kommandozeilenbefehl bash Anaconda3-VERSION-Linux-x86_64.sh ausführen. Dies stellt sicher, dass die heruntergeladene Datei nicht manipuliert wurde und auf Ihrem System sicher ausgeführt werden kann. Das Skript fordert Sie mehrmals auf, das Installationsverzeichnis anzugeben; wenn es keine Gründe dagegen gibt, akzeptieren Sie einfach die Standardeinstellungen.
|
Sie fragen sich vielleicht: »Kann ich das auch auf meinem MacBook bewerkstelligen?« Leider sind die meisten Macs heutzutage entweder mit Intel- oder AMD-Grafikprozessoren ausgestattet und bieten nicht wirklich eine Unterstützung für die Ausführung von PyTorch im GPU-beschleunigten Modus. Ich empfehle daher die Verwendung von Colab oder eines Cloud-Providers, anstatt zu versuchen, Ihren Mac lokal zu nutzen. |
Zu guter Letzt – PyTorch (und Jupyter Notebook)
Jetzt, da Sie Anaconda installiert haben, ist die Einrichtung von PyTorch denkbar einfach:
conda install pytorch torchvision -c pytorch
Hierdurch