April 2023
Sechs Jahre Nichtstun, eine schöne Lösung für so viele Probleme
Vor fast genau sechs Jahren habe ich beschlossen, auch mal dieses Machine Learning auszuprobieren:
Gleich kann es losgehen, ich muss nur erst “Getting Started before your first lesson” lesen. Von dort schickt man mich weiter zum AWS deep learning setup video. Das Video ist 13 Minuten lang.
(Es folgen Probleme und Verwicklungen beim Setup, die Details kann man hier nachlesen.)
In Minute 12:45 sagt der Erzähler im Video: “Ok! It looks like everything is set up correctly and you’re ready to start using it.” Aber statt 12 Minuten und 45 Sekunden sind zwei Wochen vergangen, mein anfänglicher Enthusiasmus ist aufgebraucht und mein Interesse an Deep Learning erlahmt. Ich bin nicht einmal bis “Lesson 1” gekommen.
Im April 2023 sagt Aleks, dass er gerade einen sehr guten Onlinekurs über Machine Learning macht. Ich frage nach der Adresse, und sie kommt mir bekannt vor. Es ist derselbe Kurs!
“Das Setup war kein Problem?”, frage ich. Nein, sagt Aleks, Sache von ein paar Minuten.
Ich sehe mir "Practical Deep Learning for Coders 2022” an. Man braucht für den Kurs bestimmte Hardware. Generell benötigt Machine Learning Grafikprozessoren wegen der höheren Rechenleistung, und aus der Einleitung zum Kurs weiß ich jetzt, dass die aktuell verfügbaren Tools Nvidia-Grafikprozessoren voraussetzen*. Den Zugang zu dieser Hardware soll man mieten. Das war vor sechs Jahren auch schon so, nur dass das Mieten der Rechenleistung bei Amazon Web Services eine komplizierte und teure Sache war.
* Ich hatte an dieser Stelle schon “Grafikkarten” geschrieben, dann kam es mir aber wieder so vor, als müsste ich meinen Sprachgebrauch renovieren. In meiner Vorstellung handelt es sich um eine Steckkarte, ungefähr 10 x 20 cm groß, die in ein PC-Gehäuse eingebaut wird. So war das, als ich meine Computer noch in Einzelteilen kaufte, aber das ist zwanzig Jahre her. Deshalb habe ich mich für das unverbindliche Wort “Grafikprozessoren” entschieden. Aber wenn ich nach nvidia gpu machine learning suche, sehe ich sperrige Dinge, die nicht weit von meiner Erinnerung an Grafikkarten entfernt sind. Die große Rechenleistung braucht auch große Kühlleistung, deshalb sind zwei Lüfter auf der ... naja, Karte. Die Ergebnisse der Bildersuche sind etwas uneindeutig, aber es kommt mir so vor, als enthielte das Rechenzentrum, dessen Leistung ich gleich nutzen werde, wahrscheinlich große Gehäuse, in denen große Grafikkarten drin sind, vom Format her immer noch ungefähr wie vor zwanzig Jahren. Nur viel schneller.
2018 brauchte man AWS schon nicht mehr für den fast.ai-Onlinekurs. Stattdessen konnte man sich die Arbeitsumgebung bei Paperspace einrichten, einem anderen Cloud-Anbieter. Die Anleitung von 2018 klingt so, als hätte meine Geduld wahrscheinlich auch dafür nicht gereicht.
In der Version von 2019 hat der Kurs auf Google Colab gesetzt. Das heißt, dass man Jupyter Notebooks auf Google-Servern laufen lassen kann und keine eigene Python-Installation braucht, nur einen Browser. Colab gab es 2017 noch nicht, es wurde erst ein paar Monate nach meinem Scheitern, im Herbst 2017, für die Öffentlichkeit freigegeben. Allerdings klingt die Anleitung von 2019 immer noch kompliziert.
2020 wirkt es schon schaffbarer.
Auch die aktuelle Version des Kurses basiert auf Colab. Man muss sich dafür einen Account bei Kaggle einrichten. Soweit ich es bisher verstehe, dient dieser Kaggle-Zugang dazu, die Sache kostenlos zu machen. Colab würde ansonsten Geld kosten, weniger als ich 2017 bezahlt habe, aber eben Geld. Oder vielleicht liegen auch die Jupyter Notebooks mit den Kurs-Übungen bei Kaggle, keine Ahnung, man braucht es eben. (Update: In Kapitel 2 des Kurses merke ich, dass es noch mal anders ist, man hätte sich zwischen Colab und Kaggle entscheiden können. Zusammengefasst: Ich verstehe es nicht.)
Ich lege mir einen Kaggle-Account an und betrachte das erste Python-Notebook des Kurses. Es beginnt mit einem Test, der nur überprüft, ob man überhaupt Rechenleistung bei Kaggle in Anspruch nehmen darf. Das geht nämlich erst, wenn man eine Telefonnummer eingetragen und einen Verifikationscode eingetragen hat, der an diese Telefonnummer verschickt wird. Aber das Problem ist Teil des Kursablaufs und deshalb genau an der Stelle erklärt, an der es auftritt. Es kostet mich fünf Minuten, die vor allem im Warten auf die Zustellung der SMS mit dem Code bestehen.
Danach geht es immer noch nicht. Beim Versuch, die ersten Zeilen Code laufen zu lassen, bekomme ich eine Fehlermeldung, die mir sagt, dass ich das Internet einschalten soll:
“STOP: No internet. Click ‘>|’ in top right and set ‘Internet’ switch to on.”
Ich betrachte lange alles, was mit “top right” gemeint sein könnte, aber da ist kein solcher Schalter. Schließlich google ich die Fehlermeldung. Andere haben das Problem auch schon gehabt und gelöst. Der Schalter sieht weder so aus wie in der Fehlermeldung angedeutet, noch befindet er sich oben rechts. Man muss ein paar Menüs ein- und ein anderes ausklappen, dann wird er unten rechts sichtbar.
Ich bin also im Internet und muss erst das Internet einschalten, damit ich Dinge im Internet machen kann.
Aleks meint, wenn ich ihm gestern dabei zugehört hätte, wie er eine Viertelstunde lang laut fluchte, hätte ich schon gewusst, wie es geht. Hatte ich aber nicht.
Nach dem Einschalten des Internets kann ich das erste Jupyter-Notebook des Kurses betrachten und selbst ausprobieren, ob es wohl schwer ist, Frösche von Katzen zu unterscheiden. Für die Lösung aller Startprobleme von 2017 habe ich zwei Wochen gebraucht. 2023 noch eine Viertelstunde, und ich bin zuversichtlich, dass man um 2025 direkt in den Kurs einsteigen können wird.
(Kathrin Passig)

















