Sechs Jahre Nichtstun, eine schöne Lösung fĂŒr so viele Probleme
Vor fast genau sechs Jahren habe ich beschlossen, auch mal dieses Machine Learning auszuprobieren:
Gleich kann es losgehen, ich muss nur erst âGetting Started before your first lessonâ lesen. Von dort schickt man mich weiter zum AWS deep learning setup video. Das Video ist 13 Minuten lang.
(Es folgen Probleme und Verwicklungen beim Setup, die Details kann man hier nachlesen.)
In Minute 12:45 sagt der ErzĂ€hler im Video: âOk! It looks like everything is set up correctly and youâre ready to start using it.â Aber statt 12 Minuten und 45 Sekunden sind zwei Wochen vergangen, mein anfĂ€nglicher Enthusiasmus ist aufgebraucht und mein Interesse an Deep Learning erlahmt. Ich bin nicht einmal bis âLesson 1â gekommen.
Im April 2023 sagt Aleks, dass er gerade einen sehr guten Onlinekurs ĂŒber Machine Learning macht. Ich frage nach der Adresse, und sie kommt mir bekannt vor. Es ist derselbe Kurs!
âDas Setup war kein Problem?â, frage ich. Nein, sagt Aleks, Sache von ein paar Minuten.
Ich sehe mir "Practical Deep Learning for Coders 2022â an. Man braucht fĂŒr den Kurs bestimmte Hardware. Generell benötigt Machine Learning Grafikprozessoren wegen der höheren Rechenleistung, und aus der Einleitung zum Kurs weiĂ ich jetzt, dass die aktuell verfĂŒgbaren Tools Nvidia-Grafikprozessoren voraussetzen*. Den Zugang zu dieser Hardware soll man mieten. Das war vor sechs Jahren auch schon so, nur dass das Mieten der Rechenleistung bei Amazon Web Services eine komplizierte und teure Sache war.
* Ich hatte an dieser Stelle schon âGrafikkartenâ geschrieben, dann kam es mir aber wieder so vor, als mĂŒsste ich meinen Sprachgebrauch renovieren. In meiner Vorstellung handelt es sich um eine Steckkarte, ungefĂ€hr 10 x 20 cm groĂ, die in ein PC-GehĂ€use eingebaut wird. So war das, als ich meine Computer noch in Einzelteilen kaufte, aber das ist zwanzig Jahre her. Deshalb habe ich mich fĂŒr das unverbindliche Wort âGrafikprozessorenâ entschieden. Aber wenn ich nach nvidia gpu machine learning suche, sehe ich sperrige Dinge, die nicht weit von meiner Erinnerung an Grafikkarten entfernt sind. Die groĂe Rechenleistung braucht auch groĂe KĂŒhlleistung, deshalb sind zwei LĂŒfter auf der ... naja, Karte. Die Ergebnisse der Bildersuche sind etwas uneindeutig, aber es kommt mir so vor, als enthielte das Rechenzentrum, dessen Leistung ich gleich nutzen werde, wahrscheinlich groĂe GehĂ€use, in denen groĂe Grafikkarten drin sind, vom Format her immer noch ungefĂ€hr wie vor zwanzig Jahren. Nur viel schneller.
2018 brauchte man AWS schon nicht mehr fĂŒr den fast.ai-Onlinekurs. Stattdessen konnte man sich die Arbeitsumgebung bei Paperspace einrichten, einem anderen Cloud-Anbieter. Die Anleitung von 2018 klingt so, als hĂ€tte meine Geduld wahrscheinlich auch dafĂŒr nicht gereicht.
In der Version von 2019 hat der Kurs auf Google Colab gesetzt. Das heiĂt, dass man Jupyter Notebooks auf Google-Servern laufen lassen kann und keine eigene Python-Installation braucht, nur einen Browser. Colab gab es 2017 noch nicht, es wurde erst ein paar Monate nach meinem Scheitern, im Herbst 2017, fĂŒr die Ăffentlichkeit freigegeben. Allerdings klingt die Anleitung von 2019 immer noch kompliziert.
2020 wirkt es schon schaffbarer.
Auch die aktuelle Version des Kurses basiert auf Colab. Man muss sich dafĂŒr einen Account bei Kaggle einrichten. Soweit ich es bisher verstehe, dient dieser Kaggle-Zugang dazu, die Sache kostenlos zu machen. Colab wĂŒrde ansonsten Geld kosten, weniger als ich 2017 bezahlt habe, aber eben Geld. Oder vielleicht liegen auch die Jupyter Notebooks mit den Kurs-Ăbungen bei Kaggle, keine Ahnung, man braucht es eben. (Update: In Kapitel 2 des Kurses merke ich, dass es noch mal anders ist, man hĂ€tte sich zwischen Colab und Kaggle entscheiden können. Zusammengefasst: Ich verstehe es nicht.)
Ich lege mir einen Kaggle-Account an und betrachte das erste Python-Notebook des Kurses. Es beginnt mit einem Test, der nur ĂŒberprĂŒft, ob man ĂŒberhaupt Rechenleistung bei Kaggle in Anspruch nehmen darf. Das geht nĂ€mlich erst, wenn man eine Telefonnummer eingetragen und einen Verifikationscode eingetragen hat, der an diese Telefonnummer verschickt wird. Aber das Problem ist Teil des Kursablaufs und deshalb genau an der Stelle erklĂ€rt, an der es auftritt. Es kostet mich fĂŒnf Minuten, die vor allem im Warten auf die Zustellung der SMS mit dem Code bestehen.
Danach geht es immer noch nicht. Beim Versuch, die ersten Zeilen Code laufen zu lassen, bekomme ich eine Fehlermeldung, die mir sagt, dass ich das Internet einschalten soll:
âSTOP: No internet. Click â>|â in top right and set âInternetâ switch to on.â
Ich betrachte lange alles, was mit âtop rightâ gemeint sein könnte, aber da ist kein solcher Schalter. SchlieĂlich google ich die Fehlermeldung. Andere haben das Problem auch schon gehabt und gelöst. Der Schalter sieht weder so aus wie in der Fehlermeldung angedeutet, noch befindet er sich oben rechts. Man muss ein paar MenĂŒs ein- und ein anderes ausklappen, dann wird er unten rechts sichtbar.
Ich bin also im Internet und muss erst das Internet einschalten, damit ich Dinge im Internet machen kann.
Aleks meint, wenn ich ihm gestern dabei zugehört hÀtte, wie er eine Viertelstunde lang laut fluchte, hÀtte ich schon gewusst, wie es geht. Hatte ich aber nicht.
Nach dem Einschalten des Internets kann ich das erste Jupyter-Notebook des Kurses betrachten und selbst ausprobieren, ob es wohl schwer ist, Frösche von Katzen zu unterscheiden. FĂŒr die Lösung aller Startprobleme von 2017 habe ich zwei Wochen gebraucht. 2023 noch eine Viertelstunde, und ich bin zuversichtlich, dass man um 2025 direkt in den Kurs einsteigen können wird.