Deep Learning illustriert. Jon Krohn

Deep Learning illustriert - Jon Krohn


Скачать книгу
vorhanden, die bearbeitet werden könnten.

       Der Datensatz ist auf ausgewählte statische Szenen beschränkt und muss auf andere Motive (vor allem Menschen) erweitert werden.

      Abb. 3–8Ein Beispielbild (links) wird mit dem traditionellen Arbeitsablauf (Mitte) bzw. mit dem Deep-Learning-Modell von Chen et al. (rechts) verarbeitet.

      Ungeachtet dieser Einschränkungen bietet diese Arbeit jedoch einen faszinierenden Einblick, wie Deep Learning adaptiv Fotos in Postprocessing-Abläufen korrigieren kann, und das mit einem Maß an Raffinesse, das bei Maschinen bisher noch nicht beobachtet werden konnte.

       3.7Zusammenfassung

      Wir haben in diesem Kapitel GANs vorgestellt und erläutert, dass dieser Deep-Learning-Ansatz außergewöhnlich anspruchsvolle Repräsentationen in seinen latenten Räumen kodieren kann. Diese reichen visuellen Darstellungen erlauben es GANs, neuartige Bilder mit speziellen, künstlerischen Stilen herzustellen. Die Ausgaben der GANs sind nicht nur rein ästhetisch, sondern können auch einen praktischen Nutzen haben. Sie können zum Beispiel Daten zum Trainieren autonomer Fahrzeuge simulieren, das Prototyping in den Bereichen Mode und Architektur beschleunigen und die Fähigkeiten kreativer Menschen ganz beträchtlich erweitern.22

      Wenn wir dann die notwendige Deep-Learning-Theorie behandelt haben, werden Sie in Kapitel 12 selbst ein GAN konstruieren, um Skizzen aus dem Quick, Draw!-Datensatz (vorgestellt am Ende von Kapitel 1) zu imitieren. In Abbildung 3–9 erhalten Sie schon einmal einen Eindruck davon, was dann möglich ist.

      Abb. 3–9Neue »handgezeichnete« Bilder von Äpfeln, erzeugt von der GAN-Architektur, die wir gemeinsam in Kapitel 12 entwickeln werden. Mithilfe dieses Ansatzes können Sie maschinengezeichnete »Skizzen« aus den vielen hundert Kategorien des »Quick, Draw!«-Spiels herstellen.

       4Spielende Maschinen

      Neben den in Kapitel 3 eingeführten GANs (Generative Adversarial Networks) ist das Deep -Reinforcement Learning für einige der überraschendsten Fortschritte bei künstlichen neuronalen Netzen verantwortlich, darunter auch für den Löwenanteil der öffentlichkeitswirksamen Durchbrüche der »künstlichen Intelligenz« der letzten Jahre. In diesem Kapitel stellen wir vor, was Reinforcement Learning (verstärkendes Lernen) ist und wie es sich in das Deep Learning einfügt, das es Maschinen erlaubt hat, menschliche Leistungen bei verschiedenen komplexen Anforderungen – darunter Atari-Videospielen, dem Brettspiel Go und feinmotorischen Aufgaben – zu erreichen oder gar zu übertreffen.

       4.1Deep Learning, KI und andere Monster

      Wir haben Deep Learning bereits in Bezug auf das Sehen (Kapitel 1), die Sprache (Kapitel 2) und die Erschaffung neuartiger »Kunst« (Kapitel 3) betrachtet. Dabei wiesen wir lose auf die Beziehung des Deep Learning zum Konzept der künstlichen Intelligenz hin. Nun wird es Zeit, diese Begriffe sowie ihre Beziehungen zueinander gründlicher zu definieren. Wie üblich werden uns dabei visuelle Hinweise helfen – in diesem Fall das Venn-Diagramm aus Abbildung 4–1.

       4.1.1Künstliche Intelligenz

      Künstliche Intelligenz ist der öffentlichkeitswirksamste, schwammigste und am weitesten gefasste der Begriffe, die wir in diesem Abschnitt behandeln werden. Trotzdem wollen wir uns an einer technischen Definition versuchen. Eine anständige Definition besagt, dass KI eine Maschine umfasst, die Informationen aus der sie umgebenden Umwelt verarbeitet und diese Informationen dann in Entscheidungen einfließen lässt, mit denen ein gewünschtes Ergebnis erzielt werden soll. Angesichts dessen halten manche Leute das Erreichen »allgemeiner Intelligenz« für das Ziel der KI – Intelligenz im Sinne der umfassenden Fähigkeit zum Schlussfolgern und Lösen von Problemen1.

      Abb. 4–1Dieses Venn-Diagramm zeigt die relativen Positionen der wichtigsten Konzepte, die im Laufe dieses Buches behandelt werden.

      In der Praxis und vor allem in der Presse wird »KI« (oder »AI« für Artificial Intelligence) dazu verwendet, um jede herausragende Fähigkeit einer Maschine (eines Computers) zu beschreiben. Momentan gehören zu diesen Fähigkeiten die Spracherkennung, das Beschreiben der Geschehnisse in einem Video, das Beantworten von Fragen, das Fahren eines Autos, Industrieroboter, die menschliche Wesen in einer Fabrik imitieren, und das Besiegen von Menschen in »intuitiv geführten« Brettspielen wie Go. Wenn eine KI-Fähigkeit zur Normalität wird (wie das Erkennen handgeschriebener Ziffern, was in den 1990ern bahnbrechend war; siehe Kapitel 1), wird der Spitzname »KI« von der Presse üblicherweise fallengelassen. Die Messlatte für die Definition von KI ist also durchaus beweglich.

       4.1.2Machine Learning

      Machine Learning oder maschinelles Lernen ist neben anderen Facetten der KI, wie der Robotik, eine Teilmenge der KI. Es ist ein Teilgebiet der Informatik, das sich damit befasst, Software so einzurichten, dass diese Software Muster in Daten erkennen kann, ohne dass der Programmierer explizit vorgeben muss, wie die Software alle Aspekte dieser Erkennung ausführen muss. Dazu müsste der Programmierer üblicherweise einen gewissen Einblick darin haben oder eine Hypothese darüber besitzen, wie das Problem gelöst werden könnte; und er würde dann ein grobes Modell und die relevanten Daten bereitstellen, damit die Lernsoftware gut vorbereitet und ausgestattet wäre, um das Problem zu lösen. Wie in Abbildung 1–2 dargestellt und in den früheren Kapiteln dieses Buches immer wieder erörtert wurde, geht es beim Machine Learning traditionell darum, Rohdaten geschickt – wenn auch manuell und damit arbeitsaufwendig – zu verarbeiten, um Features zu extrahieren, die gut zu den datenmodellierenden Algorithmen passen.

       4.1.3Representation Learning

      Wenn wir eine weitere Schicht der Zwiebel aus Abbildung 4–1 abschälen, finden wir das Representation Learning. Diesen Begriff haben wir am Anfang von Kapitel 2 eingeführt, sodass wir hier nicht weiter ins Detail gehen müssen. Nur noch einmal in aller Kürze: Representation Learning (das Lernen durch Repräsentationen) ist ein Zweig des Machine Learning, bei dem Modelle so konstruiert werden, dass sie automatisch Features


Скачать книгу