Amazon hat sicherlich mehrere Trends entwickelt. Apple auch. Schon mit dem iPhone 4s kam die Sprachassistentin "Siri". Apple kaufte kurzerhand das Unternehmen Siri, integrierte die Entwicklung und benannte die Sprachassistentin nach dem Ursprungsunternehmen. Doch erst Amazon hat mit sehr günstigen Lautsprechern, den Echo (Dots), den Sprachassistenten wirklich popularisiert. Heute müssen es aber nicht mehr "intelligente" Lautsprecher sein, wenn man per Sprache mit Computern interagieren will: Da die Smartphone-Durchdringung die 100-Prozent-Marke erreicht oder übersprungen hat, kann man immer und überall mit "Hey Siri" oder "Alexa" oder auch mit dem noch geschlechtlich unbestimmten "OK, Google" ins Gespräch kommen. Nur nebenbei: Gibt es eigentlich noch Microsofts "Cortana"? Sollten Sie sich diesen Text haben vorlesen lassen, dann könnte durchaus die eine oder andere Assistenten gerade hellhörig geworden sein ;-) (Zwinckersmiley).
Bild von Niran Kasri auf Pixabay
1. Motivation Bequemlichkeit?
Wer sich in den Jahren 2016 bis 2019 einen Echo oder ein Gerät eines Drittanbieters mit Alexa-Integration in seiner Wohnung installiert hat, muss sich rechtfertigen. Tatsächlich ist es so, dass Gäste im Haus darauf hingewiesen werden müssen, wenn man die Geräte weiterhin mithören lässt (vergleichbar sicherlich mit den Hinweisen auf "Grundstück ist videoüberwacht"). Aber auch darüber hinaus. Das Gegenargument "Ich lasse mich doch nicht freiwillig abhören", ist schlecht zu entkräften. Die Skandale um tatsächlich von Amazon-Mitarbeitern nachgehörten Gesprächen sind noch frisch im Gedächtnis. Eine Arbeitshypothese der Kritiker geht allerdings ganz einfach in die Richtung Bequemlichkeit. Auch das würde ich zunächst gelten lassen. So scheint doch die Hauptmotivation der Käufer der ersten Jahre darin zu finden sein, dass Sie (nunmehr bequemer) Musik (und Hörbücher und Podcasts und Nachrichten) abspielen lassen können und Licht schalten (lassen) können. Alles in allem scheinen die Probleme, die die Assistentin löst, klein und irrelevant, typisch first-world-problems, könnte man sagen. Kritiker mögen hier auf das Energie-Problem hinweisen. Die Sprachassistentinnen lösen keine echten Probleme, sondern verschärfen bestehende: Der Energieverbrauch der Haushalte steigt.
So weit, so schlecht: Die Geräte greifen in die Privatsphäre ein, "hören ab", lösen keine echten Probleme und verschärfen sie nur, weil weitere computerartigen Geräte in die Haushalte einziehen. Doch zunächst zurück zur Bequemlichkeitshypothese. Interessant daran ist u.a., dass sie sich - schaut man einmal genau hin - durch die Jahrzehnte und vielleicht sogar durch die Jahrhunderte immer wieder hat auffinden lassen: so zum Beispiel beim Hörbuch-Trend, den letztlich ebenfalls Amazon mit der Audible-Tochter durchgesetzt hat und der die letzte Dekade parallel mit dem Podcast-Trend einem Leitmedium vergangener Zeiten, der Oralität, zu alten neuen Ehren verschafft hat. Frank Arnold und andere Vorleser wurden zu geschätzten Stars der Hörbuch-Szene, die Podcast-Welt bevölkerten früh wiedererkennbare Stimmen, z.B. Holger Klein und viele Techies, etwa die von der "Metaebene" aus Berlin oder von "bitsundso" aus München. Zuletzt rockten die Spezialisten-Podcasts "Collinas Erben" (Schiedsrichter- und Fußball-Podcast), der "Soziopod" (Soziologie) und v.a. die "Lage der Nation" (Recht und Politik) die Szene. Die beiden letztgenannten nehmen ab und zu einen Podcast live auf. Sie füllen mit ihrem gepflegten Dialog ganze Hör- und kleine bis mittlere Veranstaltungssäle. Die Podcasts beweisen, dass die Utopie Brechts Wirklichkeit geworden ist: das Radio ist (u.a. in Form von Podcasts) längst zu einem Kommunikationsmittel geworden. Der Rückkanal zum Sender existiert. Einen Podcast einfach über einen Sprachassistenten zu starten, ist sehr einfach und beinahe schon die logische Abrufform für Podcasts und Hörbücher.
Die Kritiker des Hörbuch-Booms (und der Podcasts) glaubten und glauben ein Publikum vorzufinden, das vorgeblich ohne Anstrengung konsumiert. Da "ohne Anstrengung konsumieren" in Bildungsveranstaltungen so viel bedeutet wie "nicht lernen können/wollen" hat die althergebrachte Kultur das Neues stets als Bedrohung aufgefasst (vgl. dazu Krommer 2019, @mediendidaktik_). Das ist der Kern der Hypothese. Verlängert man den Trend auf und über die Jahrhunderte, findet man diesen Vorwurf immer wieder und immer wieder erneuert: Wer die Schrift beherrscht, muss nicht mehr Auswendiglernen (und verlernt die alten guten Techniken), wer drucken und tippen kann (der also isolierte, besser: diskrete Zeichen ohne eigenen Sinn zu sinnvollen Zeichenketten verknüpfen kann, die universell lesbar sind), muss nicht mehr die Handschrift (ordentlich!) lernen, wer nur noch hört oder (bewegte) Bilder (kombiniert mit Ton) konsumiert, muss nun auch nicht mehr mehr lesen lernen!? Während die Mahner erneut den möglichen Untergang des Abendlandes beweinen, diskutieren die Didaktiker*innen vor diesem Hintergrund das nächste Level der Alphabetisierung, die Alphabetisierung 2.0. Vergegenwärtigen wir uns das Folgende: In Zeiten, in denen Bandbreite (Internet) und (digitaler) Speicherplatz reichlich zur Verfügung stehen, ist eine sparsame Speicherung von Informationen in Textform nicht mehr zwingend nötig. Das verändert alles! Wir müssen verstehen lernen, dass heute Texte als Ausdruck künstlicher Verknappung gelten: Warum sendest du nicht authentisch in Wort (und Bild)?, lautet nunmehr die Frage, die sich jeder Text gefallen lassen muss (auch dieser). Seit nunmehr 25 Jahren steht auch ein Gerät zur Verfügung, dass die Grenzen sprengt: Alle Formen von Informationen werden im Zeitalter der Elektronifizierung binär im Symmedium Computer gespeichert: hier alles eins, bzw. null oder eins.
- Computer und Internet sind Integrationsmedien, die „alle medialen Optionen – Text, Bild, Ton, Film etc. – in sich verein[en]“, somit „Symmedien“ (griech. „sym“: mit). Sie sind interaktiv, d.h. der Text ist durch den Leser/Nutzer ‚manipulierbar‘, und synästhetisch, weil die Wahrnehmung ‚mehrfachkodiert‘ wird, in der Rezeption und Produktion verschiedene Wahrnehmungskanäle angesprochen werden. „Dabei erlauben diese Digitalmedien [Computer, Internet, d.V.] Arbeitsprozesse einer neuen Art, die auch und gerade im Deutschunterricht fruchtbar zu machen sind, weil sie mit Ton, Text und bewegtem Tonbild die medialen Kernformen des oralen, des literarischen und des audiovisuellen Paradigmas in sich vereinen und gleichzeitig weiterentwickeln.“ (Frederking 2012, S. 205 f.).
zitiert nach: Lehrerfortbildung-BW
2. Alphabetisierung 2.0?
Alle kulturellen Formen, alle Praxen der Menschen, die sich um die jeweils vorherrschenden Leitmedien entwickelten, feiern im Symmedium mit allem Recht ihre Wiederkehr. Vermeintlich drängt nun alles zur Visualisierung inklusive Erklärtext. Manchmal jedoch reicht Text und ein wütender Erzähler, der mit seiner Authentizität in der Form einer Wutrede die Massen bewegt. Das nunmehr legendäre Zerstörer-Video von @rezomusik nannte Christoph Engemann die Rückkehr der Vorlesung. Er erläutert seine Thesen hier im Deutschlandfunk. Nachdem der Medienwissenschaftler festgestellt hat, dass die jungen Studierenden nur noch wenige Bücher gelesen haben, wenn sie zu studieren beginnen, fragt die Interviewerin, ob die jungen Leute heute faul seien (Da ist er wieder, der Vorwurf, der die Jahrhunderte durchzieht, den Versuch einer Visualisierung dazu und einen Text habe ich hier hinterlegt). Dem widerspricht Engemann und in der Folge erkennt die Interviewpartner Shanli Anwar: "Das ist ja eine neue Form der Oralität, und eigentlich ist das Old School ... damit bewegen wir uns eigentlich zurück, wie wir uns Informationen aneignen". Engemann kontert das mit "zurück und vorwärts!". Vermutlich ist diese Antwort sehr nahe an der Wahrheit. In der Kultur der Digitalität (Felix Stalder, @stafel) bewegen wird uns vorwärts, rückwärts und seitwärts durch die Zeit und ihre Leitmedien. Wir können die Gegenwart wohl mit McLuhan als die tertiäre Oralität begreifen (vgl. Frederking, 2012, S. 100). Diese Oralität bedarf nicht mehr bestimmte Mnemotechniken, wie sie in der primären Phase der Oralität entwickelt wurden (vgl. Krommer 2019) und auf die sich die schulische Gegenwart teilweise noch beruft. Zum alles entscheidenden Wissens-Kriterium in der Kultur der Digitalität werden die algorithmisch durchsuchbaren Daten und Metadaten. Die Kommunikations- und Lernpraxen innerhalb der datafizierten Welt beziehen sich daher auf Kompetenzen, Daten und Metadaten zu produzieren und algorithmisch auszulesen.
"Unter Bedingungen der Digitalität ähnelt die Struktur des Wissens nicht mehr einer wohlgeordneten Bibliothek, sondern eher einem Amazon-Warenlager: Hier werden die Artikel nicht – wie Bücher – nach bestimmten Kriterien (Produktkategorie, Größe etc.) sortiert, sondern – wie digitale Dateien – einfach abgelegt und über Metadaten auffindbar gemacht. Die Ordnung im Amazon-Lager ist nur noch für den Algorithmus sichtbar, nicht mehr für den Menschen" (Krommer 2019).
Wir sind nun durch die Digitalisierung (in einem weiten Sinne) in die Lage versetzt, uns an allen Leitmedien der Geschichte zu versuchen, sie in Reinform - wohl aber mit digitalem Schnitt - zu neuen Höchstleistungen zu treiben oder durch Verbindung und Verknüpfung mehrerer medialer Formen auch ästhetisch Neues zu schaffen. Alphabetisierung 2.0? Dazu gehört auch das Dekodieren und Neukodieren der "Nachrichten". In der Kultur der Digitalität besteht das "Lesen können" der Medien darin, v.a. Referentialität und Algorithmizität zu erkennen, zu nutzen und entsprechende Inhalte zu remixen. Vielleicht ist das auch eine Vorstellung, die mit derjenigen von Pörksen zusammenpasst. Der Medienwissenschaftler hat auf der re;publica19 seine Idee der "redaktionellen Gesellschaft" vorstellen können; Pörksen forderte dort u.a. ein Schulfach für die Medienmündigkeit (Sein Vortrag kommt im Übrigen als Vorlesung daher, er vertraut allein der Oralität).
Finde den Fehler!
3. Ausblick: Die Zukunft der (tertiären) Oralität?
Welcher Trend wird sich In der nächsten Dekade wohl durchsetzen? Trends sind Entwicklungen, die bereits begonnen haben und zum Zeitpunkt X in den Vordergrund drängen werden, vielleicht weil der Trend sehr schnell sehr viele Jobs kosten wird oder weil der Trend etwas im Verhalten von sehr sehr vielen Menschen ändern wird. Es ist wohl nicht viel an Glaskugel dabei, wenn man heutet behauptet, dass sich v.a. das folgende Szenario durchsetzen wird: Unterstützt mit machine-learning-Verfahren, werden wir von der Tastatur tatsächlich zur Spracheingabe wechseln, da die Texte beinahe fehlerfrei in das gewünschte Transkript überführt werden. (Und ja, es ist auch eine Tech- und eine Trek-Utopie, die da zur Wirklichkeit drängt: Der Gag ist schließlich schon 1986 gemacht worden: Scotty, mit der Enterprise gerade mal wieder in der Gegenwart des Jahres 1986, um Wale zu retten, schnappt sich eine Computermaus und glaubt an eine Art Mikrofon: "Computer!?"). Dieser Trend wird sich der Tendenz nach vom klassischen Desktop-Computer entkoppeln und auf viele Kleinstcomputer übergehen: Smartphones, Echo Dots, Computer-Uhren u.a. Spezialminicomputer.
Worauf will ich hinaus? In einem der folgenden Blog-Posts will ich mich an zwei weiteren Standardvorwürfen abarbeiten: "Sprachassistenten im Haus? Schlimmer als die Stasi", "Weibliche Stimmen der Sprachassistenten? Fortführung alter Rollenmuster: Das Weibliche ist das dienende Geschlecht!" Im Anschluss daran will ich dann das didaktische Potential ausloten. Meine These dazu lautet: Im aufkommenden digitalintegrierten Zeitalter aller aktuellen und ehemaligen Leitmedien - mit einem bemerkenswerten Anteil der Oralität! - sollte die Begeisterung rund um die "programmierte sprechenden Dose" genutzt werden, um didaktisch sinnvolle Inhalte jenseits aller Fächergrenzen mit Fachinhalten aller Fächer "zu füllen". Die vorliegende Infrastruktur ermöglicht verschieden komplexe Zugänge zum Thema: Hinterlegte (Text)-Routinen, einfach programmierte Wiedergabe-Zufall-Skills, komplexere Abfrage-Skills, Spiele-Skills u.a.m. Diese Richtung könnte eine auf Bildschirme ausgerichtete Alphabetisierung 2.0, in der zunächst alle Aufmerksamkeit darauf gerichtet scheint, vor und mit der Kamera zu performen, sinnvoll ergänzen. Das didaktische Aufgreifen dieses Trends trägt der vermuteten Entwicklungsrichtung der IT Rechnung: Dass das Technische und damit die Computer "hinter" unseren Alltagsgegenstände verschwinden werden (und damit tendenziell auch die Bildschirme). Am Ende dieser Entwicklung vermuten manche, steht das vom Computer befreite Wohnen und ein Leben 2.0: Die Wohnung enthält ein Mikrofon, gerechnet wird in der Cloud und aus der Cloud zurück setzen elektronische Impulse Aktoren unsere Wünsche in Bewegung, Licht und Wärme um.
4. Ende oder Anfang?
Zum Schluss habe ich noch eine Überraschung für alle Blog-Leser*innen parat. Ich habe einen Alexa-Skill geschenkt bekommen. Daher ist es nun möglich, mit der Alexa App auf dem Smartphone oder eben mit einer der "Echo-Dosen" oder einem Sonos-One sich die ersten Teile meines Blog-Beitrag vorlesen zu lassen (die ersten 4000 Zeichen, bald werden es auch mehr). Einfach mal ausprobieren. Ein neuer Anfang. Herzlichen Dank an @LeanderS_DEV!
Literatur:
Christoph Engemann (2019) (18 Tweets, Thread): Die Rückkehr der Vorlesung vom 22. Mai 2019 Twitter, https://twitter.com/NoisyNarrowBand
Christoph Engemann im Gespräch mit Shanli Anwar (2019): Die neue Neugier der Jugend, https://www.deutschlandfunkkultur.de/medienwissenschaftler-ueber-rezo-und-co-die-neue-neugier.2156.de.html?dram:article_id=449853
Volker Frederking, Axel Krommer, Klaus Maiwald (2012): Mediendidaktik. Eine Einführung. (Passagen entnommen aus: Lehrerfortbildung BW).
God (2019) (Tweet): Alexa, end it all!
Axel Krommer (2019): Paradigmen und palliative Didaktik. Oder: Wie Medien Wissen und Lernen prägen, zitiert nach: https://axelkrommer.com/2019/04/12/paradigmen-und-palliative-didaktik-oder-wie-medien-wissen-und-lernen-praegen/#more-1509
Bernhard Pörksen (2019): Abschied vom Netzpessimismus, https://www.youtube.com/watch?v=jVBkM85111Q
Felix Stalder (2016): Kultur der Digitalität, Berlin.