KI wird in den kommenden Jahren die Art, wie wir arbeiten, radikal verändern. Entsprechende Anwendungen werden geradezu explodieren, zuerst in Form von schwachen, später aber immer mehr auch in der Gestalt von komplexen Anwendungen.
Wenn ich heute eine Prognose ins Blaue hinaus abgeben müsste, dann würde ich sagen, dass diese theoretisch bereits in sehr wenigen Jahren möglich wären. In der Realität wird es aber wohl eher 10-15 Jahre dauern, bis z.B. die folgenden drei Anwendungen völlig alltäglich sein werden.
1. System-Einmessungen und virtualisierte Messpositionen
Ich vertrete schon seit einigen Jahren die These - und habe das auch an Seminaren und Vorträgen eingehender erläutert -, dass die Einmessung eines Systems ohne weiteres von einer KI vorgenommen werden kann. Mit einem sehr viel besseren und konsistenteren Ergebnis, als es selbst der beste und erfahrenste Techniker zustande bringt. Wenn das heute jemand wollte und anfangen würde, liesse sich ein solches System ohne weiteres innerhalb von zwei bis drei Jahren realisieren. Dazu kommt noch ein weiterer KI-Aspekt: in Zukunft werden nur noch sehr wenige Positionen real gemessen werden, vielleicht je nach Fall zwei, drei oder vier- irgendwann nur noch eine einzige oder auch gar keine mehr! Diese realen Daten werden durch beliebig viele virtualisierte Mikrofon-Positionen ergänzt, die durch die KI generiert werden.
2. Virtualisierte Bühnen-Mikrofone
Mikrofone wie sie heute genutzt werden sind ein Anachronismus und beruhen auf einem technischen Verständnis, das gefühlt aus der Steinzeit stammt. In Zukunft wird man nur noch sehr wenige - oder vielleicht auch nur ein einziges oder gar keines? - Mikrofon auf einer Bühne nutzen. Die einzelnen Mikrofone, die wir heute einsetzen, werden dann rein virtuell erzeugt. Und zwar in einer Qualität, wie sie heute völlig undenkbar ist - alleine schon dadurch, dass man eine 100%ig Kanaltrennung, ohne jegliches Übersprechen realisieren kann.
3. Autonomes Mischen
Die Mischung einer Show beruht letztlich auf einer in ihrem Kern ausgesprochen trivialen Eingangs-Ausgangs-Logik. Diese Vorstellung mag für diejenigen Techniker beschämend sein, die glauben, ihre Arbeit sei knapp unterhalb der Raketentechnik angesiedelt oder doch mindestens so individuell, wie die eigene Persönlichkeit. Dies hält aber einer näheren Betrachtung nicht stand. Was bereits erläutert wurde:
Ein Mischpult macht aus elektrischen Signalen elektrische Signale. Das ist im Gegensatz zum Auto lächerlich einfach für Machine Learning.
Um einige weiteren Gegenargumente zu entkräften:
was wir im realen leben aber machen, ist den mix nicht nur auf die gebotene hallenakustik anzupassen, sondern auch auf tagesformen sowohl der künstler als auch des publikums. es ist nicht immer der selbe mix, den man anbietet. man reagiert auf das umfeld und integriert die angebotenen signale in ein gesamtergebnis.
Das ist unbestritten richtig. Diese Variationen folgen letztlich aber ebenfalls nur einer recht simplen formalen Logik (auch wenn man das als Mensch natürlich nicht bewusst so wahrnimmt und empfindet). Das Ziel besteht letztlich darin, anhand wechselnder Umgebungsvariablen einen einigermassen konsistenten Output zu generieren. Es gibt keinen Grund, anzunehmen, dass dies nicht auch von einer KI gelernt und repliziert werden kann. KI ist übrigens auch schon richtig gut darin, anhand von verschiedenen Markern Emotionen zu interpretieren; es spricht nichts dagegen, auch solche Variablen einzubeziehen.
Und vor dem "ich guck dem Profi mal über die Schulter" muss dem Ding erst einmal ein psychoakustisch dem Mensch gleichwertiges Hörempfinden sowie optimalerweise ein paar Basics in Signaltheorie und raumakustischem Vorstellungsvermögen eingepflanzt werden.
Dem möchte ich vehement widersprechen! Eine selbstmischende KI muss letztlich nichts anderes tun als Antworten auszuspucken wie: "in einem vergleichbaren Kontext, haben in der Vergangenheit 8 von 10 Tontechnikern an diesem und jenem Instrument folgende Kanaleinstellungen vorgenommen". Dazu muss sie weder hören können wie ein Mensch noch irgendwelche physikalischen Gesetzmässigkeiten verstehen. Sie muss nur Korrelationen herstellen und Daten statistisch auswerten.
Der individuelle Techniker wird kaum mit all diesen Vorschlägen einverstanden sein. Dann überschreibt er sie einfach, das ist der KI völlig egal. Im Idealfall ist so lernfähig und personalisierbar, dass sie sich merkt, wo sie übersteuert wird und kann dies bei zukünftigen Entscheidungen mitberücksichtigen und sich so dem Endergebnis eines individuellen Menschen immer mehr annähern.
Raumakustik: natürlich kann man auch diese Korrelations-Argumente einfliessen lassen. Es ist dazu noch nicht einmal nötig, dass man der KI eine akustische Messung zuführt, weil sich - wiederum mithilfe von KI und virtualisierten Messmikrofonen - alle akustisch relevanten Parameter schon aus den Kanal-Daten extrahieren lassen, die ohnehin vorhanden sind.
Zu den Trainingsdaten: Je mehr Erfahrungen ein Tontechniker hat, mit unterschiedlichen Musikstilen, Instrumentierungen, Arrangements, Raum- und Publikumssituationen etc. pp. desto besser. Statistisch gesehen wird es z.B. immer unwahrscheinlicher, dass er plötzlich vor einer Situation steht, die er nicht zumindest in ähnlicher Form schon einmal vor sich hatte.
In vergleichbarer Weise gilt dies auch für jede Art statistischer Analyse und eine KI macht im wesentlichen nichts anderes: je grösser die Datenbasis ist, desto verlässlicher wird das Ergebnis. Eine KI braucht deshalb EXTREM viele Daten, um in möglichst vielen Fällen einen qualitativ guten Output zu generieren. Gerade weil die KI nicht denkt, muss sie gegenüber einem Menschen ein Vielfaches an Daten zur Verfügung haben, um zu vergleichbar guten Entscheidungen zu kommen.
Wenn ich Mischpulthersteller wäre, dann würde ich mir deshalb HEUTE überlegen, wie ich in den kommenden Jahren mindestens mal möglichst viele Daten sammeln kann. Das ist verhältnismässig einfach und kostengünstig zu realisieren. Erforderlich ist aber eine längerfristige Vision. Die Wahrscheinlichkeit, dass mal jemand damit anfängt, wird im Laufe der kommenden Jahren sicher auch exponentiell zunehmen. Vielleicht kommt der Impuls dazu auch nicht von einem der etablierten Hersteller, sondern eher von einem externen Start-Up/Spin-Off.
Grosse Techfirmen haben es ja vorgemacht: man hat frühzeitig erkannt, dass es einen enormen Wettbewerbsvorteil bringt, wenn man anfängt umfangreiche Daten zu sammeln (Experten gehen davon aus, dass der diesbezügliche Vorsprung einer Handvoll Unternehmen heute so gross ist, dass er praktisch nicht mehr aufzuholen ist). Diese Erkenntnis und die daraus folgenden Entscheidungen kamen lange, bevor die Konzerne überhaupt eine Vorstellung davon hatten, WOZU GENAU die Daten dereinst überhaupt verwendet werden sollen.
Umgekehrt proportional zu den exponentiell ansteigenden KI-Anwendungen in allen Lebensbereichen, werden sich auch die Kosten für solche Applikationen entwickeln. Es ist z.B. nicht nötig, eine "PA-KI-Eigenentwicklung" von Grund auf zu finanzieren, weil man auf bestehende Systeme aufsetzen kann, die zwar vielleicht aus völlig anderen Anwendungsbereichen kommen, aber auf formal ähnlichen Korrelations-Logiken beruhen. Je mehr KI-Anwendungen es gibt, desto grösser wird die Wahrscheinlichkeit, dass es irgendwo ein Modell gibt, dass mit ganz wenigen Anpassung übernommen werden kann. Der Rest der Kosten wird dann wohl über ein Pay-Per-Use/Abo-Modell abgewälzt. Ein Trend, der m.E. auch abseits von KI eine zunehmende Bedeutung erlangen wird, aber das wäre dann ein anderes spannendes Thema.
bis jetzt sehe ich hier nur gegenargumente, die auch ähnlich damals gegen die digital pulte vorgebracht wurden und die linearrays 
Das sehe ich ganz genauso. Das Forum ist voll von kleineren und grösseren Beispielen, die das belegen. Das hat mich schon immer sehr erstaunt: in der Regel waren die Techniken in anderen Bereichen bereits seit Jahrzehnten(!) erfolgreich im Einsatz, bevor dann die PA-Branche auch noch gemeint hat, sie hätte jetzt gerade etwas bahnbrechend Neues entdeckt. Mit KI wird es sich genau gleich verhalten.
Ich nenne hier nur mal zwei von vielen Beispielen aus dem Audio-Bereich: Hörgeräteakustik und Audio-Forensik. Wenn man sich anschaut, wo da die KI-Reise hingeht, dann müsste es eigentlich offensichtlich sein, dass sich vieles davon mit mehr oder minder grossen Modifikationen auch für komplexe KI-Anwendungen im PA-Bereich nutzen lässt. Es braucht schon einen enormen Tunnelblick und eine gehörige Portion Ignoranz, um das nicht zu sehen.
Fazit: Dass wir in den kommenden Jahren auch im PA-Bereich eine Explosion von - immer stärkeren - KI-Anwendungen erleben werden, steht für mich völlig ausser Frage. Auf welche Bereiche sich das erstreckt und wann was kommt, wird man sehen. Ich glaube aber, dass zumindest einiges viel schneller gehen wird, als sich das heute noch viele vorstellen können.