Hallo Zusammen
Ich habe zwar noch nicht massenweise Daten, aber ich konnte es nicht lassen, habe mich an die erste Analyse gewagt und einen ersten echten Erfolg erzielt!
Da ich noch nicht so viele Aufnahmen habe, habe ich auf YouTube nach weiteren Motoraufnahmen gesucht, welche von der rechten Seite des Motors gemacht wurden (und nicht direkt auf den Auspuff halten

). Ich habe zusätzlich zu den von euch bereits hochgeladenen Aufnahmen sowohl normal klingende Motoren als auch solche mit Auffälligkeiten (z.B. Steuerkettenrasseln) verwendet und damit ein Modell trainiert.
Mein erstes Modell kann mittlerweile mit über 90% Sicherheit sagen, ob es sich bei einer Audioaufnahme um einen rund laufenden S1000 Motor im Leerlauf handelt oder nicht.
Wie funktioniert das Ganze? (Für die Technik-Interessierten
)Mein KI-Modell basiert auf einem sogenannten „Convolutional Autoencoder“. Man kann sich das wie einen extremen Kompressor vorstellen:
- Die KI nimmt 1-sekündigen Schnipsel des Spektrums vom Motorgeräusch
- Es quetscht diese Information durch einen „Flaschenhals“ und komprimiert ihn auf gerade einmal 256 Zahlen.
- Danach versucht die KI, aus diesen wenigen Zahlen das komplette Geräusch wieder originalgetreu aufzubauen.
Der Clou dabei:
Ich habe die KI ausschließlich mit „normal“ klingenden Aufnahmen im Leerlauf trainiert. Das Modell hat also gelernt, was die charakteristischen Merkmale eines gesund laufenden S1000-Motors sind. Da ich Aufnahmen von verschiedenen Maschinen an unterschiedlichen Orten und mit diversen Aufnahmegeräten (verschiedene Handys, YouTube) verwendet habe, musste die KI im Training einen Weg finden, sich rein auf die mechanischen Merkmale zu konzentrieren und störende Nebengeräusche oder unterschiedliche Aufnahmequalitäten auszublenden. Das Modell kennt nun also das „Idealbild“ einer gesunden S1000. Spiele ich ihr einen gesunden Motor vor, erkennt sie die Muster sofort und kann das Geräusch fast fehlerfrei rekonstruieren. Der Unterschied zum Original ist verhältnismässig klein. Wenn der Motor aber rasselt oder tickert (Anomalie), kennt die KI diese Frequenzbänder nicht. Sie versucht zwar, das Geräusch nachzubauen, scheitert aber an den ihr unbekannten Defekt-Mustern. Die Rekonstruktion weist dann massive Unterschiede zum Originalbild auf, und genau diesen Unterschied nutze ich als Indikator für einen Defekt.

- Rekonstruktion einer Maschine im normalen Zustand (https://www.youtube.com/watch?v=B2tEtrTPdiA)

- Rekonstruktion einer Maschine mit Steuerkettenrasseln (https://www.youtube.com/watch?v=E2wloCgHSsk)
Um nun objektiv festzulegen, ab wann ein Geräusch als „verdächtig“ gilt, habe ich alle Aufnahmen von normal laufenden Motoren statistisch ausgewertet. Der durchschnittliche Anomaliewert dieser intakten Motoren dient mir als Baseline (Nullpunkt).
Daraus ergibt sich ein Schwellenwert: In meinen Tests liegt der Grenzwert (Threshold) beim 2.3-fachen des normalen Werts. Das bedeutet: Ein Motor, der verdächtig klingt, weist eine mehr als doppelt so hohe Abweichung vom gelernten Idealzustand auf wie eine gesunde Maschine.
Damit das System nicht bei jedem kleinen Knacken oder einem Windstoss sofort von einem Defekt ausgeht, wird das Ganze zeitlich geglättet: Es wird ein gleitendes Fenster von 2 Sekunden analysiert, und erst wenn der Wert im gesamten Zeitraum im Schnitt zu hoch ist, wird eine Auffälligkeit erkannt.
Das Ergebnis ist eine einfache Ja/Nein-Aussage:
- Unter dem Grenzwert: Alles im grünen Bereich, eine typische, intakte S1000 im Leerlauf.
- Über dem Grenzwert: Hier stimmt etwas nicht. Das Geräusch passt nicht zur gelernten Signatur, sprich der Motor ist entweder defekt (z.B. Steuerkette), befindet sich nicht im Leerlauf oder es ist schlichtweg keine S1000, die da gerade aufgenommen wurde.
Hier noch wie sich der Wert im Verlauf einer etwas längeren Sequenz verändert. Bei der ersten, intakten Maschine bewegt sich der Wert konstant unter dem Grenzwert, bei der zweiten, mit Steuerkettenrasseln, überhalb. Ich verwende dazu nochmals die Audios aus den Youtube Videos.

- Audiosequenz und zeitlicher Verlauf des relativen Anomaliewerts einer Maschine im normalen Zustand (https://www.youtube.com/watch?v=B2tEtrTPdiA)

- Audiosequenz und zeitlicher Verlauf des relativen Anomaliewerts einer Maschine mit Steuerkettenrasseln (https://www.youtube.com/watch?v=E2wloCgHSsk)
Falls du bis hierhin alles gelesen hast und gerne mehr Details erfahren würdest, schreib mir gerne eine PN.
Wichtig: Dies ist erstmal ein erster Test welcher die technische Machbarkeit untersuchen soll und zeigt, dass durchaus wertvolle Informationen in der Audioaufnahme stecken. Um das Modell robuster und präziser zu machen, brauche ich noch mehr Daten (und mehr Zeit zum auswerten

). Ich bin also weiterhin froh um Jeden der mithilft und mir seine Soundaufnahme zur Verfügung stellt (
https://docs.google.com/forms/d/e/1FAIpQLSfpC9IXAKtZKIMNOgR30QmngFVF0dhpYptg2HJSjfL1C4RGEA/viewform?usp=header).
Gruss und schönes WE
Philip