Informationen zur Anzeige:
Wissenschaftliche Abschlussarbeit - Fraunhofer x 50Hertz
Fraunhofer IEE
Kassel
Aktualität: 15.05.2025
Anzeigeninhalt:
15.05.2025, Fraunhofer IEE
Kassel
Wissenschaftliche Abschlussarbeit - Fraunhofer x 50Hertz
Aufgaben:
Im Rahmen einer gemeinsamen Abschlussarbeit bieten das Fraunhofer IEE und 50Hertz die Möglichkeit, an einer hochaktuellen Fragestellung mitzuarbeiten: Vergleichende Analyse LLM-basierter Klassifizierungsmethoden von Schadensmeldung zur Aufbereitung semi-strukturierter Instandhaltungsdaten - Steigerung der Datenqualität von Schadensmeldungen zur Implementierung datengetriebener Entscheidungsprozesse im Netzbetrieb der 50Hertz Transmission GmbH. Problemstellung: Das digitale System »MAFID« bei 50Hertz unterstützt die Instandhaltung und das Assetmanagement durch die Planung, Dokumentation und Auswertung von Maßnahmen an technischen Anlagen. Ein zentrales Problem stellt die unpräzise Kategorisierung von Schäden dar: Etwa ein Drittel der knapp 20.000 Schadensmeldungen ist mit »Sonstiges« oder »Nicht zugeordnet« gekennzeichnet, obwohl oft passende Kategorien vorhanden wären. Dies beeinträchtigt sowohl die operative Instandhaltungsplanung als auch strategische Analysen im Assetmanagement. Zielstellung und Themenaspekte: Entwicklung und vergleichende Analyse verschiedener LLM-basierter Ansätze zur Klassifikation von Schadensmeldungen nach Schadenscodes und Steigerung der Datenqualität von Schadensmeldungen. Zur Bearbeitung dieser Zielstellung sollten weiterhin folgende Themenfelder bzw. Leitfragen beantwortet werden: 1. Datenanalyse und -bereinigung Wie viele der Schadensmeldungen weisen den Schadenscode "Sonstige-Sonstige" bzw. »Nicht zugeordnet« auf? Lassen sich Muster mit Blick auf bestimmte Betriebsmittel oder den verantwortlichen Arbeitsplatz erkennen? Welche Schadenscodes eines Betriebsmittels lassen sich zu sinnvollen Schadenscodegruppen zusammenfassen (Beispiel: "Ölstand" vs. "Ölstand und Dichtigkeit")? 2. IST- Prozessanalyse Was sind Schwächen im aktuellen Prozess der Erfassung von Mangelmeldungen, die zu einer verminderten Datenqualität führen könnten? 3. Grundlagentheoretische Einordnung Welche LLM-basierten Klassifizierungsansätze existieren, um unstrukturierte Textinformationen in strukturierte Schadenscodes zu überführen? Wie lassen sich Schadenscodes mit wenig Trainingsbeispielen zuordnen (z.B. durch Few-Shot/Zero-Shot-Learning-Ansätze)? Was sind die Vor- und Nachteile der Ansätze mit Blick auf den betrachteten Anwendungsfall bzw. die verfügbare Datenlage und -struktur? 4. Validierung Anwendung ausgewählter Ansätze/Modelle zum Training mit verfügbaren Trainingsdaten bzw. Adaption auf das zugrundeliegende Problemfeld Vergleichende Analyse der Ansätze und Modelle unter Verwendung geeigneter Evaluierungsmetriken 5. Handlungsempfehlungen Welcher der validierten Ansätze ist unter Berücksichtigung der Validierungsergebnisse sowie weiterer Faktoren (Komplexität, Bedarf an Trainingsdaten, Integrationsfähigkeit, etc.) am geeignetsten zur Lösung der beschriebenen Problemstellung? Wie wird die Machbarkeit der Integration entwickelter Lösungsansätze in den Bestandsprozess und unter Berücksichtigung der IT-Infrastruktur eingeschätzt? Was sind mögliche Handlungsempfehlungen zur kontinuierlichen Verbesserung der Datenqualität?
Qualifikationen:
Studium der Informatik, Mathematik, Energietechnik oder eines vergleichbaren Studiengangs Grundlegende Kenntnisse der Programmiersprache Python Gute Kenntnisse in mindestens einem der folgenden Bereiche: Maschinelles Lernen, Datenanalyse, Softwareentwicklung, Natural Language Processing, Large Language Models Kenntnisse eines Deep Learning Frameworks (z. B. PyTorch, PyTorch Lightning, TensorFlow oder Keras) sind wünschenswert Hohes Maß an Eigeninitiative und selbstständiger, strukturierter Arbeitsweise
Standorte