| License: Publishing license for publications including print on demand (7MB) |
- URN to cite this document:
- urn:nbn:de:bvb:355-epub-150585
- DOI to cite this document:
- 10.5283/epub.15058
Item type: | Thesis of the University of Regensburg (PhD) |
---|---|
Open Access Type: | Primary Publication |
Date: | 4 August 2010 |
Referee: | Prof. Dr. Elmar W. Lang and Prof. Dr. Ingo Morgenstern |
Date of exam: | 23 April 2010 |
Institutions: | Biology, Preclinical Medicine > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Elmar Lang |
Interdisciplinary Subject Network: | Not selected |
Keywords: | non-negative matrix factorization, NMF, wafer test data, uniqueness, Bayesian, binary NMF |
Dewey Decimal Classification: | 500 Science > 530 Physics |
Status: | Published |
Refereed: | Yes, this version has been refereed |
Created at the University of Regensburg: | Yes |
Item ID: | 15058 |
Abstract (English)
This PhD thesis investigates the data analysis technique named non-negative matrix factorization (NMF) and its applicability for failure analysis in microchip production. A blind source separation approach is pursued in which the observable wafer test data is interpreted as the result of a superposition of several simultaneously acting and not directly observable failure causes. This thesis was ...

Abstract (English)
This PhD thesis investigates the data analysis technique named non-negative matrix factorization (NMF) and its applicability for failure analysis in microchip production.
A blind source separation approach is pursued in which the observable wafer test data is interpreted as the result of a superposition of several simultaneously acting and not directly observable failure causes.
This thesis was created during a three year cooperation with the Infineon Technologies AG Regensburg company.
The main scientific contributions of this thesis are general theoretic findings and extensions of NMF whose applications are not only restricted to the field of semiconductor industry covered here.
In an introductory chapter the basic principle of the NMF method is explained.
A data matrix consisting of non-negative entries is approximated by the product of a non-negative basis matrix and a non-negative coefficient matrix.
An important, partly unsolved shortcoming of NMF is the existence of several alternative solutions to the same problem.
Geometric considerations explain the problem and offer a possible solution to the uniqueness problem. The here suggested determinant criterion renders the set of (normalized) basis vectors to be optimal which span a minimal volume.
Simulations by means of a new developed algorithm support this statement and point out the difference between the determinant criterion and common sparsity constraints.
Decompositions of non-negative wafer test data by a conventional NMF algorithm are first shown in this thesis. It is discussed that, in a first approximation, the NMF model applies for this kind of data.
While usual NMF algorithms aim the decomposition of non-negative data sets, here also an extension of NMF for binary data is presented which finds direkt application in semiconductor production. The probability that a certain chip passes or fails some special test is modelled by the superposition of several possible failure causes.
A fast optimization procedure is develloped which estimates the non-negative basis and coefficient matrices in a NMF-like fashion.
The last part of the thesis applies Bayesian techniques to answer the two mayor problems of NMF: the optimal solution given the number of basis components and the actual number of underlying basis components. The answers are gained under prior assumptions by integration over all coefficents, and over coefficients and basis components respectively.
The first is exactly solvable in a special case and the result confirms the determinant criterion. The latter integral is approximated by a variational calculation. The herefore developed algorithm is a direct extension of a popular multiplicative NMF algorithm.
Simulations demonstrate that the new algorithm is able to detect the correct number of components in artificial datasets even if the assumed form of the reconstruction error does not coincide with the actual one.
Finally, potential future developments based on this work are proposed.
Translation of the abstract (German)
Die vorliegende Dissertation untersucht das Datenanalyseverfahren der nicht-negativen Matrixfaktorisierung (NMF) und deren Anwendbarkeit zur Fehleranalyse in der Mikrochipproduktion. Dabei wird ein Ansatz zur blinden Quellentrennung verfolgt, bei dem beobachtete Wafertestdaten als Ergebnis der Überlagerung von mehreren gleichzeitig agierenden, nicht direkt beobachtbaren Fehlerquellen ...

Translation of the abstract (German)
Die vorliegende Dissertation untersucht das Datenanalyseverfahren der nicht-negativen Matrixfaktorisierung (NMF) und deren Anwendbarkeit zur Fehleranalyse in der Mikrochipproduktion.
Dabei wird ein Ansatz zur blinden Quellentrennung verfolgt, bei dem beobachtete Wafertestdaten als Ergebnis der Überlagerung von mehreren gleichzeitig agierenden, nicht direkt beobachtbaren Fehlerquellen interpretiert werden.
Die Arbeit entstand während einer dreijährigen Zusammenarbeit mit der Firma Infineon Technologies AG Regensburg.
Die wichtigsten wissenschaftlichen Beiträge dieser Arbeit sind allgemeine theoretische Erkenntnisse und Erweiterungen der NMF, deren Anwendungen nicht nur auf das hier behandelte Gebiet der Halbleiterindustrie beschränkt sind.
In einem einführenden Kapitel wird das Grundprinzip des Verfahrens der NMF erläutert, bei der eine Datenmatrix aus nicht-negativen Einträgen näherungsweise in ein Produkt aus einer nicht-negativen Basismatrix und einer nicht-negativen Koeffizientenmatrix zerlegt wird.
Eine wichtige, teilweise ungelöste Unzulänglichkeit der NMF ist die Existenz mehrerer unterschiedlicher Lösungen des selben Problems.
Mit Hilfe von geometrischen Überlegungen wird das Problem verschiedener Lösungsalternativen erläutert.
Ein Determinantenkriterium wird vorgeschlagen, nach dem diejenige Lösung optimal ist, deren (normierte) Basisvektoren ein minimales Volumen aufspannen.
Simulationen mit einem neu entwickelten Algorithmus stützen diese Aussage und verdeutlichen den Unterschied des Determinantenkriteriums zu üblichen Sparsamkeitskriterien.
Zerlegungen nicht-negativer Wafertestdaten mit einem gewöhnlichen NMF-Algorithmus werden in dieser Arbeit erstmals gezeigt. Es wird diskutiert, dass das NMF-Modell in erster Näherung für diese Art Daten anwendbar ist.
Während gewöhnliche NMF-Algorithmen eine Zerlegung nicht-negativer Datensätze anstreben, wird hier auch eine Erweiterung der NMF für binäre Daten vorgestellt, die direkten Einsatz in der Halbleiterfertigung findet.
Die Wahrscheinlichkeit, dass ein bestimmter chip einen speziellen Test besteht (pass) oder nicht (fail), wird durch die Überlagerung
von mehreren möglichen Fehlerursachen modelliert.
Ein schnelles Optimierungsverfahren wird entwickelt, das die unbekannten nicht-negativen Basis-und Koeffizientenmatrizen ähnlich wie bei der NMF berechnet.
Mit Hilfe von Bayes'schen Methoden werden im letzten Teil der Arbeit zwei wichtige Fragen der NMF beantwortet: die optimale Lösung bei bekannter Anzahl der Basiskomponenten und die tatsächliche Anzahl zugrundeliegender Basiskomponenten.
Die Antworten erhält man per Integration über alle Koeffizienten einerseits, und über alle Koeffizienten und Basiskomponenten andererseits.
Erstgenanntes Integral lässt sich einem Spezialfall exakt lösen und führt zu einer Bestätigung des Determinantenkriteriums.
Letzteres Integral wird mittels einer Variationsmethode angenähert. Der hierfür entwickelte Algorithmus ist eine direkte Erweiterung eines populären multiplikativen NMF-Algorithmus.
Simulationen zeigen, dass der neue Algorithmus die korrekte Anzahl der Quellen in künstlich generierten Datensätzen selbst dann erkennen kann, wenn die angenommene Verteilungsform des Restfehlers nicht mit der tatsächlichen übereinstimmt.
Schliesslich werden auf dieser Arbeit basierende, potentielle zukünftige Entwicklungen vorgeschlagen.
Metadata last modified: 26 Nov 2020 09:17