Extensions of non-negative matrix factorization and their application to the analysis of wafer test data

URN zum Zitieren dieses Dokuments:: urn:nbn:de:bvb:355-epub-150585
DOI zum Zitieren dieses Dokuments:: 10.5283/epub.15058

Schachtner, Reinhard

Vorschau

Lizenz: Veröffentlichungsvertrag für Publikationen mit Print on Demand
PDF
(7MB)

Veröffentlichungsdatum dieses Volltextes: 04 Aug 2010 13:37

Details

Dokumentenart:	Hochschulschrift der Universität Regensburg (Dissertation)
Open Access Art:	Primärpublikation
Datum:	4 August 2010
Begutachter (Erstgutachter):	Prof. Dr. Elmar W. Lang und Prof. Dr. Ingo Morgenstern
Tag der Prüfung:	23 April 2010
Institutionen:	Biologie und Vorklinische Medizin > Institut für Biophysik und physikalische Biochemie > Prof. Dr. Elmar Lang
Themenverbund:	Nicht ausgewählt
Stichwörter / Keywords:	non-negative matrix factorization, NMF, wafer test data, uniqueness, Bayesian, binary NMF
Dewey-Dezimal-Klassifikation:	500 Naturwissenschaften und Mathematik > 530 Physik
Status:	Veröffentlicht
Begutachtet:	Ja, diese Version wurde begutachtet
An der Universität Regensburg entstanden:	Ja
Dokumenten-ID:	15058

Vorschau

Bibliographische Daten exportieren

Zusammenfassung (Englisch)

Zusammenfassung (Englisch)

This PhD thesis investigates the data analysis technique named non-negative matrix factorization (NMF) and its applicability for failure analysis in microchip production.
A blind source separation approach is pursued in which the observable wafer test data is interpreted as the result of a superposition of several simultaneously acting and not directly observable failure causes.
This thesis was created during a three year cooperation with the Infineon Technologies AG Regensburg company.
The main scientific contributions of this thesis are general theoretic findings and extensions of NMF whose applications are not only restricted to the field of semiconductor industry covered here.

In an introductory chapter the basic principle of the NMF method is explained.
A data matrix consisting of non-negative entries is approximated by the product of a non-negative basis matrix and a non-negative coefficient matrix.

An important, partly unsolved shortcoming of NMF is the existence of several alternative solutions to the same problem.
Geometric considerations explain the problem and offer a possible solution to the uniqueness problem. The here suggested determinant criterion renders the set of (normalized) basis vectors to be optimal which span a minimal volume.
Simulations by means of a new developed algorithm support this statement and point out the difference between the determinant criterion and common sparsity constraints.

Decompositions of non-negative wafer test data by a conventional NMF algorithm are first shown in this thesis. It is discussed that, in a first approximation, the NMF model applies for this kind of data.

While usual NMF algorithms aim the decomposition of non-negative data sets, here also an extension of NMF for binary data is presented which finds direkt application in semiconductor production. The probability that a certain chip passes or fails some special test is modelled by the superposition of several possible failure causes.
A fast optimization procedure is develloped which estimates the non-negative basis and coefficient matrices in a NMF-like fashion.

The last part of the thesis applies Bayesian techniques to answer the two mayor problems of NMF: the optimal solution given the number of basis components and the actual number of underlying basis components. The answers are gained under prior assumptions by integration over all coefficents, and over coefficients and basis components respectively.
The first is exactly solvable in a special case and the result confirms the determinant criterion. The latter integral is approximated by a variational calculation. The herefore developed algorithm is a direct extension of a popular multiplicative NMF algorithm.
Simulations demonstrate that the new algorithm is able to detect the correct number of components in artificial datasets even if the assumed form of the reconstruction error does not coincide with the actual one.
Finally, potential future developments based on this work are proposed.

Übersetzung der Zusammenfassung (Deutsch)

Die vorliegende Dissertation untersucht das Datenanalyseverfahren der nicht-negativen Matrixfaktorisierung (NMF) und deren Anwendbarkeit zur Fehleranalyse in der Mikrochipproduktion.
Dabei wird ein Ansatz zur blinden Quellentrennung verfolgt, bei dem beobachtete Wafertestdaten als Ergebnis der Überlagerung von mehreren gleichzeitig agierenden, nicht direkt beobachtbaren Fehlerquellen interpretiert werden.
Die Arbeit entstand während einer dreijährigen Zusammenarbeit mit der Firma Infineon Technologies AG Regensburg.
Die wichtigsten wissenschaftlichen Beiträge dieser Arbeit sind allgemeine theoretische Erkenntnisse und Erweiterungen der NMF, deren Anwendungen nicht nur auf das hier behandelte Gebiet der Halbleiterindustrie beschränkt sind.

In einem einführenden Kapitel wird das Grundprinzip des Verfahrens der NMF erläutert, bei der eine Datenmatrix aus nicht-negativen Einträgen näherungsweise in ein Produkt aus einer nicht-negativen Basismatrix und einer nicht-negativen Koeffizientenmatrix zerlegt wird.

Eine wichtige, teilweise ungelöste Unzulänglichkeit der NMF ist die Existenz mehrerer unterschiedlicher Lösungen des selben Problems.
Mit Hilfe von geometrischen Überlegungen wird das Problem verschiedener Lösungsalternativen erläutert.
Ein Determinantenkriterium wird vorgeschlagen, nach dem diejenige Lösung optimal ist, deren (normierte) Basisvektoren ein minimales Volumen aufspannen.
Simulationen mit einem neu entwickelten Algorithmus stützen diese Aussage und verdeutlichen den Unterschied des Determinantenkriteriums zu üblichen Sparsamkeitskriterien.

Zerlegungen nicht-negativer Wafertestdaten mit einem gewöhnlichen NMF-Algorithmus werden in dieser Arbeit erstmals gezeigt. Es wird diskutiert, dass das NMF-Modell in erster Näherung für diese Art Daten anwendbar ist.

Während gewöhnliche NMF-Algorithmen eine Zerlegung nicht-negativer Datensätze anstreben, wird hier auch eine Erweiterung der NMF für binäre Daten vorgestellt, die direkten Einsatz in der Halbleiterfertigung findet.
Die Wahrscheinlichkeit, dass ein bestimmter chip einen speziellen Test besteht (pass) oder nicht (fail), wird durch die Überlagerung
von mehreren möglichen Fehlerursachen modelliert.
Ein schnelles Optimierungsverfahren wird entwickelt, das die unbekannten nicht-negativen Basis-und Koeffizientenmatrizen ähnlich wie bei der NMF berechnet.

Mit Hilfe von Bayes'schen Methoden werden im letzten Teil der Arbeit zwei wichtige Fragen der NMF beantwortet: die optimale Lösung bei bekannter Anzahl der Basiskomponenten und die tatsächliche Anzahl zugrundeliegender Basiskomponenten.
Die Antworten erhält man per Integration über alle Koeffizienten einerseits, und über alle Koeffizienten und Basiskomponenten andererseits.
Erstgenanntes Integral lässt sich einem Spezialfall exakt lösen und führt zu einer Bestätigung des Determinantenkriteriums.
Letzteres Integral wird mittels einer Variationsmethode angenähert. Der hierfür entwickelte Algorithmus ist eine direkte Erweiterung eines populären multiplikativen NMF-Algorithmus.
Simulationen zeigen, dass der neue Algorithmus die korrekte Anzahl der Quellen in künstlich generierten Datensätzen selbst dann erkennen kann, wenn die angenommene Verteilungsform des Restfehlers nicht mit der tatsächlichen übereinstimmt.
Schliesslich werden auf dieser Arbeit basierende, potentielle zukünftige Entwicklungen vorgeschlagen.

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

Downloadstatistik

Weitere Literatur (mittels CORE)

Details

Vorschau

Bibliographische Daten exportieren

Zusammenfassung (Englisch)

Zusammenfassung (Englisch)

Übersetzung der Zusammenfassung (Deutsch)

Übersetzung der Zusammenfassung (Deutsch)

Downloadstatistik

Downloads

Weitere Literatur (mittels CORE)

Universitätsbibliothek