Studies of top tagging identification methods and development of a new heavy object tagger

Author: 
Tobias Lapsien
Date: 
Apr 2016

Thesis Type:

At the Large Hadron Collider (LHC), precision tests of the standard model of particle physics and searches for new phenomena are performed. To make optimal use of the proton-proton collisions delivered by the LHC and its increasing collision rate, both the detectors and the reconstruction algorithms have to be optimized. The identification of heavy quarks is a key component in many measurements. This thesis describes a hardware and a software project which both aim at improving the identification of heavy quarks.
In the first part of this thesis, the Phase 1 upgrade of the CMS pixel detector is introduced. One of the main motivations of the replacement of the Pixel detector is the improved b jet identification at large collision rates. The Phase 1 upgrade involves several production and calibration steps. An x-ray calibration procedure has been developed and the corresponding experimental setup is described. Measurements show that the calibration of the pixel modules is temperature independent and can be performed at room temperature. The stability of the setup is tested in order to fulfill the requirements for mass production of the pixel modules. A method to stabilize the calibration is introduced which is shown to reduce the systematic uncertainty.
In the second part, algorithms to identify heavily boosted top quarks (“top tagger”) are described and their performance is compared. The OptimalR HEP top tagger and the shower deconstruction tagger show a better performance than existing tagging algorithms. They can be used in Run II with increased centre-of-mass energies of 13 and 14TeV. It is also shown that existing top tagging algorithms can be improved by the usage of multivariate analysis methods. New algorithms are commissioned using CMS data with a centre-of-mass energy of 8 TeV, corresponding to an integrated luminosity of 19.7fb$^{−1}$. In order to validate these new algorithms in data, two selections are made to measure the efficiency and mistag rate. The selections aim at enriching one sample with tt events and one with QCD multijet events.
In the last part of this thesis, a novel top tagging algorithm is introduced. It is capable of identifying top quarks over a large $p_T$ range by using a $p_T$ dependent jet size and a method to reconstruct subjets based on a mass jump criterion. The algorithm includes the possibility to remove soft and collinear radiation from the jet. The algorithm is infrared and collinear safe, has a reasonable computational time, and shows a good performance with respect to existing algorithms. The performance of the new algorithm is also investigated on 8 TeV data.

Am Large Hadron Collider (LHC) werden Präzisionsmessungen des Standardmodells der Teilchenphysik und Suchen nach neuer Physik durchgeführt. Um die Proton-Proton Kollisionen des LHC und die erhöhte Kollisionsrate optimal nutzen zu können, müssen Detektorkomponenten und Rekonstruktionsalgorithmen optimiert werden. Die Identifikation von schweren Quarks ist eine Schlüsselkompente für viele Messungen. Diese Arbeit beschreibt ein Hardware- und ein Softwareprojekt, welche darauf zielen, die Identifikation von schweren Quarks zu verbessern.
Im ersten Teil dieser Arbeit wird das Phase-1-Upgrade des CMS Detektors vorgestellt. Eine der Hauptmotivationen für den Neubau des Pixel-Detektors ist die daraus resultierende verbesserte b-Quark-Identifikation bei hohen Kollisionsraten. Das Phase-1-Upgrade umfasst verschiedene Produktions-und Kalibrationsprozesse. Eine Röntgen-Kalibration wurde entwickelt und der dazugehörige Versuchsaufbau wird beschrieben. Messungen zeigen, dass die Kalibration der Pixelmodule unabhängig von der Temperatur ist und dass diese bei Raumtemperatur durchgeführt werden kann. Die Stabilität des Versuchaufbaus wird getestet, um die Anforderungen für eine Massenproduktion der Pixelmodule zu erfüllen. Eine Methode zur Stabilisierung der Kalibration wird erläutert, welche die systematischen Unsicherheiten deutlich verringert.
Im zweiten Teil dieser Arbeit werden neue Algorithmen zur Identifikation von Top- Quarks (“Top-Tagger”) beschrieben und deren Leistungsfähigkeit verglichen. Die Leistungsfähigkeit des OptimalR-HEP-Top-Taggers und die des Shower-Deconstruction-Taggers uübertrifft die Leistungsfähigkeit von existierenden Top-Tagging-Algorithmen. Diese Algorithmen können in Run II des LHCs mit einer erhöhten Schwerpunktsenergie von 13 bzw. 14 TeV benutzt werden. Weiterhin wird gezeigt, dass eine Verbesserung des Top-Tagging durch die Benutzung von mulivariaten Methoden und der Benutzung von Substruktur-Variablen möglich ist. CMS-Daten mit einer Schwerpunktsenergie von 8 TeV und einer integrierten Luminosität von 19.7fb$^{−1}$ werden benutzt, um diese neuen Algorithmen zu valideren. Dafür werden zwei Selektionen zur Messung der Effizienz und der Fehlidentifikatinsrate benutzt. Diese beiden Selektionen reichern je einen Datensatz mit tt-Ereignissen und einen anderen mit QCD Multijet Ereignissen an.
Im letzten Teil dieser Arbeit wird ein neuer Top-Tagging-Algorithms beschrieben, welcher imstande ist, Top-Quarks über einen großen $p_T$ Bereich mit Hilfe eines $p_T$-abhängigen Jet-Distanz-Parameters zu identifizieren. Dieser Algorithmus benutzt eine Methode zur Rekonstruktion von Subjets, die auf einem Massensprung Kriterium basiert. Weiche Abstrahlungen werden zusätzlich während des Cluster-Prozesses entfernt. Der Algorithmus ist infrarot- und kollinear sicher, benötigt wenig Rechenzeit und zeigt eine gute Leistungsfähigkeit im Vergleich zu bereits existierenden Algorithmen. Die Leistungsfähigkeit wird auch in 8 TeV Daten untersucht.

AttachmentSize
PDF icon PhD_Lapsien_final.pdf18.93 MB