Investigadors de l’IFIC participen en el desenvolupament d’un sistema d’accés a les dades de l’LHC més ràpid i eficaç

D'esquerra a dreta, José Salt, Santiago González, Álvaro Fernández i Javier Sánchez.

Investigadors de l’IFIC treballen en el desenvolupament d’un nou sistema de catalogació i accés a les dades de l’experiment ATLES, un dels dos grans detectors del Gran Col·lisionador d’Hadrons (LHC) del CERN, on es va descobrir el bosó d’Higgs. El sistema, que s’implementarà en 2015 quan es reprenga el funcionament de l’LHC, utilitza tecnologies de codi lliure per millorar tant el sistema de classificació de les col·lisions entre partícules subatòmiques com l’accés posterior a les dades.

El sistema consisteix en una sèrie de programes informàtics que permeten una cerca més ràpida i eficaç entre els milers de milions de col·lisions de partícules registrades en els experiments de l’LHC. Quan els feixos carregats de protons xoquen en els quatre punts on se situen els detectors ATLES, CMS, ALICE i LHCb, aquestes enormes màquines realitzen milions de fotografies per segon d’allò que succeeix en el seu interior i que els físics anomenen ‘successos’ o ‘esdeveniments’. Entre aquests, molt rares vegades es produeix algun bosó d’Higgs, l’última peça que faltava per descobrir del Model Estàndard de Física de Partícules. Els científics van haver de cercar entre tots els successos registrats per a confirmar la seua existència. 
 
Els dos grans experiments de l’LHC –ATLES i CMS– acumulen més de 2.000 milions de col·lisions registrades des de l’inici de l’LHC en 2010, quantitat que s’espera incrementar en un factor cinc en el pròxim cicle de funcionament de l’accelerador del CERN, que comença en 2015 després de dos anys de parada tècnica. La idea de cercar una agulla en un paller es queda menuda en aquest cas. “A més ens trobem amb que l’anterior sistema de classificació i accés als successos tenia inconvenients que feien que molt pocs investigadors en feren ús”, assegura Santiago González de la Hoz, professor de la Universitat de València a l’IFIC i un dels participants en el projecte.
 
El sistema anterior usava un programari propietari, que requereix el pagament de llicències d’ús i que, a més, no estava preparat per a l’al·luvió de dades que s’espera amb un LHC funcionant a quasi el doble de l’energia anterior. “El nou sistema és més ràpid perquè permet diferents nivells d’accés a la informació de cada succés, des de les dades ‘en brut’ fins als més orientats a la cerca concreta de fenòmens físics”, descriu José Salt Cairols, professor de recerca del CSIC a l’IFIC i responsable del grup de GRID i i-Ciència del centre. La diferència entre cercar un llibre a partir de dades concretes (autor, editorial) o haver de llegir primer tots els llibres emmagatzemats.
 
Va sorgir així en 2013 un projecte (Event Index Project) per a crear un sistema que millorara aquesta situació. Per a açò utilitza tecnologies NoSQL com la base de dades Hadoop, de codi lliure. “Aquest sistema ens permet adaptar la classificació dels successos a les necessitats dels científics”, argumenta González de la Hoz, guardant per a la seua classificació les dades veritablement rellevants de cada col·lisió sense necessitat d’utilitzar una altra informació que retardaria la cerca.
 
Aquest sistema canvia la mateixa manera de classificar les col·lisions mentre es produeixen. Amb l’anterior sistema, la classificació es realitzava offline, una vegada que s’havia registrat i emmagatzemat la col·lisió, mentre que el nou mètode en el qual treballen els científics valencians permet la classificació quan es produeixen els xocs entre partícules. “Açò augmenta la complexitat del treball, ja que cal desenvolupar un programa que permeta comprovar en temps real que la classificació s’està duent a terme correctament”, assegura el professor de la Universitat de València. 
 
Un prototip del sistema s’ha provat ja amb una xicoteta selecció de col•lisions de l’experiment ATLES (al voltant d’un milió). Al gener es provarà amb totes les dades arreplegades per l’experiment durant el primer cicle de funcionament de l’LHC (2010-2012), més de 2.000 milions de successos reals. Si tot funciona correctament, el sistema s’implementarà en ATLES abans que comencen les primeres col•lisions de partícules dins l’LHC, previstes per a la primavera de 2015. 
 
L’Institut de Física Corpuscular ha desenvolupat tant el programa per a comprovar la classificació dels successos en temps real com el sistema per a extraure la informació requerida per l’usuari en la base de dades del CERN que arxiva la ubicació de totes les col·lisions registrades. A l’LHC, com en altres experiments científics que treballen amb gran quantitat de dades, hi ha un sistema d’emmagatzematge i processament de dades distribuït arreu del món, anomenat GRID. L’IFIC és un dels cent centres del món que emmagatzema i processa dades de l’LHC, en aquest cas de l’experiment ATLES. 
 
Segons Álvaro Fernández Casaní, un dels enginyers informàtics de l’IFIC que participa en el projecte, el centre de recerca del Parc Científic ha emprat una tecnologia similar per a altres projectes de recerca que treballen en entorns GRID. En aquest sentit, la seua participació en l’Event Index Project al costat d’altres centres de recerca com el CERN, INFN (Gènova), Orsay (França), Rutherford Appleton Laboratory (Regne Unit), Argonne National Laboratory (EUA) i les universitats de Valparaíso (Xile) i Autònoma de Madrid (UAM), és un reconeixement a una trajectòria de més d’una dècada en computació distribuïda GRID dins de l’experiment ATLES del CERN.
 

Data d'actualització: 17 de de desembre de 2014 12:36.

Llista de notícies