Forskere Bruker Mindre Enn 1% Av Dataene Som Er Samlet Inn Av Large Hadron Collider - Alternativ Visning

Forskere Bruker Mindre Enn 1% Av Dataene Som Er Samlet Inn Av Large Hadron Collider - Alternativ Visning
Forskere Bruker Mindre Enn 1% Av Dataene Som Er Samlet Inn Av Large Hadron Collider - Alternativ Visning

Video: Forskere Bruker Mindre Enn 1% Av Dataene Som Er Samlet Inn Av Large Hadron Collider - Alternativ Visning

Video: Forskere Bruker Mindre Enn 1% Av Dataene Som Er Samlet Inn Av Large Hadron Collider - Alternativ Visning
Video: Брайан Кокс про суперколлайдер ЦЕРНа 2024, April
Anonim

Det er tydelig når det er et problem å skaffe vitenskapelige data. Men det viser seg at det er et problem å lagre og behandle dem.

Hele serien med høyprofilerte funn gjort med collideren var basert på analysen av data, hvis volum er mindre enn en prosent av det totale volumet av genererte data.

Resten av dataene går tapt irretrievably.

Den 26,7 kilometer lange kollideretunnelen brukes til å akselerere partikler nær lysets hastighet. To strømmer av partikler som beveger seg i motsatte retninger kolliderer på steder i rommet som overvåkes av følsomme sensorer. Selv på det laveste tetthetsnivået av protonstråler som inneholder 120 milliarder protoner hver, er antall kollisjoner 30 millioner kollisjoner per sekund.

I følge informasjon som er publisert på nettstedet til European Organization for Nuclear Research CERN, skaper en milliard kollisjoner per sekund en datastrøm på 1 petabyte per sekund. Og dette er det største problemet på nåværende tidspunkt, siden en datastrøm med en slik hastighet rett og slett er umulig å lagre, enn si behandle den ordentlig. “Minst 30 millioner kollisjoner trenger vi 2000 petabyte for å lagre resultatene fra en typisk 12-timers kollideringsfase. Ved 150 collider-lanseringer per år, vil det ta 400 000 petabyte, 400 exabyte med data for å lagre alle dataene, et enormt volum som vi ikke en gang kan lagre for tiden, sier Andreas Hoecker, forsker ved CERN.

Løsningen på problemet med en stor datamengde er selvfølgelig en drastisk reduksjon i volumet. Og dette gjøres ikke på bekostning av noen informasjonskomprimeringsalgoritmer, for dette er det ikke nok kraft fra alle prosessorer til eksisterende superdatamaskiner. Mulighetene til datateknologien som er tilgjengelig på CERN gjør det mulig å redde resultatene av bare 1200 kollisjoner for hver 30 million slike tilfeller. Dette er 0,004 prosent av det totale volumet, og de resterende 99,996 prosent, som nevnt over, går tapt for alltid.

Image
Image

Denne situasjonen virker som et forferdelig sløsing, men ikke alt er så trist. Fenomener som er av virkelig interesse for forskere, oppstår ikke med denne hastigheten. For eksempel vises Higgs-bosonet med en hastighet på en gang i sekundet, mens andre hendelser oppstår med en frekvens på titalls eller hundrevis av ganger per sekund. For å fremheve det mest interessante av hele datastrømmen, er spesielle "triggere" involvert, enheter som utfører foreløpig datafiltrering hovedsakelig på maskinvarenivå. Disse utløserne er utviklet for hvert spesifikt tilfelle og er innstilt i samsvar med egenskapene til de søkte partiklene, for eksempel Higgs boson, true quark, W og Z bosons, etc.

Salgsfremmende video:

Med en slik implementering av foreløpig databehandling går selvfølgelig noen av de interessante dataene tapt sammen med et fjell av unødvendig og uinteressant "søppel". Men den gjenværende informasjonen inneholder hovedsakelig betydelige data, og dets relativt beskjedne volum gir allerede mulighet for tilstrekkelig dyp behandling selv i sanntid.

Og avslutningsvis skal det bemerkes at løsningen på problemet beskrevet ovenfor på ingen måte garanterer muligheten for å lagre stort sett ubrukelige data. Løsningen på problemet er å lage nye sensorer for collideren, som vil bruke de nyeste prestasjonene til moderne teknologier og som vil kunne trenge inn i dypet av de fysiske områdene som nå ikke er utforsket. Forresten, noen av disse sensorene vil dukke opp på collideren i løpet av den neste moderniseringen som blir utført akkurat nå. Og lanseringen av den moderniserte collideren er planlagt i 2025.

Anbefalt: