Anchor Cable – довічний кабель
15 Липня , 2017
Безпілотні електромобілі від Amber з’являться на вулицях раніше, ніж від Tesla, Waymo і Über
15 Липня , 2017

Об’єм даних, збережених в інформаційному центрі CERN, перевалив за позначку 200 петабайт

29 червня 2017 року керівництво інформаційного центру Європейської організації ядерних досліджень CERN повідомило, що об’єм даних, збережених на магнітних стрічках чи інших носіях інформації, перевалив за позначку 200 петабайт. Звідки ж взявся такий величезний масив інформації? Датчики Великого Адронного Колайдера, найбільшого і потужного прискорювача частинок на сьогоднішній день, реєструють близько мільярда зіткнень частинок за секунду, виробляючи за цю ж секунду близько одного петабайта даних. Жодна з існуючих обчислювальних систем не в змозі просто зберегти такий потік даних, не кажучи вже про його обробку в реальному часі. Тому всі отримані дані фільтруються на місці потужними комп’ютерами, підключеними до обладнання кожного з експериментів, і найбільш цікаві дані відправляються в Інформаційний центр CERN.
Суперкомп’ютери CERN DC виконують операції по попередній обробці та індексації отриманих даних, які потім записуються на магнітну стрічку для їх тривалого зберігання. Незважаючи на використання надефективних алгоритмів стиснення інформації, CERN DC зберігає в середньому один петабайт за кожен день роботи колайдера. Деяка частина цих даних має характер тимчасових і дані видаляються після завершення їх обробки.
За 2016 рік обладнання чотирьох основних експериментів пропрацювало протягом 5 мільйонів секунд, збираючи дані в безперервному режимі. З урахуванням роботи колайдера за попередні періоди, сумарний час роботи устаткування на кінець 2016 року склав 7,5 мільйонів секунд. І вчені прогнозують, що час роботи обладнання колайдера в 2017 році збільшиться на 50 відсотків порівняно з попередніми періодами.
Оскільки зараз колайдер працює в режимі підвищеної яскравості протонного променя, датчики реєструють зіткнення, що накладаються одне на одне і більш складні процеси. Все це вимагає складнішої обробки та аналізу даних, що тягне за собою необхідність у збільшенні кількості задіяних обчислювальних потужностей. Тому, крім свого роду рекорду по об’єму збереженої інформації, в інформаційному центрі CERN встановлено ще декілька рекордів по швидкості передачі даних, по кількості використаних ресурсів обчислювальних систем і систем зберігання інформації.
Для того, щоб мати можливість оперувати величезними обсягами інформації, обладнання центру CERN DC піддавалось постійній модернізації паралельно з модернізацією обладнання колайдера. В період першої дворічної зупинки (Long Shutdown 1), центр отримав нове обладнання, яке дозволило проводити обробку 73 петабайт даних, 49 з яких були даними, зібраними на колайдері. Трохи пізніше в центрі була встановлена система зберігання CERN Advanced STORage system (CASTOR), яка і дозволила накопичити рекордний об’єм даних і яка ще не вичерпала свої ресурси на сьогоднішній день.
Ще одним аспектом оперування великими об’ємами інформації є підвищені вимоги до швидкостей передачі інформації. З початку лютого цього року третина від всіх використовуваних в інформаційному центрі CERN DC комунікаційних ліній була переведена на стандарт 100 гігабіт на секунду. А ціла система оптоволоконних комунікаційних каналів пов’язує центр CERN DC з його відділеннями, які перебувають в Угорщині та інших країнах.

Залишити відповідь

Увійти за допомогою: 
Inline
Inline