Анотация
Извличането на човешкия геном исторически е поставяло значителни технологични и финансови предизвикателства, често надхвърлящи милиони долари. Последните подобрения в техниките за извличане значително намаляват тези разходи, което довежда до широкомащабно извличане и съхранение на геномни данни. За илюстрация, данните, извлечени от човешкия геном, обикновено възлизат на приблизително 500 GB. Анализирането на такива данни за различни изследователски цели често включва големи групи от субекти, което води до набори от данни, които достигат обем от порядъка на петабайти (PB). Това нарастване на обема на данните повдига критични проблеми, свързани със съхранението, извличането, обработката и визуализацията им.
От друга страна, CERN има богат опит в управлението на подобни обеми от данни и организацията разработва софтуерна система, известна като ROOT за работа с големи масиви от физични данни. Проектът GeneROOT включва адаптиране на ROOT за обработка на биологични данни. В определени аспекти ранните прототипи на GeneROOT демонстрират превъзходство над част от вече установените софтуери за работа с данни, свързани с биоинформатика. GeneROOT притежава значителен потенциал за по-нататъшни подобрения в компресирането, съхранението, извличането, обработката и визуализацията на данни. Трябва да се изследва и потенциалът на GeneROOT за работа в HPC (high performance computing) среда.
Агентното моделиране е незаменим инструмент за изучаване на сложни биологични системи. Съществуващите симулационни платформи обаче не винаги се възползват напълно от съвременния хардуер и често имат софтуерен дизайн, специфичен за дадено конкретно задание.
BioDynaMo е нова платформа за симулация, която намира решение и за двата проблема. Платформата разполага с модулено и високопроизводително симулационно ядро. BioDynaMo може да се използва за симулиране на сценарии в сферите на: неврологията, онкологията и епидемиологията. За всеки сценарии се валидират добитите резултати с експериментални данни или аналитично решение. Получените резултати от ефективността показват, че BioDynaMo работи до три порядъка по-бързо от най-съвременните алтернативи. Това подобрение прави възможно симулирането на сценарии на използване с над един милиард агенти на един сървър, демонстрирайки потенциала, който BioDynaMo има за изследвания в областта на изчислителната биология.
Необходимо време
1-2 години.