Projects

Analysis of protein mass profiles obtained by MALDI-ToF spectrometry to discover signatures of cancer

Grant NCN: Preludium DEC-2011/01/N/NZ2/04
Start date: 07/12/2011; End date: 06/12/2013
Status: completed

Introduction

W dzisiejszych czasach jednym z trudniejszych problemów jest dokładne określenie mechanizmów przekształcania komórki prawidłowej w nowotworową. Rak jest złożoną chorobą genetyczną spowodowaną uszkodzeniami kodu genetycznego oraz współdziałaniem wielu czynników genetycznych i środowiskowych. Nowoczesne technologie pozwalają na badanie zjawisk zachodzących na poziomie pojedynczej komórki. Uzyskane dane wymagają jednak przeprowadzenia skomplikowanych analiz statystycznych. W ramach projektu prowadzono badania w zakresie analizy sygnałów opisujących zmiany koncentracji białek w osoczu krwi pacjentów z różnymi typami nowotworów, czyli tzw.
widm masowych.

Zaproponowane narzędzia obejmują kilka niezbędnych etapów analizy, tj. wstępne przetwarzanie danych, czy modelowanie sygnału widma, które polega na opisaniu i odzwierciedleniu rzeczywistego sygnału poprzez zastosowanie narzędzi matematycznych. Wprowadzone rozwiązania pozwalają na zmniejszenie liczby znajdowanych fragmentów widma, które nie opisują żadnego białka, więc są związane jedynie z szumami pomiarowymi oraz zwiększenie powtarzalności otrzymanych wyników badań. Kluczowym elementem metody jest wykorzystanie modelu mieszanin rozkładów normalnych do opisania kształtu widma masowego. Innowacyjnym podejściem jest zastosowanie modelu o większym stopniu skomplikowania, a następnie usunięcie jego składowych, które mogą reprezentować pozostałości szumów pomiarowych. Takie rozwiązanie zwiększa trafność znalezionych fragmentów widma.

Powstałe algorytmy i metody mogą być wykorzystywane w badaniach naukowych dotyczących różnego typu nowotworów oraz innych badaniach, opartych na analizie skomplikowanych danych biologicznych. Dzięki możliwość analizy płynów ustrojowych człowieka wyniki mogą być wykorzystane jako narzędzie wspomagające wykrywanie choroby nowotworowej we wczesnym jej stadium, jeszcze przed wystąpieniem objawów klinicznych. Interwencja lekarska na tym etapie istotnie zwiększa szanse na całkowite wyleczenie oraz zmniejszenie powikłań radioterapii. Opracowane metody analizy danych wykorzystują znane narzędzia analizy statystycznej, dzięki czemu są dość uniwersalne w zastosowaniu. Mogą być również wykorzystywane w dziedzinach nauki i przemysłu, w których istnieje potrzeba analizy złożonych sygnałów, przykładowo ekonomicznych.

Goal
Tasks
Contractors

Project manager

Michał Marczyk

Contractors

Michał Marczyk

Results

Kluczowe osiągnięcia projektu:
• Stworzenie kompletnej metodologii przetwarzania białkowych widm masowych MALDI-ToF z wykorzystaniem modeli mieszanin gaussowskich (GMM).
• Wprowadzenie równoległego algorytmu poszukiwania warunków początkowych dla modelu GMM.
• Zastosowanie technologii CUDA do optymalizacji algorytmu EM wykorzystywanego do estymacji parametrów modelu mieszanin gaussowskich.
• Opracowanie adaptacyjnej metody filtracji składowych modelu, która zwiększa trafność modelu.
• Konstrukcja oprogramowania w środowisku Matlab do automatycznego przetwarzania widm masowych.
• Zaproponowanie modyfikacji algorytmu uliniawiania widm masowych opartego na transformacie Fouriera, która zwiększa czułość wykrywania pików.
• Zastosowanie technologii CUDA do przeprowadzania eksperymentów klasyfikacyjnych.

Articles