Research technologies

Innowacyjne technologie badawcze w genomice

Najbardziej zaawansowana uczelnia medyczna w Polsce

Uniwersytet Medyczny w Białymstoku (UMB) to jeden z najbardziej dynamicznie rozwijających się ośrodków naukowych w Polsce. Łączy zaplecze kliniczne szpitala uniwersyteckiego, nowoczesne laboratoria badawcze oraz profesjonalny biobank. Dzięki temu UMB jest miejscem, w którym nauka, technologia i medycyna kliniczna spotykają się na najwyższym światowym poziomie.

Laboratorium Genomiki i Analiz Epigenetycznych (LGAE) Laboratorium Obliczeniowej Medycyny Molekularnej (LOMM)

Laboratorium Genomiki i Analiz Epigenetycznych (LGAE)

Laboratorium należy do najlepiej wyposażonych ośrodków genomiki w Polsce. Posiada unikalne zaplecze technologiczne, które umożliwia prowadzenie zaawansowanych badań molekularnych
z wykorzystaniem najnowszych metod sekwencjonowania.

Dzięki systemom takim jak Illumina NovaSeq, NextSeq, MiSeq, czy 10x Genomics Chromium, możliwe jest prowadzenie pełnego zakresu analiz: od sekwencjonowania całego egzonu i genomu, przez analizę transkryptomów, aż po profilowanie ekspresji genów na poziomie pojedynczej komórki.

Laboratorium Obliczeniowej Medycyny Molekularnej (LOMM)

Zajmujemy się biologią obliczeniową i bioinformatyką w kontekście badań multiomicznych w nowotworach, chorobach metabolicznych oraz rzadkich. Analizujemy dane omiczne z sekwencjonowania następnej generacji (NGS). Posiadamy dostęp do wysokowydajnego klastra obliczeniowego (HPC) w ramach infrastruktury UMB.

Specjalizujemy się szczególnie w analizach epigenetycznych i transkryptomicznych obejmujących bioinformatyczne przetwarzanie i analizę danych w aplikacjach:

RRBS (metylom – metylacja DNA; Reduced Representation Bisulfite Sequencing)
Bulk RNA-Seq (transkryptom – ekspresja genów kodujących białka i lncRNA)
Bulk smallRNA-Seq (mikrotranskryptom – ekspresja i edycje dojrzałych miRNA)
scRNA-Seq (analizy transkryptomowe pojedynczych komórek)

Wystandaryzowane bankowanie prób w Biobanku UMB

Biobank UMB działa zgodnie z wymogami certyfikacji ISO 20387 i posiada w pełni zautomatyzowaną infrastrukturę (HAMILTON BiOS L5, system LIMS) do przechowywania i zarządzania próbkami biologicznymi w zgodności z GDPR i międzynarodowymi standardami BBMRI-ERIC. Wdrożone w Biobanku UMB procedury zapewniają zgodność z najwyższymi międzynarodowymi standardami jakości i bezpieczeństwa.

Wysokoprzepustowe sekwenatory NGS Illumina

Laboratorium genomowe LGAE wyposażone jest w aparaty sekwencjonujące w technologii NGS firmy Illumina: wysokowydajny NovaSeq X plus, Novaseq 600, diagnostyczny NovaSeq 6000 Dx, NextSeq 500, Miseq. Zestaw systemów sekwencjonujących umożliwia realizację takich aplikacji jak sekwencjonowanie: genomów (WGS), eksomów (WES), transkryptomów (RNA-Seq), miRNA (smallRNA-Seq), 16S-rRNA, paneli genowych itd.

System nCOUNTER®

System nCOUNTER NanoString znajduje się na wyposażeniu laboratorium genomowego LGAE. Platforma ta oparta jest na znakowanych fluorescencyjnie sondach reporterowych, które mogą zliczyć setki cząsteczek w jednej reakcji. Technologia NanoString nie obejmuje etapów amplifikacji, czyli powielania sygnału, co znacznie ogranicza ryzyko zanieczyszczenia próbki. Wykorzystywany przede wszystkim do analizy ekspresji genów poprzez kwantyfikację cząsteczek mRNA, a także miRNA. Dzięki wysokiej czułości znajduje zastosowanie w badaniach tzw. liquid biopsy.

Nowoczesne laboratorium genomowe

Laboratorium genomowe LGAE posiada nowoczesną infrastrukturę obejmującą trzy stacje pipetujące umożliwiające automatyzację procedur izolacji DNA i przygotowywania bibliotek - NGS STAR pipetting stations (Hamilton, USA) oraz szereg urządzeń peryferyjnych: TapeStation (2200 i 4200), Bioanalyzer 2100, DeNovix, Qubit (3.0, 4.0, Flex), Pippin HT, 2 termocyklry Proflex, 4 termocyklerów BioRad C1000 Touch, aparat do PCR w czasie rzeczywistym Light Cycler 480, 2 termomiksery C, system biobankowy do przechowywania materiału w parach ciekłego azotu.

Wysokowydajny klaster obliczeniowy (HPC) UMB

Laboratorium obliczeniowe LOMM wykorzystuje klaster obliczeniowy UMB, który składa się z dwóch węzłów zarządzających oraz 20 węzłów obliczeniowych po 64 CPU każdy. Na każdym węźle do dyspozycji jest 754GB pamięci RAM. Dodatkowo obecne także węzły do obliczeń GPU posiadające karty graficzne Tesla T4. Na klastrze uruchomiony jest system kolejkowy OpenPBS. Przetwarzanie danych sekwencyjnych odbywa się w wewnętrznych systemach obliczeniowych UMB, o dużej mocy obliczeniowej i przestrzeni dyskowej, bez potrzeby korzystania z chmury, ani udostępniania danych na zewnątrz, co zapewnia wysokie bezpieczeństwo generowanych danych i uzyskiwanych wyników.

Odpowiedzi na pytania dotyczące genomiki

Czym różni się sekwencjonowanie całego genomu (WGS) od sekwencjonowania eksomu (WES)?

Sekwencjonowanie całego genomu (WGS) analizuje kompletną sekwencję DNA, obejmującą zarówno regiony kodujące białka (eksony), jak i niekodujące (introny, regiony regulatorowe). WGS pozwala wykryć warianty w całym genomie, w tym strukturalne (delecje, duplikacje, translokacje, inwersje), warianty dynamiczne oraz zlokalizowane w regionach regulatorowych – np. wpływających na ekspresję genów. Sekwencjonowanie eksomu (WES) koncentruje się wyłącznie na regionach kodujących – eksonach, które stanowią około 1-2% ludzkiego genomu. WES jest bardziej ekonomiczne i umożliwia osiągnięcie większej głębokości pokrycia w regionach kodujących przy niższych kosztach. Jest szczególnie przydatne w identyfikacji wariantów wywołujących choroby genetyczne spowodowane wariantami patogennymi w genach kodujących białka oraz w analizie onkogennych wariantów somatycznych w nowotworach.

Do czego służy technologia NanoString nCounter i jakie może mieć zastosowanie w badaniach omicznych?

Technologia NanoString nCounter to platforma służąca do cyfrowego zliczania ekspresji genów lub niekodujących RNA bez konieczności amplifikacji materiału genetycznego. Wykorzystuje fluorescencyjnie znakowane sondy molekularne (molecular barcodes), które wiążą się bezpośrednio z określonymi sekwencjami RNA w próbce. NanoString nCounter jest szczególnie przydatny w analizie materiału archiwalnego FFPE (formalin-fixed paraffin-embedded), który często jest zdegradowany, oraz w przypadku małych ilości RNA. Technologia ta pozwala na jednoczesną analizę ekspresji setek wybranych transkryptów mRNA oraz miRNA z wysoką powtarzalnością i standaryzacją. NanoString nCounter jest idealny do badań typu liquid biopsy (ciekła biopsja – np. w surowicy czy osoczu), gdzie ilość materiału genetycznego jest ograniczona, oraz do walidacji biomarkerów zidentyfikowanych metodami NGS.

Dlaczego warto wykonywać badania genomowe w polskim laboratorium takim jak UMB, zamiast tańszych analiz w firmach zagranicznych?

Wykonywanie badań genomowych w polskim laboratorium zapewnia pełną zgodność z RODO (GDPR) i polskim prawem o ochronie danych osobowych – wrażliwe dane osobowe pacjentów, do których należą dane genomowe i omiczne, nie opuszczają kraju, co minimalizuje ryzyko naruszenia prywatności. Laboratorium genomowe UMB (LGAE) działa zgodnie z najwyższymi standardami w reżimie klinicznym, zapewniając wysoką jakość procesów od pobrania próbki po analizę bioinformatyczną. Infrastruktura UMB obejmuje nowoczesne sekwenatory NGS (Illumina NovaSeq X Plus, NovaSeq 6000 Dx) oraz zaawansowane systemy obliczeniowe (LOMM), co pozwala na kompleksową realizację projektów badawczych bez konieczności outsourcingu. LGAE posiada certyfikaty jakości uzyskane podczas oceny przez Europejską Sieć Kontroli Jakości Badań Genetycznych (EMQN) i agencję Oceny Jakości Genomicznej (GenQA), w zakresie „Next Generation Sequencing EQA (Germline)”. Laboratorium uzyskało najwyższą ocenę, a wygenerowane dane sekwencyjne uzyskały najwyższe wartości punktowe w systemie Illumina NovaSeq 6000. Dodatkowym atutem jest bezpośredni kontakt z zespołem realizującym projekt, możliwość konsultacji w języku polskim oraz szybsza logistyka próbek. Współpraca z polskim ośrodkiem akademickim zapewnia również transparentność procesu zgodnie z wymaganiami regulacyjnymi obowiązującymi w Polsce. Wiele instytucji grantowych wymaga, aby żadna próbka ani dane nie opuszczały granic Polski.

Dlaczego technologie transkryptomowe w analizach pojedynczych komórek (scRNA-Seq) są lepsze niż standardowe bulk RNA-Seq?

Standardowe sekwencjonowanie RNA (bulk RNA-Seq) analizuje średnią ekspresję genów ze wszystkich komórek w próbce jednocześnie, co maskuje heterogenność komórkową. Sekwencjonowanie RNA pojedynczych komórek (scRNA-Seq) pozwala na identyfikację rzadkich populacji komórek, kwantyfikację ekspresji genów w każdym typie komórek odrębnie, charakteryzację heterogenności (np. guza) oraz profilowanie mikrośrodowiska nowotworowego. Ta technologia umożliwia predykcję trajektorii rozwojowych komórek, analizę procesów różnicowania oraz identyfikację transformacji między stanami komórkowymi, co jest niemożliwe w bulk RNA-Seq. Analizy statystyczne można prowadzić odrębnie dla każdego zidentyfikowanego typu komórek.

Czy dane z sekwencjonowania NGS można przeanalizować na własnym laptopie?

Analiza danych NGS jest obliczeniowo bardzo wymagająca i zazwyczaj nie jest możliwa na standardowym laptopie. Surowe dane z sekwencjonowania (pliki FASTQ) zajmują dziesiątki do setek gigabajtów, a ich przetworzenie wymaga dużej pamięci RAM (często 64-256 GB), znacznej mocy obliczeniowej oraz przestrzeni dyskowej rzędu terabajtów. Pojedyncza próbka WGS może generować 100-200 GB danych, a jej analiza na klastrze obliczeniowym trwa kilka do kilkunastu godzin – na laptopie byłaby niemożliwa lub trwałaby tygodnie. W Laboratorium Obliczeniowej Medycyny Molekularnej (LOMM) UMB wykorzystujemy dedykowany klaster obliczeniowy wysokiej wydajności (HPC) oraz specjalistyczne pipeliny bioinformatyczne, które umożliwiają efektywną analizę dużych zbiorów danych multiomicznych z setek próbek jednocześnie. Dostęp do takiej infrastruktury jest kluczowy dla projektów wielkoskalowych wymagających analizy tysięcy próbek.

Czy analiza danych NGS wymaga doświadczonych specjalistów bioinformatycznych, czy mogę samodzielnie użyć programów z interfejsem graficznym, jeśli się na takiej analizie nie znam?

Prawidłowa analiza danych NGS wymaga specjalistycznej wiedzy z zakresu bioinformatyki, biologii molekularnej i biostatystyki oraz znajomości zaawansowanych algorytmów i pipelinów analitycznych. Proces obejmuje restrykcyjną kontrolę jakości na każdym etapie, identyfikację i eliminację artefaktów technicznych oraz interpretację wyników w kontekście merytorycznym prowadzonego projektu. Nieprawidłowe wykonanie analiz bioinformatycznych nie spowoduje, że w ogóle nie zostaną uzyskane wyniki – prawdopodobnie wyniki będą, ale mogą okazać się błędne, a wyciągnięte wnioski nieprawidłowe. Zespół Laboratorium Obliczeniowej Medycyny Molekularnej (LOMM) UMB posiada wieloletnie doświadczenie w analizie danych multiomicznych (genomu, transkryptomu, metylomu, miRNA). Doświadczeni specjaliści zapewniają kompleksową analizę od etapu surowych odczytów sekwencyjnych do analiz statystycznych i wizualizacji rezultatów, gwarantując najwyższą jakość wyników.

Genomics and Epigenetic Analysis Laboratory

Laboratory of Computational Molecular Medicine