20050000 BIB uzasadnienie kategoryzacji.pdf

(281 KB) Pobierz
1. Opis Instytutu BioInfoBank
Bioinformatyka jest bardzo ważną dziedziną, która w znaczący sposób wpływa na nowe osiągnięcia w
biologii molekularnej. Mimo tego cechuje się z reguły niskimi potrzebami infrastrukturalnymi. Efektywna
grupa bioinformatyczna składa się często jedynie z paru komputerów klasy PC, ewentualnie spiętych w
klaster komputerowy, oraz kilku wszechstronnych i silnie zmotywowanych naukowców, łączących
znajomość biologii molekularnej, medycyny oraz umiejętność tworzenia oprogramowania komputerowego.
Taką właśnie jednostką jest Instytut BioInfoBank. Wszyscy starsi pracownicy Instytutu BioInfoBank mają
kilkumiesięczny a nawet kilkuletni staż za granicą i wiele kontaktów naukowych. Wszyscy z nich mają
również lukratywne oferty pracy w Stanach Zjednoczonych. Mimo to zdecydowali się zrezygnować z
korzyści materialnych na rzecz tworzenia niezależnej jednostki badawczej w Polsce na wzór znakomicie
działających instytutów w Stanach Zjednoczonych. Kategoryzacja Instytutu BioInfoBank przyczyniłaby się
do zahamowania emigracji zdolnej i wysoko wykształconej polskiej kadry naukowej, której wieloletnia
edukacja była pokrywana z budżetu państwa. BioInfoBank ma na celu stworzenie warunków do pracy
naukowej na poziomie porównywalnym do placówek w Stanach Zjednoczonych czy w Europie Zachodniej.
Aby osiągnąć ten cel struktura organizacyjna Instytutu musi być (i) efektywna, by umożliwić sprawną
współpracę w ramach różnorodnych projektów z wieloma partnerami reprezentujących różne grupy
badawcze i przedsiębiorstwa, (ii) elastyczna, by ułatwić realizacje nowych projektów, włączanie nowych
partnerów i szybkie reagowanie na zmieniające się zapotrzebowanie ze strony rynku, (iii) płaska – tak by
zapewnić łatwy kontakt pomiędzy laboratoriami posiadającymi specjalistyczną wiedzę i umiejętność w
różnych dziedzinach. W celu realizacji tak postawionych wymagań wprowadzone została nowoczesne
zasady zarządzania poprzez projekty. Dzięki temu możliwe jest zdecydowane uproszczenie przepływu
informacji i decyzji, co jednocześnie sprzyja realizacji misji Instytutu: przyciąganiu, zachęcaniu do
współpracy i sprzyjaniu rozwojowi utalentowanych ludzi. Tak obrana koncepcja zarządzania w naturalny
sposób wpisuje się w wymagania realizacji całościowego rozwoju Instytutu poprzez szczegółowe projekty.
Pojedynczym projektem zarządza kierownik projektu, którym w naturalny sposób będzie pomysłodawca
danego projektu. Kierownik samodzielnie dobierać współpracowników do realizacji projektu. Dzięki
włączeniu we wspólny projekt specjalistów z różnych często dość odległych dziedzin spodziewany jest
dodatkowy pozytywny efekt przezwyciężania tzw. „egoizmu branżowego”. Co więcej, multidyscyplinarne
kontakty kreują zazwyczaj efekt synergii otwierający zupełnie nowe możliwości wykorzystania
zgromadzonej w zespole wiedzy. Ponieważ kierownikiem projektu będzie mógł zostać jego pomysłodawca a
członkiem zespołu projektowego utytułowany ekspert, przełamywana zostaje formalna hierarchia.
Doktoranci są kierownikami niektórych projektów realizowanych w ramach Instytutu, mimo że osoby ze
znacznie większym stażem wchodzą w skład zespołu badawczego danego projektu. Sprzyja to wyzwoleniu
dodatkowych pokładów innowacyjności i kreatywności i zapewnia elastyczność w realizacji różnorodnych
zadań Instytutu.
Wiele opublikowanych rezultatów projektów realizowanych w ramach jednostki ukazało się w
renomowanych zachodnich czasopismach, takich jak „Science”, „Cell”, „PNAS”, “TiBS”, “Journal of
Biological Chemistry”, „Nucleic Acid Research”, “FASEB Journal”, “FEBS Letters”, “Proteins”, “Protein
Science”, “Bioinformatics” i innych. Aktualnie ukazało się już kilkadziesiąt publikacji z afiliacją Instytutu
BioInfoBank, mimo krótkiego okresu pracy naukowej w ramach tej jednostki. Wszystko to dzięki zapałowi i
zaangażowaniu wszystkich współpracowników. Mimo krótkiej historii grupa ta jest jedną z najlepszych
polskich jednostek w tej dziedzinie i zdobywa coraz większe uznanie za granicą. Jednymi z naszych
głównych osiągnięć w ostatnich latach są wysokie miejsca w prestiżowych międzynarodowych „zawodach”
(CASP-5, CASP-6). Udało nam się odkryć ważną funkcję jednej z domen białka produkowanego przez
wirusa SARS. Publikacja na ten temat ukazała się w prawdopodobnie najbardziej prestiżowym czasopiśmie
biologii molekularnej, jakim jest „Cell” („impact factor” około 30 w ostatnim roku, czyli więcej niż „Nature”
czy „Science”) i została zauważona przez międzynarodową agencję prasową Reuters-Health (2003-06-03)
jako istotne osiągnięcie polskich naukowców. Jedno z czołowych czasopism naukowych „Science”
opublikowało dwie nasze prace dotyczące analizy transkryptomu ryżu oraz racjonalnie zaprojektowanego
sztucznego białka.
Poza własną działalnością badawczą, BioInfoBank udostępnia na swoich stronach internetowych kilka
bardzo nowatorskich serwisów, które są wykorzystywane przez wielu naukowców z całego świata. W
pierwszym numerze specjalnego wydania czasopisma „Nucleic Acid Research” poświęconego wyłącznie
serwisom internetowym, serwer 3D-Jury rozwinięty i utrzymywany przez naszą jednostkę jest wymieniony
na pierwszym miejscu i znalazł się na okładce.
Biorąc pod uwagę aktualne osiągnięcia jesteśmy przekonani, że jednostka ta będzie godnie reprezentować
naukę polską. Brak kategoryzacji naszej jednostce oznaczałoby brak zainteresowania ze strony Polskiego
Rządu młodymi, prężnymi grupami naukowców i pogrzebałoby ich wiarę w perspektywy badań naukowych
w Polsce. Z drugiej strony pozytywne rozpatrzenie naszego podania byłoby istotnym sygnałem dla młodych
naukowców. Doprowadziłoby to do zwiększenia zainteresowania karierą w branży „wysokich technologii” i
miałoby inspirujący wpływ na młodą kadrę naukową. Według nas, jednostki tego typu powinny stanowić
istotną część krajobrazu naukowego w Polsce, dokładnie tak, jak ma to miejsce w przypadku instytucji „non
for profit” w Stanach Zjednoczonych. Instytucje tego typu przyczyniają się nie tylko do tworzenia
zatrudnienia dla wysoko wykształconej kadry, ale również do zwiększenia poziomu technologicznego w
kraju.
2. Projekty naukowe realizowane przez jednostkę i finansowane przez Komisje Europejską
MiFriend (2003-2004)
Projekt
UE
MNiI
Suma
Celem projektu jest analiza genomu i metabolizmu
ELM
500
350
850
bakterii P. putida KT2440 oraz przystosowanie jej do
MiFriend
650
455
1,105
celów oczyszczania środowiska. Zadania realizowane
5PR Suma
1.150
805
1,955
przez BioInfoBank to przede wszystkim automatyczna
SEPSDA
1.185
711
1,896
analiza genomu bakterii oraz szczegółowa analiza
BioSapiens
915
549
1,464
strukturalna i funkcjonalna wybranych rodzin genów /
DataGenome
600
360
960
białek i udostępnienie pozyskanej wiedzy szerokiej
MicrobeArray
475
285
760
społeczności akademickiej.
GeneFun
750
450
1,200
Dla każdego białka z proteomu P. putida KT2440
6PR Suma
3.925
2,355
6,280
zostały
zachowane
struktura
drugorzędowa
przewidziana automatycznie oraz uszeregowania
Szacunkowe budżety projektów realizowanych od roku 2000
w Instytucie BioInfoBank finansowanych w ramach 5PR,
(alignmenty) sekwencji białek homologicznych
dofinansowanych przez MNiI na poziomie 70% i w ramach
znalezionych standardowymi narzędziami (PSI-Blast i
6PR, dofinansowanych przez MNiI na poziomie 60% przed-
RPS-Blast) w specjalnie stworzonej bazie danych.
stawia tabela obok. Wszystkie wartości podane w tysiącach
Zalignowane sekwencje zostały przepisane na profile i
PLN.
zapamiętane w celu późniejszego porównania ich z
innymi profilami za pomocą czułych metod detekcji podobieństwa sekwencyjnego takich jak FFAS czy
ORFeus. Baza danych zawiera rezultaty przewidywania struktury trzeciorzędowej białek uzyskane za
pomocą wybranych metod. Baza danych umożliwia manualną adnotację struktury oraz funkcji białek
bakterii. Adnotacje zawierają informacje o tym czy bazują na informacji eksperymentalnej czy na
przewidywaniach. Baza danych zawiera również informacje o ekspresji genów otrzymane w ramach projektu
w innych współpracujących laboratoriach. Zmiany w ekspresji są użyte do analizy funkcji białek. Baza
danych umożliwia grupowanie białek na podstawie podobieństwa sekwencyjnego i strukturalnego. Baza
danych jest dostępna przez Internet, aby umożliwić zdalną modyfikację informacji oraz udostępnić
informacje szerokiej rzeszy użytkowników.
Geny odpowiedzialne za reakcje bakterii na stres są poddane szczegółowej analizie. Sekwencje
odpowiednich białek, produktów tych genów, są użyte do poszukiwania sekwencji homologicznych, za
pomocą metod PSI-Blast i RPS-Blast. Jeżeli poszukiwania nie doprowadzają do homologicznych białek o
znanej strukturze albo funkcji, dalsze poszukiwania są przeprowadzone za pomocą bardziej czułych metod
takich jak ORFeus w ramach systemu GRDB. W zależności od istotności statystycznej znalezionych
podobieństw, przewidywania są adnotowane jako bardziej lub mniej pewne. W przypadku, kiedy
analizowany gen można zaklasyfikować do ciekawej rodziny, przeprowadzona jest analiza filogenetyczna,
która umożliwia lepszą ocenę funkcjonalnych możliwości białka. Przewidywanie struktury jest użyte do
planowania badań eksperymentalnych.
Podobna Analiza jest przeprowadzona również dla białek i genów wchodzących w skład peryferyjnych
szlaków katabolicznych bakterii. Szczególny nacisk jest położony na analizę genów odpowiedzialnych za
katabolizm toksycznych związków z rodziny nitrotoluenu i styrenu.
Sekwencja każdego białka bakterii jest wysłana do serwera RPS-Blasta, który zawiera 400,000 profili rodzin
białek wyciągniętych z bazy danych NR klastrowanej na poziomie 70%. Sekwencje znalezione przez serwer
są zalignowane do sekwencji z bakterii i tak stworzony alignment (uszeregowanie) są użyte jako zalążek do
pięciu iteracji PSI-Blasta. Sekwencje znalezione przez PSI-Blast powiększają informacje o rodzinach
sekwencji białek bakterii, ktore są zapisane jako profile sekwencyjne. Profile są wykorzystane przy
porównaniach dokonywanych za pomocą programów takich jak FFAS czy ORFeus. Profile są porównane do
profili rodzin sklasyfikowanych w bazach COGs i Pfam. Zakładamy, że takie porównanie doprowadzi do
znalezienia najbardziej odległych zależności między rodzinami białek, które są wykrywalne aktualnymi
metodami. Te zależności są użyte do inferencji funkcji. W przypadkach, kiedy taka inferencja jest
niemożliwa, przeprowadzamy analiza strukturalna białek (w niektórych ciekawych przypadkach również
manualnie), aby zawęzić spektrum możliwych funkcji.
Przewidywanie struktury zaczyna się od przewidywania struktury drugorzędowej. Następnie sekwencja
badanego białka zostaje przewleczona (threading) przez znane struktury białek, aby dopasować ją do
odpowiedniego szablonu. W przypadku, gdy dopasowanie (threading) jest niejednoznaczne, do dalszych
przewidywań zostaje użyty „Meta-Server”. Z powodu wysokich kosztów obliczeniowych, tego typu analiza
jest wykonana dla nie więcej niż 500 rodzin. Automatycznie przewidziana struktura jest udostępniona w
ramach serwisu internetowego, stworzonego wraz z innymi partnerami.
ELM (2003-2004)
Celem projektu jest analiza sekwencji białek eukariotycznych oraz poszukiwanie w ich sekwencjach
krótkich motywów funkcjonalnych (ELM’ów). Motywy takie odgrywają kluczową rolę w procesach
zachodzących pomiędzy białkami i są odpowiedzialne za sygnały przekazywane w ramach dużych sieci
sygnałowych. Poznanie tych motywów umożliwi zrozumienie niektórych aspektów oddziaływania pomiędzy
białkami i pomoże zrozumieć procesy zachodzące w komórkach eukariotycznych.
W ramach projektu Został rozwinięty i przetestowany filtr „ab-initio” do systemu ELM, aby rozszerzyć zbiór
filtrów strukturalnych i umożliwić analizę preferencji konformacyjnych miejsc białek, dla których nie znana
jest struktura ani też nie jest znana struktura dla innych homologicznych białek. Filtr jest użyty do lokalizacji
miejsc proteolitycznych w białkach. Po zakończeniu pracy nad filtrem będzie on użyty do rozwoju opisu
miejsc limitowanej proteolizy i będzie dodany do innych filtrów i programów. Baza danych ELM’ów
(liniowych motywów eukariotycznych) jest rozszerzona o instancje motywów limitowanej proteolizy wraz z
odpowiednimi opisami.
BioInfoBank jest odpowiedzialny za rozwój filtru „ab-initio” i użycie go do detekcji miejsc limitowanej
proteolizy. Filtr „ab-initio” sprawdza kompatybilność sekwencji (segmentu białka) z badaną strukturą. Filtr
bazuje na liście konformacji fragmentów wyciętych ze struktur białkowych. Konformacje są poklastrowane
przy użyciu informacji strukturalnej i sekwencyjnej. Każdy klaster zawiera fragmenty podobne
sekwencyjnie i strukturalnie. Filtr ab-initio dzieli białko na nakładające się na siebie fragmenty. Każdy
fragment jest porównany z listą wcześniej przygotowanych klastrów fragmentów. Porównanie odbywa się za
pomocą podobieństwa sekwencji lub podobieństwa profili sekwencji. Najbardziej podobne klastry są
przypisane fragmentom. Zbiór podobnych klastrów służy do oceny preferencji konformacyjnych badanego
fragmentu. Średnia konformacja oraz jej odchylenie są obliczane. Konformacje są porównane z wymogami
poszczególnych badanych proteaz. Wiele miejsc proteolitycznych można opisać jako giętkie i posiadające
małą liczbę zakonserwowanych aminokwasów. W przypadku kiedy jest znane tylko jedno miejsce proteolizy
dla danej proteazy (tak jak w przypadku koagulacji krwi) ocena różnorodności konformacji jest niemożliwa.
Jednak w innych przypadkach zakładamy, że specyfikacje strukturalne mogą być dodane do procesu
filtrowania wykonywanego przez system poszukiwania ELM’ów. Filtr ab-initio pomaga innym filtrom
również przy poszukiwaniu innych motywów niż motywy limitowanej proteolizy. BioInfoBank jest
odpowiedzialny za wpisanie motywów limitowanej proteolizy do bazy danych ELM.
BioSapiens (2004-2008)
Sieć Doskonałości integruje 24 czołowe europejskie laboratoria bioinformatyczne:
EMBL
European Bioinformatics Institute,
Hinxton, Cambridge, UK
EBI
European Molecular Biology Laboratory,
Heidelberg, Germany
GSF
Environment and Health, Neuherberg,
Munich, Germany
ULB
Université Libre de Bruxelles, Brussels,
Belgium
CSIC
Consejo Superior de Investigaciones
Cientificas, Madrid, Spain
KUN
University of Nijmegen, Nijmegen, The
Nertherlands
SIB
Swiss Institute of Bioinformatics, Geneva,
Switzerland
DTU
Technical University of Denmark, Lyngby,
Denmark
UH
University of Helsinki, Helsinki, Finland
IMAS
Institut Municipal d'Assistència Sanitària,
Barcelona, Spain
Sanger
Genome Research Ltd, Hinxton, Cambridge,
UK
MPII
Max-Planck Institute for Informatics,
Saarbrucken, Germany
HUJI
The Hebrew University of Jerusalem, Givat
Ram, Israel
Bio-Rome
Department of Biochemical Sciences
University of Rome "La Sapienza", Rome,
Italy
STO
University of Stockholm , Stochkolm,
Sweden
UOXF.H5
University of Oxford, Oxford, UK
UCL
University College London, London, UK
UNIGE
University of Geneva, Geneva,
Switzerland
ENZIM
Institute of Enzymology, Hungarian
Academy of Sciences, Budapest,
Hungray
UNIK
University of Cologne, Cologne, Germany
IP
Institut Pasteur, Paris, France
BIB
BioInfoBank Institute, Poznan, Poland
MPIMG
Max Planck Institute for Molecular
Genetics, Berlin, Germany
Genoscope
Genoscope, Evry, France
UNIBO
University of Bologna, Bologna, Italy
Celem BioSapines jest głębsze poznanie informacji zakodowanej w genomie ludzkim za pomocą
nowoczesnych metod bioinformatycznych oraz danych eksperymentalnych. Sieć stworzy Europejski
Wirtualny Instytut Adnotacji Gnomów. Partnerzy sieci będą zaangażowani w poprawę jakości badań
bioinformatycznych w Europie poprzez skoncentrowany wysiłek, unikanie duplikowania czynności
badawczych, wspólne spotkania, warsztaty i konferencje oraz skoordynowaną pracę badawczą. Ważnym
aspektem programu jest wzmożenie współpracy między jednostkami obliczeniowymi i eksperymentalnymi
poprzez ukierunkowany program analizy genomu skoncentrowany na istotnych problemach biologicznych.
Adnotacje i Analizy stworzone przez sieć będą opublikowane i udostępnione w formie serwisów
internetowych. Do tego celu zostanie wykorzystany system rozproszonej adnotacji (distributed annotation
system DAS), który wykorzysta nowe osiągnięcia w zakresie „grid’ów” obliczeniowych. Celem sieci jest
również stworzenie Europejskiej Szkoły Bioinformatyki. Celem szkoły jest edukacja bioinformatyków,
którzy byliby w stanie wprowadzić najwyższe standardy w eksploatacji i wykorzystaniu informacji
genetycznej organizmów. Szkoła będzie prowadzić kursy na wszystkich szczeblach i będzie otwarta dla
wszystkich chętnych. Europejscy naukowcy są tradycyjnie bardzo aktywną grupą działającą w dziedzinie
adnotacji genów i białek a Ensembl i SWISS-PROT (teraz UniProt) są najważniejszymi źródła informacji z
tej branży używanymi na całym świecie. Wiele metod używanych przy adnotacji gnomów, sekwencji i
struktur genów i białek oraz do analizy szlaków metabolicznych i sygnałowych zostało stworzonych w
Europie. Sieć BioSapiens będzie dalej podwyższać kompetencje i konkurencyjność Europy poprzez nowe
odkrycia, wzmożoną integrację, edukację oraz polepszenie i usprawnienie metod obliczeniowych. Sieć
zwiększy rolę Europy w eksploatacji informacji genetycznej. Głównym celem integracji polskiej jednostki w
Sieć doskonałości było umożliwienie wykorzystania ekspertyzy i unikalnych metod przewidywania struktury
białek opracowanych przez Instytut BioInfoBank. Budżet całego projektu to 12 milionów Euro. Projekt
realizuje następujące obszary priorytetowe: 1) zdrowie i życie, 2) technologie informacyjne.
GeneFun (2004-2006)
Odszyfrowanie informacji zawartej w sekwencjach genomowych, rozumiane jako poznanie funkcji genów i
białek stanowi wielkie wyzwanie ery post-genomowej. Obecnie gros przyporządkowań funkcji do nowo
zsekwencjonowanych genomów, uzyskuje się przy użyciu bioinformatycznych narzędzi, przewidujących
funkcję genu na podstawie podobieństwa jego sekwencji do [sekwencji] innych genów o znanej funkcji.
Uznanym faktem jest, iż te pierwotne, bazujące na podobieństwie sekwencji, procedury przyporządkowania
funkcji są częstokroć niedokładne i podatne na błędy. Dalsze ich stosowanie bez jasnego i jawnego
określenia granicy ich użyteczności prowadziłoby do nienaprawialnej propagacji błędów, która mogłaby
zagrozić postępowi wiedzy biologicznej. Z drugiej strony, stają się dostępne różnorakie nowe zbiory danych
i zasobów [do ich analizy]. Dostarczają one informacji kontekstowej o biologicznej funkcji genów, głównie
o fizycznych i funkcjonalnych interakcjach pomiędzy genami i białkami, jak również o całych procesach i
sieciach [regulacyjnych]. Równolegle funkcjonujące światowe inicjatywy w dziedzinie genomiki
strukturalnej, dostarczają o wiele lepszego obrazu motywów strukturalnych przyjmowanych przez białka,
oraz interakcji pomiędzy nimi. Dostępność tych dodatkowych i nowych danych tworzy nie mającą
precedensu okazję do stworzenia metod dla inkorporacji danych funkcjonalnych wyższego poziomu w ramy
procesu adnotowania sekwencji [annotation pipeline]. Celem projektu GENEFUN jest odpowiedź na dwa
wyżej wspomniane zagadnienia. Czynnik błędów w adnotacji sekwencji zostanie opanowany przez rozwój
kryteriów oceny wiarygodności adnotacji obecnie dostępnych w bazach danych. Kryteria te zostaną
wykorzystane do przydzielenia współczynników wiarygodności i włączone w przyszłe, ustandaryzowane
procesy adnotacji sekwencji. W kwestii inkorporacji adnotacji wyższego poziomu w adnotacje funkcjonalne,
zostaną połączone informacja o strukturze i sekwencji w celu identyfikacji nie-liniowych cech sekwencji
(np. miejsc interakcji). Podobnie zintegrowane zostaną dostępne i nowo utworzone metody przewidywania
funkcji na podstawie informacji kontekstowej i wyższego poziomu (architektura domenowa białek,
interakcje białko-białko, kontekst genomowy jak np. uszeregowanie genów). Aby osiągnąć te cele kilka
europejskich grup z dużym doświadczeniem w tworzeniu nowych metod i prowadzeniu analiz w zakresie
genomiki porównawczej, bioinformatyki zorientowanej na strukturę i systemy, oraz w informatyce, podjęło
współpracę z grupą eksperymentatorów z Kanady, znaną ze swych wybitnych osiągnięć na polu strukturalnej
i funkcjonalnej genomiki. Oczekiwane wyniki projektu GENEFUN to: ulepszone procedury przewidywania
funkcji na bazie podobieństwa sekwencji, zbiór procedur do przewidywania (w zautomatyzowany sposób)
nie-liniowych cech funkcjonalnych na podstawie sekwencji i struktury 3D, oraz przetestowane pod
względem efektywności procedury predykcji cech funkcjonalnych związanych z kontekstem. Duży nacisk
zostanie położony na stworzenie protokołów postępowania łączących, w optymalny sposób, wyniki [analiz
przy użyciu] większej liczby metod. W szczególności, zostaną stworzone i udostępnione społeczności
naukowej serwery sieciowe, zarówno oparte na pojedynczych procedurach jak i ich zestawach. Narzędzia te
będą popularyzowane w społeczności naukowej na drodze otwartych warsztatów i sesji treningowych.
Rozwinięte narzędzia powinny stanowić ważki wkład w dzieło poprawy adnotacji in silico funkcji genów, a
co za tym idzie wywrzeć istotny efekt na cały sektor biotechnologiczny, w znacznym stopniu bazujący na
wspomnianych adnotacjach. Projekt realizuje następujące obszary priorytetowe: 1) zdrowie i życie, 2)
ekologia, 3) technologie informacyjne.
DataGenome (2004-2006)
Chiralność jest kluczowym czynnikiem efektywności wielu leków, co powoduje, że coraz ważniejsza staje
się produkcja poszczególnych enancjomerów związków chiralnych. Kataliza enzymatyczna w
przeciwieństwie do syntezy chemicznej oferuje wysoką enancjoselektywność i regioselektywność w syntezie
związków chiralnych. Dane molekularne są niebywałym źródłem enzymów do bio-katalizy. W celu pełnego
wykorzystania potencjału tego źródła konieczne jest opracowanie nowych efektywnych metod ich
pozyskiwania. Projekt DataGenome skupia się na wyszukiwaniu nowych enzymów z publicznych i
komercyjnych genomów bakteryjnych (w szczególności nowych dehydrogenaz alkoholowych i
monooksygenaz), oraz identyfikowania kluczowych aminokwasów w celu opracowania innowacyjnych
procesów syntezy asymetrycznej. Projekt wykorzystuje analizę genomową, klonowanie, ekspresję, produkcję
enzymów i inżynierię białkową do enzymatycznej produkcji związków chiralnych. Projekt wykorzystuje
dużą ilość danych wyjściowych w celu przeszukania jak największej ilości genów uzyskując w ten sposób
wysoką wydajność w wyborze enzymów będących najlepszymi kandydatami. Unikalne połączenie
ekspertyzy i planowania badań umożliwi wysoką skuteczność udoskonalania nowych biokatalizatorów.
Szczególny nacisk zostanie położony na efektywną analizę bioinformatyczną by zminimalizować
wykorzystanie bardziej wymagającej „mokrej” analizy laboratoryjnej, a także rozwoju zoptymalizowanych
wektorów ekspresyjnych w celu efektywnej ekspresji genów i produkcji enzymów. Racjonalna inżynieria
białek oraz ukierunkowana ewolucja molekularna zostanie wykorzystana w celu otrzymania
efektywniejszych enzymów, nowych preferencji substratowych lub rozszerzonej selektywności w kierunku
określonych enancjomerów. Wybrane enzymy zostaną przetestowane w istniejących lub nowych procesach
bio-katalitycznych w celu produkcji związków chiralnych o zastosowaniu terapeutycznym w leczeniu
schorzeń takich jak AIDS, nowotwory, czy choroba Alzheimera. Głównym wkładem jednostki polskiej
bioinformatycznej jest opracowanie i zastosowanie nowych metod do przewidywania specyficzności
substratowej enzymów. Projekt realizuje następujące obszary priorytetowe: 1) nowe materiały, 2) ekologia,
3) technologie informacyjne.
Zgłoś jeśli naruszono regulamin