L1-Cwiczenia(2).pdf
(
192 KB
)
Pobierz
1. Z bazy danych PDB pobierz co najmniej dwa dowolne plik ze strukturą przestrzenną białka w
formacie pdb. Przy czym przynajmniej jeden z plików musi zawierad więcej niż jeden model ,
jeden przynajmniej musi mied długośd większą od 1000aa i jeden musi zawierad więcej niż
dwa łaocuchy . Proponuje użyd:
http://www.pdb.org/pdb/files/3GAU.pdb
i
2KYV.
Do pobrania plików można wykorzystad polecenie wget.
2. Zapoznaj się z formatem PDB poprzez otworzenie plików w edytorze tekstowym (np. w vi) i
poprzez zapoznanie się z jego specyfikacją:
http://www.wwpdb.org/documentation/format33/v3.3.html
Teraz zobacz jak wygląda numeracja aminokwasów w pliku: 2BB2 – szczególnie zwród uwagę
na numer aminokwasu dla atomu 1 i numer aminokwasu dla atomu 245.
3. Dla pobranego pliku PDB:
a. Zlicz liczbę wszystkich atomów (z pominięciem heteroatomów):
i. Wykorzystując do tego następujące polecenia: grep i wc. Całe polecenie
należy zapisad w pojedynczej linii
ii. Powtórz powyższe dwiczenie pisząc krótki skrypt w AWK.
b. Podaj liczbę modeli zapisanych w pojedynczym pliku. Jakich poleceo do tego
użyjesz?
c. Dla każdego modelu w pliku PDB wypisz identyfikatory poszczególnych łaocuchów
(każdy identyfikator tylko raz)wykorzystując do tego celu AWK i opcjonalnie
polecenie sort.
d. Zamieo w pliku wszystkie histydyny z his na hsd (to może się przydad, gdy będziesz
uruchamiad symulację np. w NAMD). Spróbuj użyd do tego sed-a lub m4 (albo AWK)
e. Wypisz sekwencję aminokwasową na podstawie rekordów ATOM w postaci notacji
jednoliterowej jako pojedynczy ciąg znaków. Dla przypomnienia:
alanine - ala - A , arginine - arg – R, asparagine - asn – N, aspartic acid - asp – D,
cysteine - cys – C, glutamine - gln - Q , glutamic acid - glu - E , glycine - gly – G,
histidine – his (hsd) - H, isoleucine - ile – I, leucine - leu – L, lysine - lys – K,
methionine - met – M, phenylalanine - phe – F, proline - pro – P, serine - ser – S,
threonine - thr – T, tryptophan - trp – W, tyrosine - tyr – Y, valine - val – V
Materiały pomocnicze:
http://www.ibm.com/developerworks/linux/library/l-bash/index.html
http://www.ibm.com/developerworks/linux/library/l-sed1/index.html
http://www.ibm.com/developerworks/linux/library/l-awk1/index.html
http://www.thegeekstuff.com/2009/03/15-practical-unix-grep-command-
examples/
Plik z chomika:
xyzgeo
Inne pliki z tego folderu:
pd-dok(2).pdf
(17987 KB)
06_Struktura-norm(2).pdf
(10166 KB)
odgadywanie.pdf
(1383 KB)
00b49539caa3d60629000000(2).pdf
(948 KB)
164-183-1-SM (1)(2).pdf
(843 KB)
Inne foldery tego chomika:
0
algorytmika
artykuly
bioinformatyka (biotech06)
Bioinformatyka (patryska89)
Zgłoś jeśli
naruszono regulamin