Skąd aminokwasy otrzymały jednoliterowe kody?

Pytanie:

Melanie

2017-01-12 06:53:47 UTC

view on stackexchange narkive permalink

Niektóre aminokwasy mają jednoliterowy kod, który jest tylko pierwszą literą nazwy aminokwasu. Ma to sens i oczywiście, skoro jest więcej niż jeden aminokwas zaczynający się na tę samą literę, trzeba było użyć innych liter.

Ale dlaczego wybrano te inne litery? Na przykład, czy istnieje powód, dla którego wybrano „W” konkretnie dla tryptofanu (inny niż fakt, że przyjęto literę „T”)?

http://www.biology.arizona.edu/biochemistry/problem_sets/aa/Dayhoff.html

Pięć odpowiedzi:

orthocresol

2017-01-13 03:37:41 UTC

view on stackexchange narkive permalink

Tryptofan

Na przykład, czy jest jakiś powód, dla którego wybrano „W” konkretnie dla tryptofanu (inny niż fakt, że wybrano „T”)?

Po przypisaniu pozostałych 19 aminokwasów pozostało tylko 7 liter alfabetu: B, J, O, U, W, X i Z. (Z pewnością nie Scrabble hand to have!)

Jeśli ktoś chce użyć litery znajdującej się w nazwie aminokwasu, jedyną dostępną literą będzie O. Jednak historycznie odradzano używanie U i O, ponieważ litery można było łatwo pomylić z innymi literami (U z V; O z G, Q, C, D i liczbą 0).

Okazuje się, że wybór został dokonany, ponieważ W to bardzo gruba litera i przypominał układ pierścieni indolowych obecny w tryptofanie (jedynym aminokwasie zawierającym układ bicykliczny). (Zobacz poniżej źródło).

Co się zatem stało z pozostałymi sześcioma literami?

Wszystkie 26 liter alfabetu jest teraz używane jako kod jednoliterowy dla aminokwasów lub ich różnych kombinacji.

Po ich odkryciu selenocysteinie i pirolizynie (tej ostatniej występującej tylko w bakteriach) przypisano odpowiednio U i O. Ponadto B jest używane do oznaczania kwasu asparaginowego LUB asparaginy; J oznacza leucynę OR izoleucynę; Z oznacza kwas glutaminowy LUB glutaminę; a X jest używany do reprezentowania nieznanego aminokwasu.

Uważam, że B i Z znajdują zastosowanie, ponieważ w sekwencjonowaniu białek hydroliza kwasowa jest często używana do zrywania wiązań peptydowych. Ma to niepożądany efekt uboczny hydrolizowania grup amidowych w asparaginie / glutaminie, prowadząc do powstania kwasów asparaginowego / glutaminowego, co oznacza, że nie można dokładnie określić, który to był aminokwas na początku. J jest używany w spektroskopii NMR, gdzie izoleucyna i leucyna są trudne do rozróżnienia.

Dlaczego wybrali litery, które wybrali?

O ile mi wiadomo, użycie jednoliterowych symboli zostało przyjęte zarówno przez IUPAC, jak i IUB (od 1991, IUBMB) we wspólnych zaleceniach z 1983 r. dotyczących „Nazewnictwa i symbolizmu aminokwasów i peptydów”. ¹ zwięzłe podsumowanie rozwoju historycznego ankit7540 wspomniało już o tych zaleceniach.

W szczególności Sekcja 3AA-21.2 „Symbole kodu” zawiera opis, dlaczego litery zostały wybrany. Ten dokument jest prawdopodobnie najbardziej autorytatywnym stanowiskiem w tej sprawie. Uzasadnienie jest w większości zgodne z odpowiedzią Jana:

Pierwsze litery nazw aminokwasów wybrano tam, gdzie nie było dwuznaczności. Jest sześć takich przypadków: cysteina, histydyna. izoleucyna, metionina, seryna i walina. Wszystkie pozostałe aminokwasy mają wspólne początkowe litery A, G, L, P lub T, więc przypisywano je arbitralnie. Litery te zostały przypisane do najczęściej występujących i strukturalnie najprostszych aminokwasów o tych inicjałach: alanina (A), glicyna (G), leucyna (L), prolina (P) i treonina (T).

Inne przypisania zostały wykonane na podstawie skojarzeń, które mogą być pomocne w zapamiętaniu kodu, np asocjacje fonetyczne F dla fenyloalaniny i R dla argininy. W przypadku tryptofanu podwójny pierścień cząsteczki jest powiązany z dużą literą W. Litery N i Q zostały przypisane odpowiednio do asparaginy i glutaminy; D i E odpowiednio na kwas asparaginowy i glutaminowy. K i Y wybrano dla dwóch pozostałych aminokwasów, lizyny i tyrozyny, ponieważ z kilku pozostałych liter były one zbliżone alfabetycznie do początkowych liter nazw. Unikano U i O, ponieważ U można łatwo pomylić z V w materiale pisanym odręcznie, a O z G, Q, C i D na niedoskonałych wydrukach komputerowych, a także z zerem. Uniknięto języka J, ponieważ nie występuje go w kilku językach.

Dwa inne symbole są często niezbędne dla częściowo określonych sekwencji, więc B zostało przypisane do kwasu asparaginowego lub asparaginy, gdy nie zostały one rozróżnione; Podobnie przypisano Z do kwasu glutaminowego lub glutaminy. X oznacza, że tożsamość aminokwasu jest nieokreślona lub że aminokwas jest nietypowy.

Można tylko postawić hipotezę, co rozumieli przez „skojarzenia, które mogą być pomocne w zapamiętaniu kodu” w przypadku N / Q / D / E. Moje przypuszczenie jest takie:

D i E zostały prawdopodobnie wybrane dla kwasów asparaginowego i glutaminowego, ponieważ były jedynymi kolejnymi parami liter, które zostały, podkreślając ich chemiczne podobieństwo. Kwas asparaginowy jest krótszy od kwasu glutaminowego o jedną grupę metylenową (CH ₂), więc otrzymuje wcześniejszą literę D.
Glutamina brzmi jak Q-tamine. Jeśli uważasz, że nie brzmi podobnie, powtórz to 50 razy, aż to zrobisz.
AsparagiNe został przypisany N.

Referencja

Wspólna Komisja IUPAC-IUB ds. Nomenklatury Biochemicznej. Nomenclature and Symbolism for Amino Acids and Peptides: Recommendations 1983. FEBS J. 1984, 138 (1), 9–37. DOI: 10.1111 / j.1432-1033.1984.tb07877.x. Wersję HTML (być może bardziej przyjazną dla użytkownika) można znaleźć pod tym adresem.

Zawsze używałem mnemonicznego „kwasu asparTowego”, chociaż nie wiem, jak bardzo myśleli o tym biochemicy, którzy go pierwotnie przypisali.

Każdy zgaduje!

Dla D i E atomy tlenu w łańcuchach bocznych to odpowiednio atomy ** d ** elta i ** e ** psilon: Oδ1,2 i Oɛ1,2.

Jan

2017-01-13 03:07:27 UTC

view on stackexchange narkive permalink

Niektóre kody jednoliterowe, które nie są literą początkową aminokwasu, w rzeczywistości mają sens, gdy patrzy się je pod pewnym kątem. Oto lista zaczynająca się od najbardziej oczywistych:

G - Glicyna
A - Alanina
V - Walina
L - Leucyna
I - Izoleucyna
P - Prolina
S - Seryna
T - Treonina
C - Cysteina
H - Histydyna
M - Metionina

Niektóre aminokwasy mają literę, która nawiązuje do nazwy mówione zamiast pisane:

F - Fenyloalanina (zaczyna się od / f /)
R - Arginina (pierwsza sylaba mogłaby brzmieć są lub wymowa litery R)
N - Asparagi n e ^[1]

Jeden aminokwas jest oznaczony drugą literą (dwie, jeśli wyżej policzysz argininę):

Y - Tyrozyna

Kilka zostało oznaczonych literami zbliżonymi do litery początkowej, ponieważ bierze się właściwą literę początkową:

K - Lizyna (L to już leucyna)
E - Glutaminian (F i G; ale tak samo jak H i I. E to przynajmniej litera imienia)
D - Asparaginian (w zasadzie skrócona wersja E, glutaminian)

Co daje nam tryptofan i glutaminę. Glutamina to kolejna bardzo rozciągliwa:

P - Glutamina (C i G zostały pobrane, ale Q jest okrągłe po lewej stronie, tak jak G. Całkowicie oczywiste?)

I wreszcie, w przypadku tryptofanu, postanowili przyjąć rzeczywisty kształt cząsteczki. Nie widzisz tego? Oto ona:

W - Tryptofan

Właściwie może to zwykły zbieg okoliczności, ponieważ rzucili moneta z pozostawionymi literami; dla glutaminy i tryptofanu. Ale podoba mi się to wyjaśnienie.

Zawsze pamiętałem tryptofan, wymawiając go w myślach * trip-TOW-fan *, wstrzykując w ten sposób potrzebne * W *.

DavePhD

2017-01-13 20:25:52 UTC

view on stackexchange narkive permalink

Zobacz Komisja IUPAC-IUB ds. Nomenklatury Biochemicznej A One-Letter Notation for Amino Acid Sequences The Journal of Biological Chemistry tom. 243, nr 13, s. 3557-3559, 10 lipca 1968 r.:

O możliwości używania symboli jednoliterowych wspominali Gamow i Ycas (2) w 1958 r. usystematyzowane przez Šorma i wsp. (3) w 1961 roku. Było używane przez tę grupę (4-10), a także przez Fitch (11) w kilku pracach na temat struktury białek. W obszernych kompilacjach struktur białkowych Eck i Dayhoff (patrz Odnośniki 12 do 14) systematycznie używali jednoliterowych symboli pochodzących częściowo z kodu Šorma i Keila. Niezależne propozycje zostały złożone przez Wiswessera (15) i Braunsteina.

...

3.2 Pierwsze litery są używane tam, gdzie nie ma dwuznaczności. Jest sześć takich przypadków: cysteina, histydyna, izoleucyna, metionina, seryna i walina. Wszystkie pozostałe aminokwasy mają wspólne litery A, G, L, P lub T; w związku z tym ich przypisanie musi być nieco arbitralne. Litery te przypisane są do najczęściej występujących i strukturalnie najprostszych aminokwasów. Na tej podstawie litery A, G, L, P i T są przypisane odpowiednio do alaniny, glicyny, leucyny, proliny i treoniny.

3.3 Przypisanie pozostałych skrótów jest bardziej arbitralne. Jednak pewne wskazówki są pomocne. Dwa są fonetycznie sugestywne, F dla fenyloalaniny i R dla argininy. W przypadku tryptofanu podwójny pierścień w cząsteczce jest powiązany z dużą literą W. Litery N i Q są przypisane odpowiednio do asparaginy i glutaminy; D i E są przypisane odpowiednio do kwasu asparaginowego i kwasu glutaminowego. Pozostawia lizynę i tyrozynę, do których przypisane są K i Y. Są one wybierane zamiast którejkolwiek z kilku pozostałych pozostałych liter, ponieważ są one alfabetycznie najbliższe początkowym literom L i T. U i O są unikane, ponieważ U można łatwo pomylić z V zapisanym odręcznie work i O jest mylone z G, Q, C i D na niedoskonałych wydrukach komputerowych, a także z zerem. J. jest unikany ze względów językowych.

3.4 Aby uniknąć dwuznaczności, potrzebne są dwa inne skróty. B przypisuje się kwasowi asparaginowemu lub asparaginie, jeśli to rozróżnienie nie zostało określone. Z przypisuje się, gdy nie rozróżniono kwasu glutaminowego i glutaminy. X oznacza, że tożsamość aminokwasu jest nieokreślona lub że aminokwas jest nietypowy.

ankit7540

2017-01-12 08:51:10 UTC

view on stackexchange narkive permalink

Trzyliterowe oznaczenie znajduje się przed kodem jednoliterowym. Same trzyliterowe kody przeszły kilka ulepszeń i poprawek ostatecznie zaakceptowanych przez IUPAC i International Union of Biochemistry pod przewodnictwem HBF Dixon. Później zaproponowano kody jednoliterowe. (najwyraźniej dlatego, że ich pisanie było męczące). Ta propozycja wyszła od czeskich biochemików. (sprawdź historię nazewnictwa aminokwasów)

Później kody jednoliterowe zostały rekomendowane i zaakceptowane w 1994 roku (na podobnym spotkaniu IUPAC i IUB). Zalecenie można znaleźć tutaj Zalecenia dotyczące nomenklatury aminokwasów, dostępne również tutaj NCBI. Po zaakceptowaniu nowej nomenklatury w kilku głównych publikacjach opublikowano nowe wytyczne.

user86404

2019-11-28 21:26:50 UTC

view on stackexchange narkive permalink

Jestem starszym biochemikiem i nauczali mnie jeszcze starsi biochemicy, a tajemnice nazewnictwa często opierają się na tym, co może być zabawną głupotą. Nauczono mnie, że zarówno aspar ”d” ic acid, jak i t ”w” yptofan zostały wybrane ze względu na dźwięk ..... ale ponieważ nomenklatura jest określana przez międzynarodową grupę, jest mało prawdopodobne, aby był cytowany jako oficjalny powód .....

ⓘ

To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.

o nas - informacje prawne