Wirusy jednoniciowego RNA, takie jak SARS-CoV-2, wykorzystują w zakażonych komórkach szablony RNA o ujemnej nici, co może prowadzić, poprzez rekombinację wyboru kopii z RNA SARS-CoV-2 o ujemnym znaczeniu, do integracji ujemnej nici MSH3, w tym FCS, z genomem wirusowym. W każdym razie, obecność 19-nukleotydowej sekwencji RNA zawierającej FCS o 100% identyczności z odwrotnym dopełnieniem mRNA MSH3 jest wysoce niezwykłe i wymaga dalszych badań.
Autorzy:
Wstęp
Na podstawie ostatniej publikacji opisującej warianty insercyjne wirusa SARS-CoV-2 (1) chcielibyśmy zwrócić uwagę na nasze ostatnie odkrycia dotyczące sekwencji miejsca rozszczepienia furyn (FCS) w białku Spike (S) wirusa SARS-CoV-2. SARS-CoV-2 wywołujący pandemię COVID-19 (2) ma 82,3% identyczności aminokwasów z koronawirusem nietoperzy SL-CoVZC45, 77,2% identyczności aminokwasów z SARS-CoV i 96,2% identyczności sekwencji genomu z koronawirusem nietoperzy RaTG13. Podczas gdy między SARS-CoV-2 i RaTG13 istnieją liczne różnice w mutacjach punktowych, odkryto tylko jedną insercję i odmienność przekraczającą 3 nukleotydy (nt): 12-nukleotydową insercję kodującą cztery aminokwasy (aa 681-684, PRRA) w białku S SARS-CoV-2. Ten polibazowy FCS odróżnia SARS-CoV-2 od innych betakoronawirusów linii b lub innych sarbekowirusów (3). Dodatek FCS zwiększał zakaźność wirusa SARS Co-V-2 w 2019 roku (4). Brak tego FCS powoduje powstanie atenuowanych wariantów SARS-CoV-2 przydatnych do szczepień na zwierzętach, co podkreśla jego znaczenie w zakażeniach u ludzi (5). Opisywany FCS jest niezbędny do przenoszenia wirusa u ludzi i fretek (6), zwiększa tropizm wirusa do komórek ludzkich (7) i jest niezbędny do wystąpienia ciężkiej choroby w dwóch zwierzęcych modelach SARS-CoV-2 (8).
Białko SARS-CoV-2 Spike i MSH3
Osobliwą cechą sekwencji nukleotydowej kodującej miejsce rozszczepienia furyny PRRA w białku SARS-CoV-2 są dwa kolejne kodony CGG. Ten kodon argininy jest rzadko spotykany w koronawirusach: względne synonimiczne użycie kodonów (RSCU) CGG w CoV pangolina wynosi 0, w CoV nietoperza 0,08, w SARS-CoV 0,19, w MERS-CoV 0,25, a w SARS-CoV-2 0,299 (9).
Wyszukiwanie metodą BLAST dla 12-nukleotydowej insercji doprowadziło nas do 100% odwrotnego dopasowania w sekwencji zastrzeżonej (SEQ ID11652, nt 2751-2733) znalezionej w patencie USA 9,587,003 zgłoszonym 4 lutego 2016 (10) (Ryc. 1). Badanie SEQ ID11652 ujawniło, że dopasowanie wykracza poza 12-nukleotydową wstawkę i obejmuje sekwencję 19-nukleotydową: 5′-CTACGTGCCCGCCGAGGAG-3′ (nt 2733-2751 z SEQ ID11652), tak że powstałe mRNA miałoby 3′- GAUGCACGGCGCUCCUC-5′, lub równoważnie 5′- CU CCU CGG CGG GCA CGU AG-3′ (nukleotydy 23547-23565 w genomie SARS-CoV-2, w którym cztery pogrubione kodony dają PRRA, aminokwasy 681-684 białka szpiku). Jest to bardzo rzadkie zjawisko w bazie danych NCBI BLAST.
Rycina 1. Pochodzenie sekwencji furinowej w SARS-CoV-2. Porównanie sekwencji białek na styku S1/S2 w SARS-CoV, RaTG13 i SARS-CoV-2 wykazujące obecność miejsca rozszczepienia furiny (FCS) PRRA tylko w SARS-CoV-2. W oparciu o wyszukiwanie metodą BLAST 12-nukleotydowego odcinka kodującego FCS PRRA, zidentyfikowano identyczną sekwencję o długości 19-nukleotydów w opatentowanej (US 958 7003) sekwencji Seq ID11652. SEQ ID11652 jest transkrybowana do mRNA MSH3, które wydaje się być zoptymalizowane kodonowo dla człowieka. Ta 19-nukleotydowa sekwencja, w tym 12 nukleotydów kodujących FCS PRRA, obecna w ludzkim genie MSH3 mogła zostać wprowadzona do genomu SARS-CoV-2 za pomocą przedstawionego mechanizmu rekombinacji z wyborem kopii w ludzkich komórkach zakażonych SARS-CoV-2, w których dochodzi do nadekspresji genu MSH3.
Korelacja między tą sekwencją SARS-CoV-2 a odwrotnym uzupełnieniem zastrzeżonej sekwencji mRNA jest niepewnego pochodzenia. Konwencjonalna analiza biostatystyczna wskazuje, że prawdopodobieństwo przypadkowej obecności tej sekwencji w 30 000-nukleotydowym genomie wirusowym wynosi 3,21 ×10-11 (ryc. 2).
Rysunek 2. Obliczenia prawdopodobieństwa naturalnego występowania badanej sekwencji 19nt. Genom SARS-CoV-2 ma długość ~30 000 nukleotydów (P1). Sekwencja opatentowana ma długość ~3 300 nukleotydów (P2). Biblioteka opatentowana obejmuje 24'712 sekwencji o różnej długości, przy czym mediana długości wynosi 3 300 nukleotydów. Podano konwencjonalne obliczenia prawdopodobieństwa obecności sekwencji 19-nukleotydowej w genomie ludzkim i w jednej z sekwencji opatentowanej biblioteki.
Zastrzeżona sekwencja SEQ ID11652, odczytywana w kierunku do przodu, koduje 100% aminokwasową zgodność z ludzkim mut S homolog 3 (MSH3) (9). MSH3 jest białkiem naprawczym niedopasowania DNA (część kompleksu MutS beta) (11). SEQ ID11652 jest transkrybowany do mRNA MSH3, które wydaje się być zoptymalizowane kodonowo dla człowieka (12). Nie znaleźliśmy 19-nukleotydowej sekwencji CTCCTCGGCGGCACGTAG w żadnym genomie eukariotycznym ani wirusowym, z wyjątkiem SARS-CoV-2 o 100% pokryciu i identyczności w bazie danych BLAST (Tabele uzupełniające 1-3).
Dyskusja
Zastąpienie MSH3 sekwencją mRNA zoptymalizowaną pod względem kodonów do ekspresji u ludzi ma prawdopodobnie zastosowanie w nowotworach z niedoborami naprawy niedopasowania. Podczas gdy część odwrotnej sekwencji dopełniacza występująca w SARS-CoV-2 może być przypadkowym zbiegiem okoliczności, należy rozważyć inne możliwości.
Wiadomo, że nadekspresja MSH3 zakłóca naprawę niedopasowania (sekwestracja MSH2 z kompleksu MutS alfa, w skład którego wchodzą MSH2 i MSH6, powoduje degradację MSH6 i wyczerpanie MutS alfa) (13), co ma znaczenie wirusologiczne. Indukcja niedoboru naprawy niedopasowania DNA skutkuje permisywnością zakażenia wirusem grypy A (IAV) ludzkich komórek układu oddechowego i zwiększoną patogennością (14). Niedobór naprawy niedopasowania może przedłużać wydalanie wirusa SARS-CoV-2 (15, 16).
Brak CTCCTCTCGGCGGCACGTAG w jakimkolwiek genomie eukariotycznym lub wirusowym w bazie danych BLAST sprawia, że rekombinacja w żywicielu pośrednim jest mało prawdopodobnym wyjaśnieniem jego obecności w SARS-CoV-2. Zoptymalizowany pod kątem ludzkich kodonów mRNA kodujący białko w 100% homologiczne do ludzkiego MSH3 mógłby, podczas badań nad wirusami, nieumyślnie lub celowo wywołać niedobór naprawy niedopasowania w ludzkiej linii komórkowej, co zwiększyłoby podatność na infekcję wirusem podobnym do SARS. Zakażenie ludzkich komórek transdukowanych SEQ ID11652-MSH3 wirusem podobnym do SARS mogłoby umożliwić rekombinację z wyborem kopii (15). Replikacja SARS-CoV-2 i innych jednoniciowych wirusów RNA z genomem RNA o dodatniej polarności jest inicjowana przez syntezę RNA o ujemnej nici w cytoplazmie zakażonych komórek (17) (Rysunek 1). Ujemna nić RNA stanowi szablon do syntezy dodatniej nici RNA wykorzystywanej do translacji białek niestrukturalnych, kompleksu replikacyjno-skrypcyjnego lub nowych kapsydów wirusa. Koronawirusy wytwarzają dwuniciowe RNA na wczesnym etapie zakażenia poprzez replikację genomu i transkrypcję mRNA (18).
Nabycie sekwencji FCS o odwrotnym dopełnieniu z nadekspresyjnego mRNA MSH3 o dodatnim sensie może nastąpić w wyniku rekombinacji z wyboru kopii z pośrednim RNA SARS-CoV-2 o ujemnej wartości (15), co wiąże się z przeskakiwaniem z jednego szablonu na drugi (19) (rysunek 1). Homologia między SARS-CoV-2 i innymi znanymi koronawirusami jest przerwana, a większość sekwencji SARS-CoV-2 pochodzi od stosunkowo niedawnego wspólnego przodka z nietoperzem RaTG13. Co więcej, wykresy podobieństwa (SimPlots) zidentyfikowały nagłe zmiany w identyczności sekwencji między SARS-CoV-2 i RaTG13, sygnalizujące potencjalne zdarzenia rekombinacyjne, co mogłoby wyjaśnić zdolność SARS-CoV-2 do wiązania się z ACE2 poprzez RBD, co nie występuje w przypadku RBD RaTG13 (15).
Krytyka tej hipotezy polega na tym, że zidentyfikowana sekwencja znajduje się po przeciwnej stronie otwartej ramki odczytu w SEQ ID11652. Jednakże, komórki transfekowane MSH3, które indukują niedobór naprawy niedopasowania, mogły skierować dwuniciowe cDNA kodujące SEQ ID11652. Takie komórki poddane współtransfekcji z wirusem podobnym do SARS, wykazującym ekspresję RdRp, mogły przyłączyć się do tej 19-nukleotydowej sekwencji (15) i umożliwić integrację fragmentu z nici ujemnej do genomu wirusowego, w tym FCS, mimo że znajdował się on na przeciwnej nici otwartej ramki odczytu. Mechanizmy naprawy niedopasowania umożliwiły integrację krótkich fragmentów z nici antysensowych w modelach eksperymentalnych (20, 21). Mikrohomologia może kierować rekombinacją między MSH3 a wirusem podobnym do SARS, co może mieć miejsce w interesującej nas sekwencji 19-nukleotydowej.
Obecność w SARS-CoV-2 19-nukleotydowej sekwencji RNA kodującej FCS w aminokwasie 681 jego białka spike o 100% identyczności z odwrotnym dopełnieniem sekwencji mRNA MSH3 jest wysoce niezwykła. Należy dokładniej zbadać potencjalne wyjaśnienia tej korelacji.
Oświadczenie o dostępności danych
W tym badaniu przeanalizowano publicznie dostępne zestawy danych. Dane te można znaleźć tutaj: SEQ ID11652.
Wkład autorów
Badanie i pierwotny projekt zostały zainicjowane przez BA, AV i AB. Wizualizacja została wykonana przez BA, AV, AB i GP. Artykuł napisali i zredagowali: BA, AV, KL, GP, BU, VU i AB. Wszyscy autorzy przyczynili się do powstania artykułu i zatwierdzili przedłożoną wersję.
Konflikt interesów
Kenneth Lundstrom był zatrudniony w firmie PanTherapeutics. Pozostali autorzy deklarują, że badania były prowadzone przy braku jakichkolwiek komercyjnych lub finansowych powiązań, które mogłyby być interpretowane jako potencjalny konflikt interesów.
Nota wydawcy
Wszystkie opinie wyrażone w tym artykule są wyłącznie opiniami autorów i nie muszą reprezentować opinii organizacji z nimi związanych, wydawcy, redaktorów i recenzentów. Wydawca nie gwarantuje ani nie popiera żadnego produktu, który może być oceniany w tym artykule, ani twierdzenia jego producenta.
Podziękowania
Jesteśmy wdzięczni dr Jianowi Yingowi z Uniwersytetu Utah w Eureka (USA) za jego wkład w analizę prawdopodobieństwa.
Materiały uzupełniające
Materiały uzupełniające do tego artykułu można znaleźć w Internecie pod adresem: https://www.frontiersin.org/articles/10.3389/fviro.2022.834808/full#supplementary-material
Przypisy