banner

소식

Nov 15, 2023

SARS에 대한 세 가지 차세대 염기서열 분석 절차의 ISO15189 검증 및 인증을 위한 최소 요구 사항

Scientific Reports 13권, 기사 번호: 6934(2023) 이 기사 인용

774 액세스

1 알트메트릭

측정항목 세부정보

새로운 SARS-CoV-2 변종(변종)이 신속하고 반복적으로 발생하면서 전 세계 공중 보건 당국은 우려되는 변종의 순환을 모니터링하기 위한 감시 네트워크를 구축하게 되었습니다. 차세대 시퀀싱 기술의 사용으로 인해 임상 실험실에서 요구되는 품질 관리 평가의 필요성이 높아졌습니다. 본 연구는 ISO15189 표준을 충족하는 세 가지 NGS 방법을 사용하여 SARS-CoV-2 유형 지정에 대한 검증 가이드를 제안한 최초의 연구입니다. 여기에는 방법의 위험, 특이성, 정확성, 재현성 및 반복성에 대한 평가가 포함됩니다. 사용된 세 가지 방법 중 두 가지는 Oxford Nanopore Technologies의 역전사 중합효소 연쇄 반응(Artic v3 및 Midnight v1)을 포함하는 앰플리콘 기반이고, 세 번째는 Illumina 기술의 역보체 중합효소 연쇄 반응(Nimagen)을 사용하는 앰플리콘 기반입니다. 우리는 모든 방법이 임상 환경에서 SARS-CoV-2 입력에 대한 품질 요구 사항(예: 정확도, 재현성 및 반복성에 대한 100% 일치 입력 결과)을 충족한다는 것을 확인했습니다. 또한 세 가지 시퀀싱 방법 각각에서 나타나는 타이핑 결과는 널리 알려진 세 가지 명명법(WHO, Pangolineage 및 Nextclade)을 사용하여 비교되었습니다. 또한 단일 뉴클레오티드 변이에 대해서도 비교되었습니다. 결과에 따르면 Artic v3와 Nimagen은 임상 환경에서 분석을 위한 포함 기준을 충족하지 않는 샘플에 대해 더 높은 품질의 결과를 제공하므로 발병 조사에 특권이 있어야 합니다. 이 연구는 의료 기기 및 체외 진단에 대한 새로운 유럽 규정의 맥락에서 실험실에서 개발한 NGS 테스트를 검증하기 위한 첫 번째 단계입니다.

코로나바이러스는 외피가 있는 단일 가닥 RNA 바이러스로 포유동물과 조류에 널리 분포하며 호흡기 감염을 비롯한 광범위한 질병을 유발합니다. 이들 바이러스는 유전적 다양성이 뛰어나고 유전적 재조합 및 돌연변이를 수행하는 능력이 높습니다1,2. 2019년 말, SARS-CoV-2라는 코로나바이러스 아과의 새로운 구성원이 중국(우한)에서 처음 발견되었으며, 그에 따른 전례 없는 전 세계적 유행병의 원인이 되었습니다. 다른 RNA 바이러스에 비해 돌연변이 빈도가 낮음에도 불구하고3, 인간에서 SARS-CoV-2의 높은 전염률은 돌연변이 획득 및 그에 따른 진화 가능성을 높입니다. 따라서 관심 변종과 우려 변종(VOC)을 포함하여 SARS-CoV-2의 많은 변종이 시간이 지남에 따라 등장했습니다. 후자는 이전에 순환하는 균주3,4,5,6보다 높은 전염성 및/또는 면역 회피 능력을 나타냅니다.

대부분의 국가에서는 의료 시설의 홍수를 방지하고 필수 치료가 필요한 사람들이 의료 서비스를 받을 수 있도록 보장하기 위해 공중 보건 조치를 시행하여 새로운 감염 물결을 통제하려고 노력해 왔습니다. 이러한 맥락에서 새로운 순환 변종과 집단 내 전파를 조기에 감지할 수 있는 효율적인 감시 네트워크를 개발하는 것이 필수적이었습니다7,8. 전체 게놈 서열 분석은 과학자들이 바이러스를 연구하고 백신을 개발하는 데 도움이 될 뿐만 아니라 강력한 감시 네트워크를 구축하는 핵심 도구이기도 합니다.

전체 SARS-CoV-2 게놈은 바이러스에 감염된 세포를 사용하고 여러 NGS(차세대 시퀀싱) 기술(예: Illumina 및 Oxford Nanopore Technologies)을 결합하여 2020년 초에 처음으로 시퀀싱되었습니다9. 두 기술 모두 순환 균주5,6,7,10,11의 서열을 얻기 위해 전 세계적으로 널리 사용되고 있습니다. 2020년 9월, 코로나바이러스 질병 2019(COVID-19) Genomics UK Consortium이라고 불리는 영국 국가 시퀀싱 네트워크는 오늘날 알파 변종(B.1.1.7)으로 알려진 최초의 VOC를 식별했습니다. SARS-CoV-2의 이 변종은 HV69-70 결실과 N501Y 아미노산 돌연변이가 특징입니다. 이는 매우 빠르게 확산될 수 있었으며 역학적 이점을 부여하는 것으로 알려진 3개의 돌연변이(예: N501Y, 69-70 결실, P681H)를 포함하여 우한에서 확인된 첫 번째 균주와 비교하여 총 14개의 계통별 아미노산 대체를 나타냈습니다7,12 . 이후 베타(K417N, E484K), 감마(K417T, V1176F), 델타(L19R, L452R, 157-158 삭제, L452R, T478K, D950N), 최신 오미크론 등 4가지 주요 우려 변종이 전 세계적으로 확인되었습니다. (R346K, L452X, F486V) 변형. 이러한 각 변종에는 우한 참조 게놈6,13,14과 비교하여 60개 이상의 돌연변이를 획득한 현재 가장 널리 퍼진 오미크론 변종까지 진화적 이점을 제공하는 돌연변이가 축적되어 있습니다.

25. 40 \(\upmu\)L of each pool diluted with 60 \(\upmu\)L of RC-PCR Low-TE buffer (Nimagen B.V.; Nijmegen, Netherlands) was purified using 85 \(\upmu\)L of Solid Phase Reversible Immobilization (SPRI) AmplicleanTM magnetic beads (Nimagen B.V.; Nijmegen, Netherlands) by mixing DNA and beads (beads:DNA ratio = 0.85), followed by incubation of the mix at room temperature (RT) for 5 min, then beads were washed twice with 75% ethanol. Beads covered with DNA fragments of interest were mixed with 110 \(\upmu\)L of RC-PCR Low TE Buffer (Nimagen B.V.; Netherlands) and incubated at RT for 2 min. The purification procedure was repeated a second time. Eluted DNA from each pool was quantified using the 1xdsDNA HS kit (Thermo Fisher Scientific; MA, USA) with the Qubit 4.0 (Thermo Fisher Scientific; MA, USA) and amplicons size and integrity were checked using the QIAxcel fragment analyzer (Qiagen; Hilden, Germany) with the DNA Screening Kit (Qiagen; Hilden, Germany)./p>9) and their length (Artic: minimum length= 400 bp - maximum length= 700 bp, Midnight: minimum length= 600 bp - maximum length= 1,200 bp) to avoid chimeric reads. The passed reads were mapped to the reference genome of SARS-CoV-2 MN908947.3 using minimap2 (version 2.18-r1015) and SNVs were called for positions with depth of reads \(\ge\) 20, and consensus sequence obtained using medaka (version 1.4.3, model r941_prom_variant_g360) a software using trained neural network-based models to appropriately call sequence variations29./p> 0.81 for SNV identification./p> 0.81 for SNV identification./p> 100x, run 2: mean coverage= 0x, 0% > 100x, run 3: mean coverage= 5x, 1.5% > 100x)./p> 0.8) for all samples with a qPCR Ct value < 25 (Artic v3: mean \(\kappa\) = 0.9918 ± 0.01060, Midnight v1: mean \(\kappa\) = 1 ± 0, Nimagen: mean \(\kappa\) = 0.9433 ± 0.1468). For the sample with the highest qPCR Ct value (Ct = 29.01), coefficients are lower (Artic v3: \(\kappa\) = 0.6896 ± 0.02007, Midnight v1: \(\kappa\) = 0 ± 0.00005, Nimagen: \(\kappa\) = 0.7659 ± 0.05119) indicating a greater discrepancy, especially for the Midnight v1 SOP. Both short-amplicon methods (Artic v3 and Nimagen) have a coefficient indicating a high correlation (Fig. 1 left panel). Although the reproducibility of the three methods is similar for samples with a qPCR Ct value <25, the reproducibility of the Midnight v1 SOP is significantly different from that of both other methods for samples with a qPCR Ct value >25 (Supplementary table 3)./p> 100x, repeat 2: mean coverage= 0x, 0% > 100x, repeat 3: mean coverage= 1x, 0% > 100x) (Supplementary table 4)./p> 25 (Artic v3: \(\kappa\) = 0.7279 ± 0.08269, Midnight v1: \(\kappa\) = 0 ± 0, Nimagen: \(\kappa\) = 0.8837 ± 0.03753) still showing a high repeatability for Nimagen and Artic while Midnight v1 is not repeatable./p>25 (Artic v3: \(\kappa\) = 0.7581 ± 0.01951, Nimagen: \(\kappa\) = 0.8287 ± 0.01903), especially for the Midnight v1 SOP which had a \(\kappa\) coefficient = 0 ± 0.00003, indicating that it was not repeatable for samples with a qPCR Ct value > 25 (Fig. 1 right panel). This was due to the low read depth (<20) at most nucleotide positions for two repeats performed with the Midnight v1 SOP. As this depth was the minimum threshold set in the bio-informatics pipeline for nucleotide calling in the consensus sequence, and as the third repeat had a sufficient read depth at these positions, the analysis resulted in a complete mismatch. Although the repeatability is not significantly different between the three methods for samples with qPCR Ct value <25, the repeatability of the Midnight v1 SOP is significantly different when compared with both other methods for qPCR Ct value >25 (Supplementary table 3)./p> 25 in clinical setting, sequencing results and strain typing can be obtained in non-clinical setting but should be interpreted with caution. Therefore, we compared the three methods using fifty-five samples without considering the Ct value exclusion criteria./p>30 for the N-gene (Table 2)./p>25 (Table 2), which led us to study the evolution of genome coverage as a function of viral load. We observed that for the three SOPs, the coverage was high for all samples with a N-gene qPCR Ct values <25 (96% and 90% of samples had a mean coverage above 380x for Artic v3 and Midnight v1 methods, respectively, and 90% of samples have a mean coverage above 600\(\times\) for Nimagen method) but the sequencing coverage dropped drastically with the three SOPs for samples with a qPCR Ct value >25 (Fig. 2)./p>25./p>25, the kappa coefficient decreased progressively with the increase of Ct value. This decrease was similar when comparing any method to one another (Fig. 3). However, all the mismatches observed can be explained by a too low read depth at the position of the mismatch for the method that did not identify the mutation (<20 reads for the Nanopore methods or <5 reads for the Illumina method). When, at that genomic position, the depth of reads was greater than 0 but below the previously mentioned cut-offs, we observed that the mutation was present in more than 70% of the reads, indicating that the discrepancies were not due to sequencing errors inherent to the methods but rather to the detection thresholds set in the bio-informatics pipelines./p>25 usually showed insufficient read depth which provided low reliability on some key mutations, which could lead to wrong or approximate lineage designation, highlighting the importance of sample selection criteria in the context of national surveillance programs using clinical samples8,38. Our data confirmed that the three methods validated here provided similar quality results and were adequate for epidemiological monitoring of SARS-CoV-2 using samples with N-gene qPCR CT value <25 in clinical setting./p>25), a method using smaller amplicons (Artic v3 and Nimagen) should be preferred as they exhibit better reproducibility and repeatability, and a higher mean coverage of the genome. This variability in coverage for samples with a low viral load had already been reported by Freed et al. Nevertheless, they have shown that it was possible to reach good quality results by generating more sequencing data than for samples with high or medium viral loads. This was not achieved in our study as we sequenced all samples under the same conditions. It has also been shown that in order to effectively detect SNVs and by extension reach a minimum coverage of 400x with an amplicon-based NGS technique, the material used for reverse transcription should contain at least 1,000 copies of viral RNA39,40./p>

공유하다