Un codice a barre molecolare e un web

Notizia

CasaCasa / Notizia / Un codice a barre molecolare e un web

Nov 10, 2023

Un codice a barre molecolare e un web

Communications Biology volume

Biologia delle comunicazioni volume 5, numero articolo: 1411 (2022) Citare questo articolo

1834 Accessi

1 Citazioni

18 Altmetrico

Dettagli sulle metriche

Tradizionalmente, l'anamnesi di viaggio dei pazienti è stata utilizzata per distinguere i casi di malaria importata da quelli autoctoni, ma gli stadi epatici dormienti del Plasmodium vivax confondono questo approccio. Gli strumenti molecolari offrono un metodo alternativo per identificare e mappare i casi importati. Utilizzando approcci di apprendimento automatico che incorporano l'indice di fissazione gerarchico e l'analisi dell'albero decisionale applicati a 799 genomi di P. vivax provenienti da 21 paesi, abbiamo identificato i codici a barre 33-SNP, 50-SNP e 55-SNP (GEO33, GEO50 e GEO55), con elevata capacità di previsione il paese d'origine dell'infezione. Il coefficiente di correlazione Matthews (MCC) per un codice a barre 38-SNP esistente e comunemente applicato (BR38) ha superato 0,80 nel 62% dei paesi. I panel GEO hanno sovraperformato il BR38, con MCC mediani > 0,80 nel 90% dei paesi al GEO33 e nel 95% al ​​GEO50 e GEO55. È stato creato un quadro di classificazione online, ad accesso aperto e basato sulla verosimiglianza per supportare l'analisi dei dati (vivaxGEN-geo). I metodi di selezione e classificazione degli SNP possono essere facilmente modificati per altri casi d'uso per supportare i programmi di controllo della malaria.

Gli ultimi tre rapporti mondiali sulla malaria hanno rivelato un allarmante aumento dei casi di malaria e, al di fuori dell’Africa sub-sahariana, una percentuale crescente di malaria dovuta al Plasmodium vivax, minando gli sforzi concertati per ridurre la trasmissione negli ultimi dieci anni1. Queste tendenze evidenziano l’urgente necessità di nuovi strumenti di sorveglianza e la necessità di una maggiore attenzione alle specie Plasmodium non falciparum. Una sfida particolare per il controllo della malaria è rappresentata dall’elevata mobilità delle popolazioni umane, che portano all’importazione di isolati di Plasmodium da un paese all’altro (casi importati) che possono ostacolare gli sforzi di controllo locale e aumentare i rischi di epidemie e la diffusione della resistenza ai farmaci antimalarici. Per contrastare questa sfida è fondamentale sviluppare strumenti che possano aiutare a determinare dove i pazienti hanno contratto l’infezione.

Distinguere tra infezione locale e importata è particolarmente difficile per P. vivax, data la capacità del parassita di formare stadi epatici dormienti (ipnozoiti) che possono riattivarsi settimane o mesi dopo l'infezione iniziale, nonché la sua capacità di causare malattie spleniche altamente persistenti. e infezioni circolanti allo stadio sanguigno a bassa densità che possono eludere la diagnosi di routine2,3,4. La ricomparsa di P. vivax in numerose regioni dove un tempo era quasi eliminato evidenzia l’importanza di una sorveglianza diligente5,6. In contesti a bassa endemicità, la proporzione relativa di casi importati generalmente aumenta al diminuire dell’incidenza, sottolineando l’importanza di strumenti di sorveglianza in grado di identificare casi di P. vivax importati in queste regioni in particolare5. Tradizionalmente, i casi importati venivano identificati e mappati utilizzando le informazioni sulla storia dei viaggi dei pazienti, ma le infezioni persistenti della milza e dello stadio ematico e le ricadute tardive limitano l'accuratezza di questo approccio per P. vivax. Gli strumenti molecolari per identificare e mappare i casi importati di P. vivax offrono un interessante complemento agli strumenti epidemiologici tradizionali.

Il sequenziamento basato sugli ampliconi è diventato l'approccio preferito per la genotipizzazione mirata dei parassiti della malaria7,8. Utilizzando piattaforme di sequenziamento altamente parallele, come l'ultima generazione di sequenziatori Illumina, il sequenziamento basato su ampliconi può essere applicato con una produttività da moderata ad elevata, con elevata precisione e sensibilità. Queste piattaforme sono flessibili e consentono il miglioramento iterativo dei codici a barre del polimorfismo a singolo nucleotide (SNP), che possono fornire un approccio di genotipizzazione conveniente, suscettibile di sorveglianza molecolare basata sulla popolazione.

Studi precedenti hanno utilizzato marcatori mitocondriali e apicoplastici per distinguere gli isolati importati da quelli locali di P. vivax, ma la risoluzione di questi genomi organellari è limitata9,10,11. Nel 2015 è stato identificato un gruppo di 42 SNP, comunemente denominato codice a barre ampio, per facilitare l'impronta digitale dei parassiti e l'assegnazione geografica12. Il codice a barre ampio 42-SNP è stato derivato dai dati genomici disponibili di 13 isolati provenienti da 7 paesi ed è stato applicato a diversi studi utilizzando test di genotipizzazione mirati12,13,14. Uno studio più recente ha identificato un altro codice a barre SNP di P. vivax utilizzando i dati di 433 isolati provenienti da 17 paesi15. Questo codice a barre mirava anche a facilitare sia l'impronta digitale che l'assegnazione geografica, ma non sono disponibili test sperimentali per questo codice a barre e rimane solo uno strumento in silico15. Inoltre, tutti gli studi sui codici a barre geografici sulla malaria fino ad oggi si sono basati su metodi visivi come l'analisi delle componenti principali per valutare il paese di origine. Sebbene questo approccio abbia una certa utilità, è moderatamente soggettivo e non soddisfa le esigenze degli utenti finali traslazionali come i programmi nazionali di controllo della malaria (NMCP), che potrebbero non avere l’epidemiologia genetica o le competenze bioinformatiche necessarie per generare e interpretare questi grafici.

 0, minimum depth of 1 and minimum Minor Allele Count (MAC) of 2 to produce Dataset 0. The restriction to bi-allelic SNPs is a standard approach undertaken in malaria population genomics to simplify downstream computations and does not impose constraints on the analysis of polyclonal infections, which are still detectable through the composite of allelic variants across the respective SNPs (see27,28,29). Individual genotype calls were defined as heterozygotes based on an arbitrary threshold of a minor allele ratio > 0.1 and a minimum of 2 reads for each allele; all other genotype calls were defined as homozygous for the major allele. Dataset 0 was further filtered to exclude non-independent samples, defined arbitrarily as isolate pairs with genetic distance less than 0.001, resulting in 1,227 samples with 662,641 SNPs, denoted as Dataset 1. Dataset 1 was then subjected to iterative data quality filtering to derive the best representative number of samples and informative SNPs without any genotype missingness by iteratively removing samples with higher missingness and calculating the number of informative SNPs (defined as SNPs with MAC > = 2), from the remaining samples. Based on the plot of the result of this data quality filtering (Supplementary Fig. 1), we identified 826 samples and 229,317 SNPs to be included in Dataset 2. The isolates in Dataset 2 were initially assigned to country based on the available metadata, which was further evaluated using 1) country-level prediction using the BALK classifier against all 229,317 SNPs and 2) manual confirmation by constructing a neighbor-joining tree based on genetic distance. Isolates whose country assignment differed from the prediction result and that were not in the same country cluster as observed manually from the neighbor-joining tree were considered suspected imported infections and removed from the dataset to produce Dataset 3, comprising 799 samples and 229,317 SNPs. For comparative assessment of candidate SNP panels, a new dataset (Dataset 4) was produced which comprised the samples in Dataset 3, but only the SNPs selected by the consecutive SNP selection process (we refer to these SNP panels as GEO barcodes) and 38 assayable SNPs from a commonly used 42-SNP P. vivax barcode developed by the Broad institute12. The SNP panel comprising the 38 assayable Broad Institute barcode SNPs is referred to as BR38. The BR38 SNP panel was integrated in the study for evaluation on its own as well as in combination with the newly selected GEO SNP panels as it has been implemented in several countries./p>