A nagy áteresztőképességű szekvenálásban a közelmúltban elért technológiai fejlődés és a szekvenálási költségek zuhanása a genomszekvencia-adatbázisok soha nem látott mértékű növekedéséhez vezet. A közelmúltban számos nagyszabású szekvenálási kezdeményezés indult azzal a céllal, hogy a rovarok, gerincesek, gombák, növények vagy végső soron a Föld teljes eukarióta (valódi sejtmaggal rendelkező) biodiverzitásának genomját feltérképezzék. Különböző biológiai vagy technikai problémák miatt azonban a genomok olyan szekvenciákat is tartalmazhatnak, amelyek nem a célszervezethez tartoznak. A tartósított múzeumi vagy a metagenomikai - a természetes környezetből vett - mintákra támaszkodó projektek különösen érzékenyek a szennyeződésre. Ha nem fordítanak rá kellő figyelmet, a szennyezett referenciagenomok pontatlanul megjelölt szekvenciaadatokkal "mérgezik meg" a nyilvános adatbázisokat.
A nemzetközi együttműködéssel létrejött, Nagy László, az SZBK Biokémiai Intézet Szintetikus és Rendszerbiológiai Egységének csoportvezetője irányításával született publikáció (amely a Nature Communications folyóiratban jelent meg) az adatbázisokba tévesen feltöltött, idegen szekvenciákkal szennyezett genomadatok lehetséges következményeivel és a szennyezések kitisztításával foglalkozik.
A szegedi kutatók egy olyan új számítógépes szoftvert készítettek, amely a korábbi megoldásokhoz képest lényegesen pontosabban azonosítja be és távolítja el a genomi adatokban megbúvó szennyeződéseket, még akkor is, ha az egy közeli rokon fajtól származik, miközben az élőlények közötti tényleges genetikai információátadás, a horizontálisan géntranszfer révén szerzett géneket érintetlenül hagyja.
A kutatók a 844 megvizsgált eukarióta genom több mint felében mutattak ki bizonyos mértékű szennyeződést, melyek döntő többsége baktériumokból származott. A szennyeződés néhány esetben akkora mértéket öltött, hogy a közzétett genomadatokból egy második élőlény közel teljes genomja rekonstruálható volt.
A publikáció részletes példákon keresztül illusztrálja, milyen torzító hatással vannak a szennyező szekvenciák azokra a kísérletekre, amelyek az egyedi géncsaládok, valamint az élőlények evolúciós történetét kívánják feltárni.
Az együttműködésben résztvevő kutatók remélik, hogy eredményeikkel sikerül felhívniuk a tudományos közösség figyelmét a genomi szennyeződések eltávolításának fontosságára, valamint hogy a kifejlesztett szekvenciatisztító-szoftver az általánosan elfogadott genomi elemzési munkafolyamatok részévé válhat.