"Faule Eier" bei genetischen Fingerabdrücken von Arten!?
Neues Bioinformatikwerkzeug detektiert inkorrekte Datensätze in rasantem Tempo
Copyright: CC-BY-SA-4.0 [http://creativecommons.org/licenses/by-sa/4.0/] lizensiert unter Namensnennung: „Zoologisches Forschungsmuseum Alexander Koenig / GBOL“
Nun können potentielle Mängel, die zum Beispiel durch eine fehlerhafte Artbestimmung oder durch eine Verunreinigung einer Probe entstanden sind, in den riesigen Barcode-Datensätzen schnell und sicher detektiert werden – und zwar noch bevor die Barcodes in die großen, weltweit von Forschern genutzten Datenbanken BOLD und GenBank eingetragen werden. Von dem neuen Tool profitieren neben den Wissenschaftlern, die Arten erfassen, auch die Kriminalistik, Medizin oder Schädlingsbekämpfung.
Das Tool kann kostenfrei genutzt werden. Exemplarisch wurde das Werkzeug für die Überprüfung aller vorliegenden Käferarten (knapp 30.000 Sequenzen) aus Deutschland angewendet, prinzipiell ist es aber auch für alle Tiergruppen in sämtlichen Regionen der Erde geeignet.
Seit 2011 arbeiten Wissenschaftler zusammen mit ehrenamtlichen Spezialisten am Aufbau einer DNA-Barcode-Datenbank der biologischen Artenvielfalt Deutschlands, einer Referenzbibliothek genetischer Fingerabdrücke für jede existierende Art. Organisiert sind diese Fachleute unter der Federführung ZFMK in einem Forschungsverbund‚ dem ‘German Barcode of Life‘ (GBOL), welcher vom Bundesministerium für Bildung und Forschung gefördert wird.
Einen Großteil der Vielfalt bei den Tieren machen die Käfer (Coleoptera) aus. Von den in Deutschland vorkommenden 48.000 Tierarten ist diese Insektengruppe mit über 6.700 Arten vertreten. Gemeinsam mit über 30 Käferspezialisten, welche als sogenannte Taxonomen (Artenkenner) genau wissen, wo sie wann welche Art finden und wie man sie bestimmen kann, wurden so am ZFMK in den letzten drei Jahren DNA-Barcodes von 13.516 Käfern aus 2.846 verschiedenen Arten erstellt.
Mithilfe dieser genetischen Fingerabdrücke, die inzwischen mehr als 13.000 DNA-Sequenzen umfassen, können die Arten nun auch anhand winziger DNA-Spuren nachgewiesen werden und müssen nicht mehr als ausgewachsene Käfer bestimmt werden. Kleine Mengen DNA hinterlassen zum Beispiel Schwimmkäfer im Wasser oder Holzschädlinge in ihren Fraßspuren oder dem Holzmehl, das sie bei der Nahrungsaufnahme produzieren. Aber auch bisher nicht bestimmbare Eier oder Käferlarven können nun durch ihren DNA-Barcode einer Art zugeordnet werden – sofern diese schon in der Datenbank hinterlegt wurde. Deswegen finden diese Methoden bereits heute in der Lebensmittelüberwachung, der Kriminalistik, der Medizin und in der Schädlingsbekämpfung breite Anwendung.
Um den oben genannten Datensatz auf Herz und Nieren zu prüfen, haben die Bonner Forscher ein neues bioinformatisches Werkzeug entwickelt, welches es erleichtert, die „Faulen Eier“ (= inkorrekte Daten) unter den tausenden von Datensätzen zu entdecken, bevor diese in öffentlichen Datenbanken Probleme bereiten können. Dieser Schritt war den Wissenschaftlern extrem wichtig, da diese Referenzbibliotheken auf nationaler und globaler Ebene inzwischen schon eine riesige Menge an Daten enthalten. Die Software vergleicht dazu unter anderem die Übereinstimmung der Artbestimmung der Tiere, die sich in einem DNA-Barcode-Cluster befinden und kann somit Hinweise auf inkorrekt determinierte Exemplare, kontaminierte Proben oder auf kryptische Diversität geben.
Die Suche nach solchen "Fehlern" kann über einen graphischen, aber auch automatisch über einen numerischen Output erfolgen. Im Falle des neu generierten Datensatzes umfasst der graphische Output 104 DIN A4 Seiten bzw. 227 Seiten in der Analyse aller bisher durch Barcoding erfassten deutschen Käferdaten (nun inzwischen 4.000 Arten!, ca. 2/3 der gesamten Fauna). Die Seitenzahl lässt erahnen, wie aufwändig die Kontrollen wären, müsste man dies manuell prüfen. Veröffentlicht wurde die Arbeit, die das Werkzeug namens ‚TaxCI‘ vorstellt, jetzt in der Zeitschrift Methods in Ecology and Evolution. Der internationalen DNA-Barcoding-Gemeinschaft steht es frei zur Verfügung und wird helfen, die Qualität der Referenz-Datenbanken der genetischen Fingerabdrücke jeder Art zu verbessern, indem die möglichen Fehler anhand der Belegexemplare überprüft und gegebenenfalls korrigiert bzw. als Kontamination markiert werden.