Maschinelles Lernen zur Verbesserung der Toxizitätsbewertung von Chemikalien
Chemiker wählen einen neuen Ansatz für die Prüfung von Chemikalien
Computer-generated image
Den Forschern zufolge kann der Einsatz von maschinellem Lernen die Gefahrenbewertung von Molekülen erheblich verbessern, sowohl bei der Safe-by-Design-Entwicklung neuer Chemikalien als auch bei der Bewertung bestehender Chemikalien. Wie wichtig Letzteres ist, zeigt die Tatsache, dass die europäischen und US-amerikanischen Chemikalienbehörden etwa 800 000 Chemikalien aufgelistet haben, die im Laufe der Jahre entwickelt wurden, über deren Verbleib oder Toxizität in der Umwelt jedoch wenig bis gar nichts bekannt ist.
Da eine experimentelle Bewertung des Verbleibs und der Toxizität von Chemikalien viel Zeit, Mühe und Ressourcen erfordert, werden bereits Modellierungsansätze zur Vorhersage von Gefahrenindikatoren verwendet. Insbesondere die quantitative Struktur-Aktivitäts-Beziehung (QSAR) wird häufig angewandt, wobei molekulare Merkmale wie die atomare Anordnung und die 3D-Struktur mit physikochemischen Eigenschaften und biologischer Aktivität in Beziehung gesetzt werden. Auf der Grundlage der Modellierungsergebnisse (oder gemessener Daten, sofern verfügbar) ordnen Experten ein Molekül in Kategorien ein, wie sie beispielsweise im Global Harmonisierten System zur Einstufung und Kennzeichnung von Chemikalien (GHS) definiert sind. Für bestimmte Kategorien werden die Moleküle dann weiter erforscht, aktiver überwacht und schließlich gesetzlich geregelt.
Dieser Prozess hat jedoch inhärente Nachteile, die größtenteils auf die Grenzen der QSAR-Modelle zurückzuführen sind. Sie beruhen häufig auf sehr homogenen Trainingssätzen und gehen von einer linearen Struktur-Wirkungs-Beziehung aus, um Extrapolationen vorzunehmen. Infolgedessen werden viele Chemikalien von den bestehenden QSAR-Modellen nicht gut repräsentiert, und ihre Verwendung kann zu erheblichen Vorhersagefehlern und einer falschen Klassifizierung von Chemikalien führen.
Überspringen der QSAR-Vorhersage
In der in der Zeitschrift Environmental Science & Technology veröffentlichten Arbeit schlagen Dr. Saer Samanipour und seine Mitautoren eine alternative Bewertungsstrategie vor, bei der der Schritt der QSAR-Vorhersage gänzlich übersprungen wird. Samanipour, ein Wissenschaftler für Umweltanalytik am Van 't Hoff Institute for Molecular Sciences der Universität Amsterdam, hat sich mit Dr. Antonia Praetorius, einer Umweltchemikerin am Institute for Biodiversity and Ecosystem Dynamics derselben Universität, zusammengetan. Gemeinsam mit Kollegen an der Universität Queensland und dem Norwegischen Institut für Wasserforschung entwickelten sie eine auf maschinellem Lernen basierende Strategie zur direkten Klassifizierung der akuten aquatischen Toxizität von Chemikalien auf der Grundlage molekularer Deskriptoren.
Das Modell wurde anhand von 907 experimentell gewonnenen Daten zur akuten Fischtoxizität (96h LC50-Werte) entwickelt und getestet. Das neue Modell überspringt die explizite Vorhersage eines Toxizitätswertes (96h LC50) für jede Chemikalie, sondern stuft jede Chemikalie direkt in eine Reihe von vordefinierten Toxizitätskategorien ein. Diese Kategorien können beispielsweise durch spezifische Vorschriften oder Normungssysteme definiert werden, wie in dem Artikel anhand der GHS-Kategorien für die akute aquatische Gefährdung gezeigt wird. Das Modell erklärte etwa 90 % der Varianz in den Daten des Trainingssatzes und etwa 80 % für die Daten des Testsatzes.
Höhere Genauigkeit der Vorhersagen
Diese direkte Klassifizierungsstrategie führte zu einer fünffachen Verringerung der falschen Einstufung im Vergleich zu einer Strategie, die auf einem QSAR-Regressionsmodell basierte. Anschließend erweiterten die Forscher ihre Strategie, um die Toxizitätskategorien eines großen Satzes von 32.000 Chemikalien vorherzusagen.
Sie zeigen, dass ihr direkter Klassifizierungsansatz zu einer höheren Vorhersagegenauigkeit führt, da experimentelle Datensätze aus verschiedenen Quellen und für verschiedene chemische Familien gruppiert werden können, um größere Trainingssätze zu erzeugen. Er kann an verschiedene vordefinierte Kategorien angepasst werden, wie sie in verschiedenen internationalen Vorschriften und Klassifizierungs- oder Kennzeichnungssystemen vorgeschrieben sind. In Zukunft kann der direkte Klassifizierungsansatz auch auf andere Gefahrenkategorien (z. B. chronische Toxizität) sowie auf den Verbleib in der Umwelt (z. B. Mobilität oder Persistenz) ausgeweitet werden und weist ein großes Potenzial für die Verbesserung von In-silico-Werkzeugen für die chemische Gefahren- und Risikobewertung auf.
Hinweis: Dieser Artikel wurde mit einem Computersystem ohne menschlichen Eingriff übersetzt. LUMITOS bietet diese automatischen Übersetzungen an, um eine größere Bandbreite an aktuellen Nachrichten zu präsentieren. Da dieser Artikel mit automatischer Übersetzung übersetzt wurde, ist es möglich, dass er Fehler im Vokabular, in der Syntax oder in der Grammatik enthält. Den ursprünglichen Artikel in Englisch finden Sie hier.