DINOBBIO
Nachhaltige Nutzung der brasilianischen Artenvielfalt - Nutzung verknüpfter Daten zum Auffinden von Naturstoffen
Laufzeit: 01.10.2021 – 30.09.2024
Förderung: Deutsche Forschungsgemeinschaft (DFG)
Nachhaltige Nutzung der brasilianischen Artenvielfalt
Projektleitung
Das Wachstum und die Entwicklung unserer Zivilisation basieren auf der Nutzung der biologischen Vielfalt. Das Überleben des Menschen erfolgte unter Verwendung von Pflanzenarten, insbesondere für Ernährungs- und medizinische Zwecke. Naturprodukte sind die traditionellste Quelle für die Entwicklung neuer Medikamente. Unter Berücksichtigung aller zugelassenen Arzneimittel sind 67% entweder ein Naturprodukt, ein halbsynthetisches Derivat, ein aus einem Organismus isoliertes Makromolekül oder eine vom Naturprodukt inspirierte Pharmakophorgruppe. Naturstoffforscher haben die medizinischen Eigenschaften von Pflanzen untersucht und im letzten Jahrhundert große Fortschritte in Bezug auf Biosynthese, Ökologie und Verbesserung biologische Eigenschaften erzielt. Die Artenvielfalt tropischer und äquatorialer Umgebungen ist reichlich und bietet ein hohes Potenzial für die Suche nach biologisch aktiven Verbindungen, die als Modelle für das Finden von Wirkstoffen und die medizinische Chemie dienen können. Brasilien umfasst sechs terrestrische Biome, deren Artenvielfalt etwa 10% aller lebenden Arten ausmacht. Die damit verbundene chemische Vielfalt kann für die Entwicklung von Bioprodukten, wie Pharmazeutika, Kosmetika, Nahrungsergänzungsmittel oder landwirtschaftliche Pestizide, genutzt werden. Die chemische Vielfalt der Biome zeigt sich in einer Vielfalt von Verbindungsklassen und Strukturtypen von Sekundärmetaboliten aus Pflanzen, Pilzen, Insekten, Meeresorganismen und Bakterien. Wissenschaftlichen Informationen, die in mehr als 50 Jahren Studien zur brasilianischen Biodiversität veröffentlicht wurden, werden leichter zugänglich, wenn sie standardisiert, zertifiziert und in einem Wissensgraphen organisiert werden.
Zunächst wurde NuBBEDB als Datenbank für Verbindungen aus der brasilianischen Artenvielfalt mit dem Ziel erstellt, seine chemischen, biologischen und pharmakologischen Informationen zu sammeln. NuBBEDB enthält Daten von 2218 Verbindungen, geschätzt ca. 5% der veröffentlichten Informationen zu Naturstoffen, die aus auf brasilianischem Gebiet gesammelten Arten isoliert und identifiziert wurden.
Im Rahmen des Projektes möchten wir die Herausforderungen untersuchen, die sich aus der Erstellung, Verwaltung und Nutzung eines biochemischen Wissensgraphen mithilfe von Semantic Web Technologien ergeben, wobei der Schwerpunkt auf der Erforschung neuer Naturstoffe unter Verwendung der NuBBEDB Datenbank liegt. Die Qualität der Datensätze soll verbessert werden, indem wir diese mit Taxonomien und Ontologien basierend auf dem RDF-Standard strukturieren und mit weiteren Datensätze integrieren, die in der Linked Open Data-Cloud verfügbar sind. Darüber hinaus schlagen wir vor, das Management und Verteilung von Datensätzen zu verbessern, indem Versionierung und Lizenzierung eingeführt werden, und maschinelles Lernen auf diese hochwertigen Informationen anzuwenden, um bessere KI-Modelle für die Entdeckung natürlicher Produkte zu erstellen.
Das Projektkonsortium besteht aus drei Institutionen:
- Hochschule für Technik, Wirtschaft und Kultur Leipzig mit der Forschungsgruppe Agile Knowledge Engineering and Semantic Web - HTWK/AKSW
- Institute of Chemistry São Paulo State University - UNESP (Prof. Vanderlan da Silva Bolzani)
- Institute of Physics of Sao Carlos, University of São Paulo -USP (Prof. Adriano Defini Andricopulo)
Die Projektpartner übernehmen unterschiedliche Rollen innerhalb des Linked Data Lifecycle bei der Entwicklung des Biochemical Knowledge Graph (BKG):
- Die Forschungsgruppe AKSW an der HTWK kann auf die bestehende Expertise im Aufbau und Management von Wissensgraphen aufsetzen, um das Datenmanagement am BKG zu erforschen. Es werden Datenextraktion, Speicherung, Verknüpfung, Datenentwicklung, Veröffentlichung sowie Lizenzierung des BKG realisiert.
- Die Forschungsgruppen an der UNESP und der USP werden sich auf die Datenentwicklung, -exploration und -erstellung konzentrieren.
- Die UNESP entwickelt den Datensatz weiter und hält diesen auf dem neuesten Stand, und liefert inhaltliches Feedback bei der Entwicklung des BKG.
Die USP wird sich auf die Erforschung besserer maschinelle Lernmodelle für die Entdeckung von Arzneimitteln im großen Maßstab konzentrieren.
Die Qualitätsanalyse wird zusammen mit saisonalen Berichten und Forschungsartikeln durchgeführt.
Wissenstransfer in andere Datenbanken:
- Die Forschungsergebnisse des Projektes, einschließlich wissenschaftlicher Methoden, Ansätze und einer Plattform für den Biochemical Knowledge Graph sollen in Zukunft auch für die Umsetzung anderer Projekte in Ländern mit großer biologischer Vielfalt in Afrika, Asien, Europa, Ozeanien und Süd Amerika sowie in anderen Datenbanken, die den RDF-Standard nicht verwenden, anwendbar sein.
Beteiligte Forschungsgruppe
Agile Knowledge Engineering and Semantic Web (AKSW)
der HTWK Leipzig
Projektteam
Förderung
Die Förderung der brasilianischen Partner erfolgt durch Fundaçao de Amparo a Pesquisa do Estado de Sao Paulo - FAPESP.