NFDI for Data Science and Artificial Intelligence (NFDI4DS)
Leitung
Prof. Dr. Stefan DietzeProf. Dr. Claudia Wagner
Team
Peter MutschkeDr. Saurav Karmakar
Sharmila Upadhyaya
Projektbeschreibung
In den letzten Jahren hat sich ein Paradigmenwechsel vollzogen, bei dem Berechnungsmethoden zunehmend auf datengesteuerte und häufig auf Deep Learning basierende Ansätze zurückgreifen. Dies hat dazu geführt, dass sich Data Science als eine Disziplin etabliert hat und allgegenwärtig ist, die durch Fortschritte im Bereich der Informatik vorangetrieben wird, aber für die meisten wissenschaftlichen Disziplinen von Bedeutung ist. Transparenz, Reproduzierbarkeit und Fairness sind aufgrund der Komplexität moderner KI- und Data Science-Methoden, die häufig auf einer Kombination aus Code, Modellen und Trainingsdaten beruhen, zu entscheidenden Herausforderungen für Data Science und künstliche Intelligenz geworden.
In Anbetracht der zunehmenden Bedeutung von Methoden der Datenwissenschaft und der künstlichen Intelligenz für die Informatik sowie für ein breites Spektrum wissenschaftlicher Disziplinen wird NFDI4DS offene, wissensgraphbasierte Forschungsdateninfrastrukturen entwickeln und fördern, die alle beteiligten Ressourcen wie Code, Modelle, Daten, Benchmarks oder Veröffentlichungen durch einen integrierten, wissensgraphenbasierten Ansatz unterstützen. Das übergeordnete Ziel von NFDI4DS ist die Entwicklung, Etablierung und Aufrechterhaltung einer nationalen Forschungsdateninfrastruktur für die Data Science und Artificial Intelligence-Community in Deutschland. Dies wird disziplinübergreifend die Nutzung grosser Datenmengen und von KI-Methoden unterstützen, innerhalb der NFDI und darüber hinaus. Der Kerngedanke ist, die Transparenz, Reproduzierbarkeit und Fairness von Ressourcen im Bereich Künstlicher Intelligenz und Data Science zu erhöhen, indem alle digitalen Artefakte verfügbar gemacht werden, indem sie miteinander vernetzt werden und indem innovative Werkzeuge und Dienste angeboten werden, die eine Wiederverwendung ermöglichen.
GESIS konzentriert sich auf die Entwicklung eines Wissensgraphen, der KI- und datenwissenschaftliche Daten und Metadaten integriert, sowie auf die Anwendung der Infrastruktur auf rechnergestützte sozialwissenschaftliche Anwendungsfälle.