SODa Semantic Co-Working Space (Poster)
Description
Der SODa Co-Working Space (SCS)
Der SODa Coworking Space (SCS) stellt eine Infrastruktur bereit, die den Nutzenden ein breites Spektrum an Möglichkeiten bietet, sich zu vernetzen, zu forschen und zu lernen. Er bildet die technische Basis für die Angebote des Verbundprojekts "Sammlungen, Objekte, Datenkompetenzen" und vereint dessen Best Practices, Richtlinien und Inhalte. Als Ergebnis des SODa-Projekts soll er Forschenden, die im Kontext von Sammlungen tätig sind, kostenfrei zur Verfügung gestellt werden.
Beschreibung
Nutzende können ihre Daten, Dokumente, Algorithmen, Modelle etc. in den SCS importieren oder direkt dort erstellen, bearbeiten, zur Verfügung stellen und auch wieder exportieren. Der Datenmenge sind dabei keine Grenzen gesetzt.
Dazu stehen den Nutzenden verschiedene Komponenten des SCS zur Verfügung, die es ermöglichen, Daten zu modellieren, zu erschließen, anzureichern, zu transformieren, zu migrieren, zu analysieren, zu visualisieren, zu speichern, zu publizieren oder mit Programmiercode zu verarbeiten.
Die Komponenten sind mittels Single Sign On über eine Cloud-Webapplikation und Schnittstellen zugänglich.
Die Webapplikation verfügt über ein Dashboard, über das die Komponenten angefordert und verwaltet werden können. Kein Service ist autoritär oder verpflichtend, die Tools können einzeln oder im Verbund genutzt werden, die Komponenten können jedoch nur über das Dashboard administriert werden.
Nutzende können Projekte anlegen, in denen Rollen und Gruppen-Berechtigungen für jeweilige Komponenten freigeben werden können. Daten, die in einer Komponente vorhanden sind, können auch von allen anderen Komponenten genutzt werden, sofern die Projekt- oder Nutzerrechte dies zulassen.
Der SCS ist barrierearm gestaltet und orientiert sich an der BITV 2.0 hinsichtlich Wahrnehmbarkeit, Bedienbarkeit, Verständlichkeit.
Alle Daten des SCS werden langfristig gespeichert und können von den Nutzenden gemäß den FAIR-Prinzipien mit gängigen Schnittstellen entsprechend ihrer Kompetenzen zur Verfügung gestellt werden.
Möglichkeiten
Es sollen möglichst alle Aufgaben eines Forschungsdatenlebenszyklus im SCS bearbeitet werden können:
- Modellieren
- Datenmodelle und Ontologien können erstellt und visualisiert werden.
- Erschließen
- (Primär-)Daten können benutzerfreundlich über ein Content Management System erfasst werden
- Anreichern
- (Primär-)Daten können manuell oder aus anderen Repositories angereichert werden. Dabei kann es sich um (Standard-)Daten aus entfernten Systemen oder aus anderen SCS-Repositorien handeln. Die automatische Anreicherung aus externen Systemen gilt nur für ausgewählte Repositorien, ist nicht für jeden Dienst garantiert und erfordert in der Regel eine erweiterte Konfiguration oder eigene Algorithmen.
- Transformieren/ Mappen
- Daten(typen) und ihre Semantiken können massenhaft bearbeitet, gruppiert, korrigiert oder neu parsed werden.
- Analysieren, visualisieren und (statistisch) auswerten
- Grundlegende deskriptive und probabilistische Statistik kann auf die Daten angewendet werden.
- Grundlegende Visualisierungen wie Diagramme (Balken-, Linien-, Netzwerk-, Kreuztabellen, Heatmaps etc.) können erstellt und exportiert werden.
- Speichern
- Daten können persistent in der SCS-Cloud und in Datenbanken gespeichert werden.
- Publizieren
◦ Daten, Dokumente und Ergebnisse können in File-Drives und Content-Management-Systemen von FAIR publiziert werden. - Programmieren
- Algorithmen, insbesondere im Bereich Data Science, können in Online-IDEs erstellt und evaluiert werden. Schnittstellen innerhalb und außerhalb des SCS können realisiert werden.
- Bestehende Modelle des maschinellen Lernens können integriert werden.
- Eigenes grundlegendes Training ist nicht möglich, nur Verfeinerung / Anpassung vorhandener Modelle.
Werkzeuge
Der SCS vereint verschiedene Werkzeuge, die integrativ genutzt werden können, dazu zählen unter anderem:
- Relationale Datenbank (MariaDB)
- Triplestore (Open Graph Database)
- Content Management System (WissKI)
- Datenmanagement (OpenRefine)
- Programmierumgebung (Jupyter Hub)
- Drive (voraussichtlich NextCloud + Collabora)
Roadmap
Derzeit befindet sich der SCS in der Entwicklung und internen Testung durch SODa-Projektmitglieder und wird voraussichtlich im dritten Quartal 2025 in einer ersten Version zur Verfügung stehen.
Files
SODa Semantic Co-Working Space.pdf
Files
(416.5 kB)
Name | Size | Download all |
---|---|---|
md5:e0faa3d9b3dc436eb24e4dea980bab39
|
416.5 kB | Preview Download |
Additional details
Software
- Repository URL
- https://github.com/soda-collections-objects-data-literacy/soda_scs_manager_deployment
- Development Status
- Active