pertpy verbindet Analyse und Interpretation
Entwickelt wurde pertpy von einem Team am Institut für Computational Biology bei Helmholtz Munich und an der TUM unter Leitung von Prof. Fabian Theis. Dr. Lukas Heumos, Erstautor der Studie und Wissenschaftler im Theis-Lab, hat das Framework als Baustein einer internationalen Open-Source-Plattform für Einzelzellanalysen konzipiert. Damit Forschende Einzelzell-Perturbationsexperimente in einem durchgängigen Workflow auswerten können, liest pertpy Daten aus den Experimenten im Standardformat ein, reichert sie mit Wissen aus öffentlichen Datenbanken an und stellt statistische Verfahren in einheitlicher Form bereit. So lassen sich auch sehr große Datensätze aus Einzelzell-Perturbationsexperimenten mit wenigen, reproduzierbaren Workflows auswerten – bis hin zu der Frage, welche Zelltypen und Genprogramme besonders stark auf bestimmte Eingriffe reagieren.
In komplexen Datensätzen leichter Muster erkennen
In Perturbationsexperimenten zeigen die Zellen häufig komplexe Reaktionsmuster: Manche Zelltypen sprechen stark an, andere kaum; ganze Gruppen von Genen werden gleichzeitig hoch- oder heruntergefahren. Ziel der Forschenden ist es, diese Muster zu erkennen und zu interpretieren: Welche Zelltypen sind besonders empfindlich? Welche Genprogramme reagieren gemeinsam, und wie ähnlich wirken unterschiedliche Eingriffe?
Um solche Fragen beantworten zu können, können die Forschenden jetzt mit pertpy in einem einzigen Workflow aus einer zunächst unübersichtlichen Datenwolke ein klares Bild entwickeln: „Wir haben häufig genutzte Verfahren in einer modernen, intuitiv nutzbaren Form neu zusammengesetzt“, sagt Lukas Heumos. Forschende können die einzelnen Module jetzt wie Bausteine zu eigenen Analysepipelines zusammenstellen, ohne sich durch Unmengen inkompatibler Tools arbeiten zu müssen. „Wir mussten oft gar keine neuen Algorithmen schreiben, sondern einfach vorhandene Werkzeuge sauber miteinander verbinden“, so Heumos.
Praxistest bestanden: pertpy holt mehr Wissen aus Daten heraus
Ein besonderer Vorteil von pertpy ist die enge Anbindung an öffentlich verfügbare Datenbanken. Die Software kann zum Beispiel Informationen über Zelllinien, Tumorarten, Wirkstoffe und ihre Zielstrukturen automatisch abrufen und mit den gemessenen Einzelzelldaten verknüpfen. Aus einer reinen Zahlenmatrix wird so ein biologisch annotierter Datensatz: Forschende sehen nicht nur, dass sich die Aktivität eines Gens ändert, sondern erhalten zugleich Hinweise, zu welchen Signalwegen, Zelllinien oder Wirkmechanismen diese Veränderungen gehören können.
Wie sich pertpy in der Praxis nutzen lässt, hat das Team an unterschiedlichen Datensätzen gezeigt. So hatten Forschende in einem groß angelegten Experiment mit Leukämiezellen einzelne Gene mithilfe der Genschere CRISPR gezielt an- oder ausgeschaltet. Dank pertpy konnte das Team vom Theis-Lab weitere beteiligte Genprogramme sichtbar machen, die in der ursprünglichen Analyse verborgen geblieben waren – etwa Signalwege, die zwar ähnliche Effekte auf das Zellwachstum haben, aber über unterschiedliche molekulare Mechanismen laufen.
Ein anderes Beispiel stammt aus der Klinik. Dort waren Immunzellen aus Tumorproben von Patientinnen mit einer aggressiven Form von Brustkrebs, dem triple-negativen Brustkrebs, analysiert worden: vor und nach der Behandlung im Rahmen von Chemo- und Immuntherapie. pertpy konnte an dem Datensatz zeigen, wie sich bestimmte T-Zelltypen und gemeinsame Genprogramme im Verlauf der Behandlung verändern – und welche Muster mit dem Ansprechen auf die Therapie zusammenhängen.
„Perturbationsdaten gehören zu den informativsten, aber auch kompliziertesten Datensätzen in der Biomedizin“, sagt Fabian Theis. „Mit pertpy können wir diese Komplexität in klarere Fragen übersetzen: Welche Zelltypen reagieren besonders stark? Welche Genprogramme laufen gemeinsam ab? Und was bedeutet das für die Entwicklung neuer Therapien?“
Ein offenes Gemeinschaftsprojekt
Langfristig soll pertpy weiterwachsen: Das Team plant, neben klassischen Einzelzell-RNA-Daten auch Bilddaten aus groß angelegten Zell-Screens sowie kombinierte „Multi-Omics“-Experimente einzubinden, bei denen etwa Genaktivität und Chromatinstruktur in denselben Zellen vermessen werden. „Wir verstehen pertpy als offenes Gemeinschaftsprojekt“, sagt Theis. „Je mehr Labore ihre Methoden und Datentypen einbringen, desto besser können wir Perturbationsdaten nutzen – bis hin zu KI-Modellen, die vorhersagen, wie Zellen auf bestimmte Eingriffe reagieren werden.“
Über pertpy
pertpy ist frei verfügbar, quelloffen und wird in einer internationalen Community weiterentwickelt – neue Methoden und Datentypen können Schritt für Schritt integriert werden. Um Nutzenden den Einstieg zu erleichtern, stellt das Team neben der Software selbst eine ausführliche Online-Dokumentation und zahlreiche Schritt-für-Schritt-Tutorials bereit. https://pertpy.readthedocs.io/en/latest/index.html
Original-Publikation
Heumos et al., 2025: Pertpy: an end-to-end framework for perturbation analysis. Nature Methods. DOI: 10.1038/s41592-025-02909-7