Python Podcast

Data Science

December 8, 2025·1h 41m
Episode Description from the Publisher

Data Science (click here to comment) 8. Dezember 2025, Jochen 🎙️ Zu Gast: Mira – Data Scientist, Geschäftsführerin einer Berliner Data-Science-Beratung und Host des Podcasts Data Science Deep Dive.Dominik und Jochen sprechen mit ihr darüber, was Data Science in der Praxis heute bedeutet: weniger Machine-Learning-Magie, mehr solides Datenhandwerk – von der Problemanalyse über Feature Engineering bis hin zu Deployment, Monitoring und Drift. An konkreten Projekten (u. a. einer Luftschadstoff-Prognose für die Berliner Senatsverwaltung) wird klar, wo die echten Herausforderungen liegen – und wo die spannendsten Hebel sind.In dieser Episode:📊 Was "Data Science" eigentlich umfasst – Skills, Rollen und warum man dafür nicht unbedingt Informatik studiert haben muss🔄 CRISP-DM in der Praxis – vom Use-Case bis Wartung und Drift, und warum die Modellierung oft nur ein kleiner Teil ist🛠️ Tooling &amp; Architektur – Pandas, Scikit-Learn, Polars, Kubernetes, ClickHouse, REST-API, MLflow und Alerting mit Redash🌳 XGBoost vs. TabPFN – warum Gradient Boosting immer noch der Klassiker ist und was Transformer-Modelle für tabulare Daten können🔍 Feature Engineering &amp; Interpretierbarkeit – mit SHAP verstehen, was das Modell gelernt hat⚡ Performance in der Realität – Spark vs. Polars, Sampling, vektorisierte Operationen und warum "verteilen" nicht automatisch schneller heißt🚗 LLMs für Vorhersagen – Experimente mit Gebrauchtwagenpreisen und warum Finetuning hier Sinn machtUnsere Picks:Mira: Pandas UDFs für Parallelisierung in Spark – von Stunden auf Minuten 🚀Dominik: just – Hynek erklärt, warum just der bessere Taskrunner ist als makeJochen: ccusage / ccusage for codex – Token-Kosten im Blick behalten bei claude code / codex ShownotesUnsere E-Mail für Fragen, Anregungen &amp; Kommentare: hallo@python-podcast.deData ScienceData Science Beratung inwtCross-industry standard process for data mining CRISP-DMVisualisierungen: ggplot2 / Redashpandas / polars / PySparkmlflowClickHouse</

Podzilla Summary coming soon

Sign up to get notified when the full AI-powered summary is ready.

Get Free Summaries →

Free forever for up to 3 podcasts. No credit card required.

Listen to This Episode

Get summaries like this every morning.

Free AI-powered recaps of Python Podcast and your other favorite podcasts, delivered to your inbox.

Get Free Summaries →

Free forever for up to 3 podcasts. No credit card required.