Über mich

Foto von Cornelius Ludmann Ich bin Informatiker und Wissenschaftler an der Carl von Ossietzky Universität Oldenburg in der Abteilung Informationssysteme und forsche im Bereich des maschinellen Lernens in Datenstrommanagementsystemen. Mein Hauptaugenmerk liegt auf dem Thema Learning to Rank für kontext-sensitive Recommender-Systeme und Information Retrieval.

Ich bin 1984 in Dortmund geboren, wo ich auch aufwuchs und zur Schule ging. Im Juni 2009 habe ich mein Studium der Praktischen Informatik an der Fachhochschule Dortmund als Diplom-Informatiker (FH) abgeschlossen. Während des Studiums arbeitete ich von Juni 2007 bis September 2009 beim Fraunhofer-Institut für Software- und Systemtechnik in Dortmund in der Softwareentwicklung. Meine Projekt- und Diplomarbeit habe ich bei der Firma itemis in Lünen über die Modellgetriebene Entwicklung von Portal-Anwendungen auf Basis von Java-EE-Web-Portlets geschrieben.

Von Oktober 2009 bis Ende Dezember 2013 arbeitete ich beim Fraunhofer-Institut für Software- und Systemtechnik in Dortmund als Wissenschaftlicher Mitarbeiter. Dort habe ich angewandte Forschung im Bereich der Informationslogistik betrieben. Zu meinen Aufgaben gehörte die Akquise und Leitung von Forschungsprojekten für die Industrie sowie die Konzeption und Realisierung von informationslogistischen Softwaresystemen.

Im März 2014 habe ich nach einem einmonatigen Sprachaufenthalt an dem English Language Center (ELC) in Bosten, MA, USA meine Arbeit an der Universität Oldenburg begonnen.

Forschung und Lehre

Datensätze für maschinelles Lernen

Repositories:

Datensätze für Recommender-Systeme:

Libraries für maschinelles Lernen

  • Weka (Java): collection of machine learning algorithms
  • Apache Mahout (Java): machine learning library, insb. mit Recommender-Systems-Algorithmen
  • Apache Hama (Java): Tool für advances analytics mit einer Bulk Synchronous Parallel computing engine
  • LensKit (Java): Open-Source Tools for Recommender Systems
  • librec (Java): library for recommender systems
  • RecMe (Java): recommendation algorithm library
  • recommenderlab (R): recommender system library
  • LIBMF (C++): A Matrix-factorization Library for Recommender Systems
  • recsyslib
  • mrec (Python): recommender systems library
  • MyMediaLite (C#): Recommender System Library
  • WrapRec (C#): A toolkit to implement recommender system algorithms.
  • MOA Massive Online Analysis (Java): Data Stream Analytics in Real Time

Tools, Frameworks für maschinelles Lernen

  • RapidMiner (Java): analytics platform
  • Odysseus (Java): Datenstrom Management (DSMS) und Complex Event Processing (CEP) System

Statistische Programmiersprachen/Umgebungen

  • R: free software environment for statistical computing and graphics
  • IBM SPSS Statistics (Propritär): predictive analytics software
  • julia: high-level, high-performance dynamic programming language for technical computing

Diverse Links zum Thema Statistik, maschinelles Lernen & Co

Kurz notiert

Hier hinterlege ich allerlei Informationen, hautsächlich damit ich sie selber wiederfinde. Dazu gehören zum Beispiel nützliche Code-Schnipsel, Vorlagen, Anleitungen etc. Vielleicht sind sie auch für andere von Interesse …


Linux


Eine Aktion (im Beispiel echo) für jede Datei ausführen:

for file in *; do echo "$file"; done

Der Dateiendung lässt sich mit Bash wie folgt entfernen: ${file%.*}, z. B.:

for file in *; do echo "$file -> ${file%.*}.png"; done

Siehe: http://www.gnu.org/software/bash/manual/html_node/Shell-Parameter-Expansion.html


Breite Seitenränder einer PDF-Datei entfernen und 2 Seiten pro Blatt setzen:

pdfcrop --margin "30" input.pdf /dev/stdout | pdfnup /dev/stdin --outfile output.pdf

Unter Linux alle Java-Prozesse mit kompletten Parametern anzeigen lassen:

ps -fC java

Der Parameter -f sorgt dafür, dass die Parameter der JVM angezeigt werden (und somit mehrere Java-Instanzen unterschieden werden können). Ähnliches erreicht man bei top durch den Parameter -c. -C java filtert Prozesse heraus, die die Zeichenkette Java beinhalten.


GNU screen Quick Reference (PDF-Download) von http://aperiodic.net/screen/quick_reference


LaTeX


(M)Ein LaTeX-Template


Kopf- und Fußzeile leeren:

\pagestyle{empty}

Keine Nummerierung der Überschriften:

\setcounter{secnumdepth}{-1}

Serifenlose Schriften als Hauptschrift:

\renewcommand{\familydefault}{\sfdefault}

Python


(M)Ein Python-Template


R


Volltextsuche in allen Paketen auf CRAN:

install.packages("sos")
library("sos")
findFn("searchstring")

Sonstiges


Schriftart Computer Modern (Standardschrift von LaTeX) zum Download und zur Nutzung in LibreOffice, MS Word etc. Unter Linux Mint/Ubuntu auch mit sudo apt-get install fonts-cmu
installierbar. (Nutzung von Computer Modern als Webfont)