Tipps zu Latex und Koma-Script für Hausarbeiten sind im \href{http://mirrors.ctan.org/info/latex-refsheet/LaTeX_RefSheet.pdf}{LaTeX Reference Sheet for a thesis with KOMA-Script} von Marion Lammarsch und Elke Schubert zusammengefasst.
Der Bericht fällt in die Kategorie von InfoVis-Paper, die Tamara Munzner Design Study nennt \cite{Munzner2008}: In der Einleitung sollen sie zuerst das Zielproblem beschrieben. Daraus sollen sie Fragestellungen motivieren, die mittels Techniken der Informationsvisualisierung beantwortet werden können.
Die Leistung von Studenten in Prüfungen ist je nach Student unterschiedlich. Die Einen legen Prüfungen eher mit hohen Bewertungen ab, die Anderen eher mit niedrigeren. Interessant dabei ist die Frage von welchen Faktoren die Leistungen abhängen. Sind beispielsweise Studenten eher dazu geneigt Prüfungen mit guten Bewertungen abzulegen, wenn ihre Eltern einen hohen Bildungsgrad haben? Oder sind Studenten, die am Vorbereitungskurs für die Prüfung teilgenommen haben erfolgreicher in der Prüfung als diejenigen, die an dem Vorbereitungskurs nicht teilgenommen haben? Dieser Bericht versucht solche Fragen mittels Visualisierungstechniken und einem Datensatz zu klären.
\subsection{Zielgruppen und Anwendung}
Die Frage wovon die Leistung von Studenten in Prüfungen abhängt kann sowohl für die Lehrenden von Universitäten als auch für die Studenten selbst interessant sein. Beispielsweise ist die Frage ob die Leistung davon abhängt ob die Studenten am Vorbereitungskurs für die Prüfung teilgenommen haben. Wenn es sich herausstellt, dass die Verteilung der Leistungen sich vollkommen zufällig zur Variable verhält, ob die Studenten am Vorbereitungskurs teilgenommen haben, dann wissen die Lehrenden, dass sie am Vorbereitungskurs etwas ändern müssen: entweder ist ein Vorbereitungskurs für diese Prüfung unnötig oder er muss verbessert werden.
Oder wenn es sich herausstellt, dass Studenten, die den Vorbereitungskurs besucht haben bessere Noten bekommen, als diejenigen, die daran nicht teilgenommen haben, dann ist das für alle Studenten interessant, die eine möglichst gute Note bekommen wollen. Solche Information, angewendet auf spezifische Prüfungen und Vorbereitungskurse wird den Studenten helfen sich zu entscheiden ob sie beim Vorbereitungskurs teilnehmen sollten oder lieber die Zeit anderweitig nutzen wollen.
Da der Bericht sich somit auch an Zielgruppen wendet, die sich nicht gut mit Visualisierungstechniken auskennen, versucht der Bericht die einzelnen Visualisierungen so zu erklären, sodass sie auch ohne spezielles Vorwissen verstanden werden können. Allerdings wird davon ausgegangen, dass Lesende wissen wie die Lehre an Universitäten in Verbindung mit Studenten funktioniert.
\subsection{Anwendungshintergrund}
Sie müssen genug Hintergrund bereitstellen, so dass die Lesenden sich ein Urteil bilden können, ob ihre Lösung funktioniert. Sie sollen die Lesenden jedoch nicht mit Anwendungsdetails so überschütten, dass der Fokus auf die Fragen zur Informationsvisualisierung untergehen.
\subsection{Zielgruppen}
Beschreiben sie die Personengruppe oder Personengruppen, die das von ihnen benannte Anwendungsproblem lösen möchte. Auf welches Vorwissen können sie in dieser Gruppen von Anwenderinnen aufbauen? Welche Informations"-bedürf"-nisse werden durch die Visualisierungen adressiert?
\subsection{Überblick und Beiträge}
In diesem Abschnitt geben sie einen kurzen Überblick über die Daten und verwendeten Visualisierungen. Dann benennen sie die Beiträge ihres Projekts. Diese Beiträge müssen sie in den hinteren Teilen des Berichts genauer ausführen und belegen.
Die Daten sind zufällig generiert und enthalten Informationen zu Studenten: Geschlecht, Rasse / ethische Gruppe, Bildungsgrad der Eltern, Ausgaben beim Mittagessen, ob der Prüfungsvorbereitungskurs abgeschlossen wurde und eine Bewertung zwischen 0 bis 100 für je Mathematik, Lesen und Schreiben. Es sind insgesamt 1000 Zeilen an Daten, die publiziert wurden, man kann sich allerdings jederzeit mehr Daten generieren lassen. In dieser Arbeit werden nur die publizierten 1000 Zeilen verwendet.
Für die Lösung der Fragestellungen werden die Daten in Scatterplots, ... WIP
dargestellt.
%In diesem Abschnitt geben sie einen kurzen Überblick über die Daten und verwendeten Visualisierungen. Dann benennen sie die Beiträge ihres Projekts. Diese Beiträge müssen sie in den hinteren Teilen des Berichts genauer ausführen und belegen.
\section{Daten}
Beschreiben Sie vorhandenen Daten. Gehen sie kritisch darauf ein, in wie weit sich die Daten für die Bearbeitung der Fragestellungen und dem Erreichen von Lösungen für die oben beschriebene Zielgruppen eignen. Haben sie die Daten sinnvoll mit weiteren Datenquellen ergänzt? Wenn ja, wie?
Die Daten \cite{Daten} sind zufällig generiert und enthalten Informationen zu Studenten: Geschlecht, Rasse / ethische Gruppe, Bildungsgrad der Eltern, Ausgaben beim Mittagessen, ob der Prüfungsvorbereitungskurs abgeschlossen wurde und eine Bewertung zwischen 0 bis 100 für je Mathematik, Lesen und Schreiben. Es sind insgesamt 1000 Zeilen an Daten, die publiziert wurden, man kann sich allerdings jederzeit mehr Daten generieren lassen. In dieser Arbeit werden nur die publizierten 1000 Zeilen verwendet, da die Menge für die Visualisierungszwecke hier ausreicht.
Da es keine Daten aus der realen Welt sind, sondern zufällig generierte Daten sind, sind die Beobachtungen auf diesen Daten nur so aussagekräftig für die reale Welt, wie realitätsnah die Generierung dieser Daten ist. Auf \href{http://roycekimmons.com/tools/generated_data/exams}{http://roycekimmons.com/tools/generated\_{}data/exams}, wo man sich die Daten generieren lassen kann, wird empfohlen die Daten nur für Trainingszwecke zu verwenden.
Daher kann es sein, dass die hier gemachten Beobachtungen von der realen Welt abweichen. Wenn es ein guter Generator ist, dann lässt sich allerdings vermuten, dass auch wenn die einzelnen Daten fiktiv sind, deren Zusammenhänge realitätsnah sind.
%Beschreiben Sie vorhandenen Daten. Gehen sie kritisch darauf ein, in wie weit sich die Daten für die Bearbeitung der Fragestellungen und dem Erreichen von Lösungen für die oben beschriebene Zielgruppen eignen. Haben sie die Daten sinnvoll mit weiteren Datenquellen ergänzt? Wenn ja, wie?
\subsection{Technische Bereitstellung der Daten}
Wie sind die Daten zugänglich? Welche Formate werden genutzt. Gibt es Besonderheiten beim Lesen der Formate?
Die in dieser Arbeit verwendete Stichprobe ist über \href{https://www.kaggle.com/spscientist/students-performance-in-exams}{Kaggle} zugänglich. Der Generator dieser Daten kann auf \href{http://roycekimmons.com/tools/generated_data/exams}{http://roycekimmons.com/tools/generated\_{}data/exams} verwendet werden.
Alle Daten sind als Csv-Dateien verfügbar.
\subsection{Datenvorverarbeitung}
Welche Datenvorverarbeitungsschritte sind notwendig? Beschreiben Sie die einzelnen Schritte und begründen sie sie, z.B. warum werden manche Daten weggelassen, über welche Mengen werden Durchschnitte berechnet, warum sind die so berechneten Werte aussagekräftiger als andere Werte.
Title={Process and Pitfalls in Writing Information Visualization Research Papers},
Author={Munzner, Tamara},
Editor={Kerren, Andreas
and Stasko, John T.
and Fekete, Jean-Daniel
and North, Chris},
Pages={134--153},
Publisher={Springer Berlin Heidelberg},
Year={2008},
Address={Berlin, Heidelberg},
Abstract={The goal of this chapter is to help authors recognize and avoid a set of pitfalls that recur in many rejected information visualization papers, using a chronological model of the research process. Selecting a target paper type in the initial stage can avert an inappropriate choice of validation methods. Pitfalls involving the design of a visual encoding may occur during the middle stages of a project. In a later stage when the bulk of the research is finished and the paper writeup begins, the possible pitfalls are strategic choices for the content and structure of the paper as a whole, tactical problems localized to specific sections, and unconvincing ways to present the results. Final-stage pitfalls of writing style can be checked after a full paper draft exists, and the last set of problems pertain to submission.},
Booktitle={Information Visualization: Human-Centered Issues and Perspectives},