diff --git a/README.md b/README.md
index f5ce93b95bbfcd25e8a88081e3e80c8e503387e7..f4797e107a35a711f577fda278269febd0dfc334 100644
--- a/README.md
+++ b/README.md
@@ -11,6 +11,13 @@
 source dbgpt-hub/bin/activate
 ```
 
+## Datensatz formatieren
+Zuerst muss der Spider Datensatz heruntergeladen und in den Ordner ```data/``` kopiert werden. Dann folgenden Befehl ausführen:
+```
+python -m src.sql_data_process
+```
+Gegebenenfalls ```--code_representation``` für Code Representation. 
+
 ## Pipeline
 
 Siehe ```pipeline.sh```: