diff --git a/README.md b/README.md index f5ce93b95bbfcd25e8a88081e3e80c8e503387e7..f4797e107a35a711f577fda278269febd0dfc334 100644 --- a/README.md +++ b/README.md @@ -11,6 +11,13 @@ source dbgpt-hub/bin/activate ``` +## Datensatz formatieren +Zuerst muss der Spider Datensatz heruntergeladen und in den Ordner ```data/``` kopiert werden. Dann folgenden Befehl ausführen: +``` +python -m src.sql_data_process +``` +Gegebenenfalls ```--code_representation``` für Code Representation. + ## Pipeline Siehe ```pipeline.sh```: