Created by: voorhs
Теперь все работает seamlessly с нашим классом Dataset. Добавил CLI endpointы в pyproject.toml, так что теперь можно запускать аугментации как утилиты библиотеки:
poetry run evolution-aug --input-path AutoIntent/clinc150_subset --output-path my-augs/clinc150_subset/basic_aug.json --n-evolutions 1 --reasoning --abstract --concretizing
poetry run basic-aug --input-path AutoIntent/clinc150_subset --output-path my-augs/clinc150_subset/basic_aug --n-generations 1 --n-sample-utterances 1
Конкретно эти команды сохраняют датасет на диск в формате json командой Dataset.to_json(). К сожалению эти json нельзя считать командой Dataset.from_json() :((( Исправлю это в отдельном PR в dev сегодня