Run GPSW with test data#
First activate the GPSW Conda environment:
$ conda activate gpsw
Download workflow code and small test data set:
$ cd /path/to/test/dir
$ gpsw fetch --test-data
This will download the workflow code, configuration files and test data, and should look as follows:
Directory structure
.
├── config
│ └── config.yml
├── reads
│ ├── Control_1.fastq.gz
│ ├── Control_2.fastq.gz
│ ├── Control_3.fastq.gz
│ ├── Control_4.fastq.gz
│ ├── Control_5.fastq.gz
│ ├── Control_6.fastq.gz
│ ├── Test_1.fastq.gz
│ ├── Test_2.fastq.gz
│ ├── Test_3.fastq.gz
│ ├── Test_4.fastq.gz
│ ├── Test_5.fastq.gz
│ └── Test_6.fastq.gz
├── resources
│ └── orfs.csv
└── workflow
├── envs
│ └── stats.yaml
├── report
│ ├── alignment-rates.rst
│ ├── barcoderank.rst
│ ├── drugz.rst
│ ├── lfc_neg.rst
│ ├── lfc_pos.rst
│ ├── missed-barcodes.rst
│ ├── multiqc.rst
│ ├── pca.rst
│ └── plot-coverage.rst
├── rules
│ ├── count.smk
│ ├── qc.smk
│ └── stats.smk
├── schemas
│ └── config.schema.yaml
├── scripts
│ ├── calculate_proportion_of_reads_in_bins.py
│ ├── calculate_psi.py
│ ├── count_barcodes.sh
│ ├── create_count_table.py
│ ├── csv_to_fasta.py
│ ├── general_functions.smk
│ ├── plot_alignment_rate.R
│ ├── plot_barcode_multi_conditions_profiles.R
│ ├── plot_barcode_profiles.R
│ ├── plot_barcoderank.R
│ ├── plot_coverage.R
│ ├── plot_dotplot.R
│ ├── plot_lfc.R
│ ├── plot_missed_barcodes.R
│ ├── plot_pca.R
│ └── rename_to_barcode.py
└── Snakefile
10 directories, 45 files
To start the workflow on the test data:
$ cd /path/to/test/dir
$ gpsw run --profile $HOME/.config/snakemake/standard/
Note
The --profile argument will only have to be provided on the first run of GPSW, as it will create a config file (~/.gpsw/config.ini) that will store the profile path. To run GPSW without a profile use --profile None.