lindaxiang
diff --git a/‎data/beds/cds.bed.gz
-215 KB b/‎data/beds/cds.bed.gz
-215 KB
diff --git a/‎data/beds/cds.nomerge.bed.gz
2.09 MB b/‎data/beds/cds.nomerge.bed.gz
2.09 MB
diff --git a/‎data/beds/exon.bed.gz
-500 KB b/‎data/beds/exon.bed.gz
-500 KB
diff --git a/‎data/beds/exon.nomerge.bed.gz
8.78 MB b/‎data/beds/exon.nomerge.bed.gz
8.78 MB
diff --git a/‎data/beds/gene.bed.gz
-729 KB b/‎data/beds/gene.bed.gz
-729 KB
diff --git a/‎data/beds/intron.bed.gz
-1.88 MB b/‎data/beds/intron.bed.gz
-1.88 MB
diff --git a/‎data/beds/lncRNA.bed.gz
133 KB b/‎data/beds/lncRNA.bed.gz
133 KB
diff --git a/‎data/beds/lncRNA.promoter.bed.gz
206 KB b/‎data/beds/lncRNA.promoter.bed.gz
206 KB
diff --git a/‎data/beds/lncRNA_ss.bed.gz
664 KB b/‎data/beds/lncRNA_ss.bed.gz
664 KB
diff --git a/‎data/beds/miRNA.bed.gz
16 KB b/‎data/beds/miRNA.bed.gz
16 KB
diff --git a/‎data/beds/miRNA.promoter.bed.gz
16.4 KB b/‎data/beds/miRNA.promoter.bed.gz
16.4 KB
diff --git a/‎data/beds/pc_ss.bed.gz
32.4 MB b/‎data/beds/pc_ss.bed.gz
32.4 MB
diff --git a/‎data/beds/protein_coding.bed.gz
156 KB b/‎data/beds/protein_coding.bed.gz
156 KB
diff --git a/‎data/beds/protein_coding.promoter.bed.gz
345 KB b/‎data/beds/protein_coding.promoter.bed.gz
345 KB
diff --git a/‎data/beds/protein_coding_ss.bed.gz
2.74 MB b/‎data/beds/protein_coding_ss.bed.gz
2.74 MB
diff --git a/‎data/beds/start_codon.bed.gz
-301 KB b/‎data/beds/start_codon.bed.gz
-301 KB
diff --git a/‎data/beds/stop_codon.bed.gz
-383 KB b/‎data/beds/stop_codon.bed.gz
-383 KB
diff --git a/‎data/beds/utr3.bed.gz
586 KB b/‎data/beds/utr3.bed.gz
586 KB
diff --git a/‎data/beds/utr3.nomerge.bed.gz
1.16 MB b/‎data/beds/utr3.nomerge.bed.gz
1.16 MB
diff --git a/‎data/beds/utr5.bed.gz
443 KB b/‎data/beds/utr5.bed.gz
443 KB
diff --git a/‎data/beds/utr5.nomerge.bed.gz
1.01 MB b/‎data/beds/utr5.nomerge.bed.gz
1.01 MB
diff --git a/‎get-stats.py
+41-34 b/‎get-stats.py
+41-34
diff --git a/‎gql_qc_report.py
+3-1 b/‎gql_qc_report.py
+3-1
@@ -19,46 +19,50 @@
 variant_calling_stats_fields = {
     'donor_id': 'donor_id',
     'study_id': 'study_id',
-    'gender': 'gender',
+    # 'gender': 'gender',
     'experimental_strategy': 'experimental_strategy',
-    'geno_infer_gender': 'geno_infer_gender',
-    'normal_aligned': 'flags.normal_aligned',
-    'tumour_aligned': 'flags.tumour_aligned',
-    'sanger_called': 'flags.sanger_called',
-    'mutect2_called': 'flags.mutect2_called',
-    'is_pcawg': 'flags.is_pcawg',
+    # 'geno_infer_gender': 'geno_infer_gender',
+    # 'normal_aligned': 'flags.normal_aligned',
+    # 'tumour_aligned': 'flags.tumour_aligned',
+    # 'sanger_called': 'flags.sanger_called',
+    # 'mutect2_called': 'flags.mutect2_called',
+    # 'is_pcawg': 'flags.is_pcawg',
     'normal_sample_id': 'normal.sample_id',
-    'normal_file_size_gb': 'normal.alignment.file_size',
-    'normal_error_rate': 'normal.alignment.error_rate',
-    'normal_duplicate_rate': 'normal.alignment.duplicate_rate',
-    'normal_pairs_on_different_chromosomes': 'normal.alignment.pairs_on_different_chromosomes',
-    'normal_pairs_on_different_chromosomes_rate': 'normal.alignment.pairs_on_different_chromosomes_rate',
+    'normal_submitter_sample_id': 'normal.submitterSampleId',
+    # 'normal_file_size_gb': 'normal.alignment.file_size',
+    # 'normal_error_rate': 'normal.alignment.error_rate',
+    # 'normal_duplicate_rate': 'normal.alignment.duplicate_rate',
+    # 'normal_pairs_on_different_chromosomes': 'normal.alignment.pairs_on_different_chromosomes',
+    # 'normal_pairs_on_different_chromosomes_rate': 'normal.alignment.pairs_on_different_chromosomes_rate',
     'normal_oxoQ_score': 'normal.alignment.oxoQ_score',
-    'normal_avg_depth': 'normal.sanger.contamination.avg_depth',
-    'normal_estimated_coverage': 'normal.alignment.estimated_coverage',
-    'normal_sanger_contamination': 'normal.sanger.contamination.contamination',
-    'normal_mutect2_contamination': 'normal.mutect2.contamination.contamination',
-    'normal_properly_paired_reads': 'normal.alignment.properly_paired_reads',
-    'normal_total_reads': 'normal.alignment.total_reads',
+    'normal_insert_size_mean': 'normal.alignment.average_insert_size',
+    # 'normal_avg_depth': 'normal.sanger.contamination.avg_depth',
+    # 'normal_estimated_coverage': 'normal.alignment.estimated_coverage',
+    # 'normal_sanger_contamination': 'normal.sanger.contamination.contamination',
+    # 'normal_mutect2_contamination': 'normal.mutect2.contamination.contamination',
+    # 'normal_properly_paired_reads': 'normal.alignment.properly_paired_reads',
+    # 'normal_total_reads': 'normal.alignment.total_reads',
     'tumour_sample_id': 'tumour.sample_id',
-    'tumour_file_size_gb': 'tumour.alignment.file_size',
-    'tumour_error_rate': 'tumour.alignment.error_rate',
-    'tumour_duplicate_rate': 'tumour.alignment.duplicate_rate',
-    'tumour_pairs_on_different_chromosomes': 'tumour.alignment.pairs_on_different_chromosomes',
-    'tumour_pairs_on_different_chromosomes_rate': 'tumour.alignment.pairs_on_different_chromosomes_rate',
+    'tumour_submitter_sample_id': 'tumour.submitterSampleId',
+    # 'tumour_file_size_gb': 'tumour.alignment.file_size',
+    # 'tumour_error_rate': 'tumour.alignment.error_rate',
+    # 'tumour_duplicate_rate': 'tumour.alignment.duplicate_rate',
+    # 'tumour_pairs_on_different_chromosomes': 'tumour.alignment.pairs_on_different_chromosomes',
+    # 'tumour_pairs_on_different_chromosomes_rate': 'tumour.alignment.pairs_on_different_chromosomes_rate',
     'tumour_oxoQ_score': 'tumour.alignment.oxoQ_score',
-    'tumour_avg_depth': 'tumour.sanger.contamination.avg_depth',
-    'tumour_estimated_coverage': 'tumour.alignment.estimated_coverage',
-    'tumour_sanger_contamination': 'tumour.sanger.contamination.contamination',
-    'tumour_mutect2_contamination': 'tumour.mutect2.contamination.contamination',
-    'tumour_properly_paired_reads': 'tumour.alignment.properly_paired_reads',
-    'tumour_total_reads': 'tumour.alignment.total_reads',
-    'ascat_normal_contamination': 'tumour.sanger.ascat_metrics.NormalContamination',
-    'ascat_ploidy': 'tumour.sanger.ascat_metrics.Ploidy',
+    'tumour_insert_size_mean': 'tumour.alignment.average_insert_size'
+    # 'tumour_avg_depth': 'tumour.sanger.contamination.avg_depth',
+    # 'tumour_estimated_coverage': 'tumour.alignment.estimated_coverage',
+    # 'tumour_sanger_contamination': 'tumour.sanger.contamination.contamination',
+    # 'tumour_mutect2_contamination': 'tumour.mutect2.contamination.contamination',
+    # 'tumour_properly_paired_reads': 'tumour.alignment.properly_paired_reads',
+    # 'tumour_total_reads': 'tumour.alignment.total_reads',
+    # 'ascat_normal_contamination': 'tumour.sanger.ascat_metrics.NormalContamination',
+    # 'ascat_ploidy': 'tumour.sanger.ascat_metrics.Ploidy',
     # 'ascat_goodnessOfFit': 'tumour.sanger.ascat_metrics.goodnessOfFit',
     # 'ascat_psi': 'tumour.sanger.ascat_metrics.psi',
-    'ascat_purity': 'tumour.sanger.ascat_metrics.rho',
-    'mutect2_callable': 'tumour.mutect2.callable'
+    # 'ascat_purity': 'tumour.sanger.ascat_metrics.rho',
+    # 'mutect2_callable': 'tumour.mutect2.callable'
 
     # 'cgpPindel_cpu_hours': 'tumour.sanger.timing.cgpPindel.cpu_hours',
     # 'cgpPindel_max_memory_usage_per_core': 'tumour.sanger.timing.cgpPindel.maximum_memory_usage_per_core', 
@@ -195,6 +199,7 @@ def process_qc_metrics(song_dump, variant_calling_stats):
             if not analysis['samples'][0]['specimen']['tumourNormalDesignation'] == 'Tumour': continue
             studyId = analysis['studyId']
             sampleId = analysis['samples'][0]['sampleId']
+            submitterSampleId = analysis['samples'][0]['submitterSampleId']
             matchedNormal = analysis['samples'][0]['matchedNormalSubmitterSampleId']
             experimental_strategy = analysis['experiment']['experimental_strategy'] if analysis['experiment'].get('experimental_strategy') else analysis['experiment']['library_strategy']
             normal_sample_id = '_'.join([studyId, experimental_strategy, matchedNormal])
@@ -228,6 +233,7 @@ def process_qc_metrics(song_dump, variant_calling_stats):
                 },
                 'tumour': {
                     'sample_id': sampleId,
+                    'submitterSampleId': submitterSampleId,
                     'alignment': {},
                     'sanger': {
                         'contamination': {},
@@ -332,7 +338,8 @@ def process_qc_metrics(song_dump, variant_calling_stats):
                     metrics = get_extra_metrics(fname, extra_metrics, metrics)
 
                     for sa in sample_map[normal_sample_id]:
-                        variant_calling_stats[sa]['normal']['sample_id'] = analysis['samples'][0]['sampleId']  
+                        variant_calling_stats[sa]['normal']['sample_id'] = analysis['samples'][0]['sampleId']
+                        variant_calling_stats[sa]['normal']['submitterSampleId'] = analysis['samples'][0]['submitterSampleId']  
                         variant_calling_stats[sa]['normal']['alignment'].update(metrics)
                         variant_calling_stats[sa]['flags']['normal_aligned'] = True 
                 elif fl['dataType'] == 'OxoG Metrics':
 
@@ -27,10 +27,12 @@ def process(gql_dump, analysisType, suppress):
             suppress_dict['donorId'] = analysis['donors'][0]['donorId']
             suppress_dict['sampleId'] = analysis['donors'][0]['specimens'][0]['samples'][0]['sampleId']
             suppress_dict['tumourNormalDesignation'] = analysis['donors'][0]['specimens'][0]['tumourNormalDesignation']
-            suppress_dict['experimental_strategy'] = analysis['experiment']['experimental_strategy']
+            suppress_dict['experimental_strategy'] = analysis['experiment']['experimental_strategy'] if analysis['experiment'].get('experimental_strategy') else analysis['experiment']['library_strategy']
             suppress_dict['run_input_analysisId'] = analysis.get('analysisId')
             suppress_dict['run_input_analysisType'] = analysis.get('analysisType')
 
+            if suppress_dict['tumourNormalDesignation'] == 'Normal' and suppress_dict['run_input_analysisType'] == 'sequencing_alignment': continue
+
             for wf in wf_repo:
                 complete_count = 0
                 complete_latest = 0