Im trying to test some indel calling programs with large deletions in sequencing reads.
I ve got this sequence in Chromosome 20 of hg19 :
> CTAGCAAGGG GGCTGTATGG CTTGAGGCCA TAGTCCAGGA CATCATCGGG 50140599
GTATGCGGGT CCGGAGGGTG GGCTGGCGAC CTTATGTGCA TTCGGCTCTT 50140649
ctggaaagag aagggggaag ggggttcttt ttaagcctca aaaacagaac 50140699
TCCCGGTGCA GAGCAATCAC AGGCTGGATT TCGTCTCACG TCGTTTATTT 50140749
TTTTCAAATT CCCACCATGC CAAACCCCAA GCTAGAAGCT CCGTCCCTCA 50140799
CCAGAAGAAA ACTGAGGCCA CTTTGTCCCA GGTCCCTGGA GAAGACAGGT 50140849
thank I created a fastq file with a simulated deletion between positions 50140699 and 50140748:
>@teste.01 ER85B5301EGS5O length=250
CTAGCAAGGGGGCTGTATGGCTTGAGGCCATAGTCCAGGACATCATCGGGGTATGCGGGTCCGGAGGGTGGGCTGGCGACCTTATGTGCATTCGGCTCTTTCCCGGTGCAGAGCAATCACAGGCTGGATTTCGTCTCACGTCGTTTATTTTTTTCAAATTCCCACCATGCCAAACCCCAAGCTAGAAGCTCCGTCCCTCACCAGAAGAAAACTGAGGCCACTTTGTCCCAGGTCCCTGGAGAAGACAGGT
+teste.01 ER85B5301EGS5O length=250
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
So I mapped my read using bwasw from BWA, and thats what is mapped in my sam file:
>teste.01 0 chr20 50140700 204 100S150M * 0 0 CTAGCAAGGGGGCTGTATGGCTTGAGGCCATAGTCCAGGACATCATCGGGGTATGCGGGTCCGGAGGGTGGGCTGGCGACCTTATGTGCATTCG ...