Região de codificação

A região de codificação de um gene, também conhecida e abreviada na literatura em inglês como CDS (de coding DNA sequence), é uma porção de DNA de um gene ou RNA que codifica para proteína.[1] A região geralmente começa na extremidade 5' por um codão de início e termina na extremidade 3' com um codão de parada.

A soma total das regiões de codificação de um genoma de um organismo é chamado seu exoma.

Estrutura

A região de codificação em um mRNA é ladeado pela região 5' não traduzida (5'-UTR) e a região 3' não traduzida (3'-UTR).[2] O CDS é a porção de uma transcrição de mRNA que é traduzido por uma ribossoma. CDS é uma palavra-chave (chave de recurso) usada para denotar a 'sequência de codificação de proteínas' em uma tabela de recursos de um gene pelos principais bancos de dados INSDC de sequências.[3] Eles também lêem CDS como sequência de codificação e região de codificação.[4]

Diferença com cDNA

Uma sequência cDNA (DNA complementar) é derivado do transcrito por transcrição reversa, mas neste caso também contém as UTRs 5' e 3', as quais não são parte do CDS (são transcritas, mas não traduzidas). Um CDS irá quase sempre começar com um codon de iniciação AUG em eucariotas e parar em um dos três códons de parada (UAA, UGA, UAG).

Anotação de sequência de codificação

Enquanto a identificação de fases de leitura aberta dentro de uma sequência de DNA é direta, não identificando sequências de codificação, porque a célula traduz apenas um subconjunto de todos as fases de leitura aberta para proteínas.[5] Atualmente a previsão de CDS usa amostragem e sequenciamento de mRNA das células, embora ainda exista o problema de determinar quais partes de um determinado mRNA são realmente traduzidas para proteína. A previsão do CDS é um subconjunto de predição de genes, este último inclui também a previsão de sequências de DNA que codificam não só proteínas, mas também outros elementos funcionais, como genes de RNA e sequências reguladoras.

Ver também

Referências

  1. Furuno M, Kasukawa T, Saito R (1 de junho de 2003). «CDS Annotation in Full-Length cDNA Sequence». Genome Research. 13 (6b): 1478–1487. doi:10.1101/gr.1060303 
  2. Twyman, Richard (1 de agosto de 2003). «Gene Structure». The Wellcome Trust. Consultado em 6 de abril de 2003. Arquivado do original em 28 de março de 2007 
  3. The DDBJ/ENA/GenBank Feature Table Definition - www.insdc.org
  4. coding region - ncbiinsights.ncbi.nlm.nih.gov
  5. Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi (setembro de 2011). «CDS Annotation in Full-Length cDNA Sequence» (PDF). Cold Spring Harbor Laboratory Press. Genome Research. 21 (9): 1478–1487. PMC 403693Acessível livremente. doi:10.1101/gr.1060303. Consultado em 18 de setembro de 2011 
Ícone de esboço Este artigo sobre Bioquímica é um esboço. Você pode ajudar a Wikipédia expandindo-o.