DNA의 단백질 코딩 용량

이 도구는 단백질 길이, 단백질 분자량(MW), DNA 길이의 관계를 계산합니다.

DNA의 단백질 코딩 능력은 서열 중 매우 작은 부분(인간 기준 2% 미만)으로, 삼염기 코돈을 통해 단백질 합성 정보를 제공합니다. 대부분의 DNA는 비암호화 영역이지만 중요한 조절 기능을 수행합니다. 코딩 능력은 잠재적 단백질 수를 추정하게 해 주지만, 대체 스플라이싱 등으로 실제 단백질 다양성은 더 커질 수 있습니다. 이 도구는 기초 추정용입니다.

단백질 코딩 능력의 핵심 포인트

  • 작은 비율:
    단백질 코딩 유전자는 전체 게놈의 1-2% 수준만을 차지합니다.
  • 삼염기 암호:
    DNA는 3개의 염기(코돈) 단위로 특정 아미노산을 지정합니다.
  • 유전자와 단백질:
    인간의 단백질 코딩 유전자는 약 19,000-20,000개이지만, 대체 스플라이싱으로 하나의 유전자가 여러 단백질을 만들 수 있습니다.
  • 비암호화 DNA:
    나머지 약 98%의 DNA는 과거 'junk'로 불렸지만 유전자 조절에 핵심적입니다. (프로모터·인핸서 등).
  • 계산:
    DNA 길이와 단백질 길이는 간단한 식으로 연결됩니다: 아미노산 수 = DNA 염기 수 / 3

공식

관계식은 다음과 같습니다:

코딩 가능한 아미노산 수 = DNA 길이(염기 수) / 3
DNA 길이 = 3 x 아미노산 수
예측 단백질 크기 = 아미노산 수 x 0.11 kDa

0.11 kDa는 아미노산 1개의 평균 분자량입니다.

작동 원리

  • 전사:
    단백질 코딩 DNA 서열(유전자)은 mRNA로 전사됩니다.
  • 번역:
    리보솜은 mRNA 코돈(3염기)을 읽고 대응 아미노산을 연결합니다.
  • 단백질 합성:
    아미노산 사슬은 접혀 기능성 단백질을 형성합니다.

의의

  • 기능성 DNA:
    비율은 작지만 코딩 DNA는 생물학적 기능에 결정적입니다.
  • 게놈 복잡성:
    비암호화 영역, 특히 조절 요소는 단백질 발현 시점과 위치를 결정하여 코딩 서열을 넘어선 복잡성을 만듭니다.
Preview
BioCalculator-Preview