DNAのタンパク質コード容量とは、配列の中でタンパク質合成の指令を持つ領域(ヒトでは2%未満)を指します。 DNAは3塩基(コドン)でアミノ酸を指定しますが、ほとんどのDNAは非コード領域であり、遺伝子発現の制御に重要な役割を果たします。 コード容量は理論上のタンパク質数を決めますが、選択的スプライシングなどにより実際のタンパク質種類は遺伝子数より多くなります。 本ツールはDNAコード容量のごく基本的な推定に使用します。
タンパク質コード容量のポイント
- 割合はごく小さい:
タンパク質をコードする遺伝子はゲノム全体の1〜2%程度と推定されます。 - 三連コドン:
DNAは3塩基(コドン)で、タンパク質の構成要素であるアミノ酸を指定します。 - 遺伝子数とタンパク質数:
ヒトのコード遺伝子は約1.9〜2.0万ですが、選択的スプライシングにより1遺伝子から複数のタンパク質が作られます。 - 非コードDNA:
残りの約98%は一見「ジャンク」と呼ばれていましたが、プロモーターやエンハンサーなどの制御領域として重要です。 - 計算:
DNA長とタンパク質長の関係は単純で、アミノ酸数 = DNA塩基数 / 3。DNA長からタンパク質サイズを推定できます。
計算式
関係式は次のとおりです。
Amino acids encoded = Size of DNA (in bases) / 3
Size of DNA = 3 x Number of amino acids
Predicted size of protein = Number of amino acids x 0.11 kDa
Size of DNA = 3 x Number of amino acids
Predicted size of protein = Number of amino acids x 0.11 kDa
0.11 kDa はアミノ酸の平均分子量です。
仕組み
- 転写:
タンパク質をコードするDNA配列(遺伝子)がmRNAにコピーされます。 - 翻訳:
リボソームがmRNAのコドン(3塩基)を読み取り、対応するアミノ酸をつなげます。 - タンパク質合成:
アミノ酸鎖が折りたたまれて機能的なタンパク質になります。
意義
- 機能的DNA:
割合は小さくても、コード領域は生物機能に不可欠で、近縁哺乳類でも類似した比率が見られます。 - ゲノムの複雑性:
特に制御領域などの非コード領域が、タンパク質が「いつ・どこで」作られるかを決め、コード配列以上の複雑性を生みます。
Preview
