연구

Alphafold2 논문 리뷰2 [입력 부분]

햎피 2022. 10. 25. 23:29
반응형

모델 설명

알파폴드의 입력으로 단백질의 아미노산 시퀀스가 들어간다.

    - genetic database search를 통해서 MSA 를 구하고, MSA representation으로 나타낸다.

    - 아미노산에대해서 pairing을 하고, structure database search를 통해서 template을 넣는다. pair representation으로 나타낸다.

 

<입력 부분>

이 부분에 대해서 조금 자세히 보도록 하자.

supplementary Figure 1이다.

-맨 위에 보이는 extra msa feat은 옵션이다. 넣어줘도 되고 안넣어줘도 된다.

-pair representation 만들기 : residue_index에 대해서 (r,r,cz) 차원으로 변환을 시켜준다. target feat에 여러 linear layer를 거쳐서 차원을 변환시켜준 후 outer sum을 하고, 변환된 residue_index에 대해 더해주어서 pair representation을 만들어준다. 그리고 template_pair_feat을 더해준다.( 만약, template이 없는 단백질 시퀀스에 대해서는 template_pair_feat을 안더해줄것이다)

-> pair representation은 단백질 아미노산의 공간적인 특징을 가진다.

 

-MSA representation 만들기 : target_feat을 linear layer를 통해 차원을 변환시켜준 후, sc개 만큼 쌓아준다(tile). 그러면 (r,cm) 차원이 (sc,r,cm)차원으로 변환될 것이다. msa_feat을 linear layer를 통해 차원을 변환시켜주고, target_feat, msa_feat을 더해서 MSA representation을 만들어준다. template angle feature를 차원에 더해준다.

->MSA representation은 단백질 아미노산의 진화적인 특징을 가진다.

 

이렇게해서 pair representation과 MSA representation이 Evoformer의 입력값으로 들어간다.

 

 

 

반응형