연구

Alphafold2 논문 리뷰4 [Evoformer - pair representation]

햎피 2022. 10. 25. 23:30
반응형

<Evoformer>

입력으로 MSA representation, Pair representation이 들어온다. pair representation의 값이 Row wise gated self attention with pair bias에 들어온다. 즉, 공간적 특징과 진화적 특징이 섞이게 된다. MSA representation을 거친후, outer product mean을 통해 진화정보를 공간적 정보로 넣어주게 된다. 그리고 pair representation 인코딩이 시작된다.

 

-pair representation 설명

그리고 pair representation을 인코딩하는 5개의 블럭을 거친다. 이 다섯개의 블럭에 대해서 조금 더 자세히 설명해보겠다.

 

pair representation은 아미노산사이의 공간적인 특징을 가지고 있는 matrix이다. 즉, 각

column, row는 아미노산 시퀀스이다. 이 매트릭스를 이용해서 node를 아미노산으로, edge를 residue의 proximity로 나타내어 그래프로 표현 할 수 있다.(아래 b figure)

특히나, 이 논문에서는 노드 3개(아미노산 3개)를 사용해서 pair representation을 업데이트 한다. (그래서 이름을 triangle multiplicative update라고 지었다.)

그리고, pair representation을 업데이트 할 때, 4개의 방법을 사용한다. (c figure)

1. edge ij에 대해서, outgoing하는 edge를 사용해서 업데이트 (노드 i,j에 대해서 모두 밖으로 나가는 모양)

    즉, edge ij를 업데이트 할 때,  ik, jk edge 사용

2. edge ij에 대해서, incoming 하는 edge를 사용해서 업데이트 (노드 i,j에 대해서 모두 i, j로 들어오는 모양)

    즉, edge ij를 업데이트 할 때, ki, kj edge 사용

3. starting node에 대해서 self attention

4. ending node에 대해서 self attention

 

아래 그림이 좀더 자세하게 설명해준다...

설명은 다음에,,

 

이렇게해서 Evoformer에서는 진화적 정보와 공간적 정보를 모두 가진 MSA representation, Pair representation을 output으로 내주고, 이 output이 structure module로 들어간다. structure module에서 구조를 만들기 위해서 rotation, translation, angle을 예측하는데, structure module에 대해서는 다음에 포스팅 하겠다.

반응형