구조의 정확도를 확인하기 위해 신뢰도 지표를 해석하는 방법
AF3가 실행된 후 출력값에는 신뢰도 지표(confidence metrics)가 포함됨.
pLDDT (The Local Distance Difference Test)
pLDDT는 0~100 범위의 원자 단위 신뢰도(per-atom confidence)를 나타내며, 값이 높을수록 신뢰도가 높음을 의미함. 이는 변형된 LDDT 점수를 예측하는 데 사용되며, 폴리머(polymer)와의 거리만을 고려함.
- 단백질의 경우, pLDDT는 lDDT-Cα 점수와 유사하지만, 잔기(residue) 단위가 아닌 원자(atom) 단위로 세분화됨.
- 리간드(ligand) 원자의 경우, 변형된 LDDT는 리간드 원자와 폴리머 사이의 오류만 고려하며, 다른 리간드 원자와의 오류는 포함하지 않음.
- DNA/RNA의 경우, 변형된 LDDT 계산에 15Å 대신 30Å의 더 넓은 반경이 적용됨.
pLDDT 값은 구조 이미지에서 색상으로 시각화되며, AlphaFold Database(AFDB)와 동일한 색상 매핑이 사용됨.
PAE (Predicted Aligned Error, 예측 정렬 오류)
PAE는 예측된 구조에서 두 토큰(token) 간 상대적인 위치 및 방향 오류를 추정하는 값.
- 값이 높을수록 예측 오류가 크며, 따라서 신뢰도는 낮아짐.
- 단백질 및 핵산의 경우, PAE 점수는 AlphaFold2와 동일하며, 단백질 백본에서 생성된 프레임을 기준으로 오류를 측정함.
- 소분자(small molecules) 및 번역 후 변형(post-translational modifications)의 경우, 기준 구조(reference conformer)에서 가장 가까운 이웃 원자들을 사용하여 각 원자의 프레임을 생성함.
pTM 및 ipTM 점수
- pTM (Predicted Template Modeling) 점수와 ipTM (Interface Predicted Template Modeling) 점수는 TM (Template Modeling) 점수를 기반으로 함. TM 점수는 전체 구조의 정확도를 평가하는 지표임(Zhang & Skolnick, 2004; Xu & Zhang, 2010).
- pTM 점수가 0.5 이상이면, 예측된 복합체(complex)의 전반적인 폴딩(fold)이 실제 구조와 유사할 가능성이 있음.
- ipTM 점수는 복합체 내 서브유닛(subunit) 간 상대적 위치의 정확도를 측정함.
- 0.8 이상: 신뢰할 수 있는 고품질 예측
- 0.6 미만: 예측 실패 가능성이 높음
- 0.6~0.8 사이: 예측이 정확할 수도 있고 아닐 수도 있는 불확실한 영역
- TM 점수는 작은 구조나 짧은 서열에 대해 매우 엄격하기 때문에, 20개 미만의 토큰이 포함된 경우 pTM 점수는 0.05 미만으로 부여됨. 이러한 경우 PAE 또는 pLDDT가 예측 품질을 평가하는 데 더 유용할 수 있음.
보다 자세한 신뢰도 지표에 대한 설명은 논문에서 확인할 수 있음. 또한, 단백질 구성 요소와 관련하여 AlphaFold: A Practical Guide 과정에서는 신뢰도 지표에 대한 추가적인 튜토리얼을 제공함.
특정한 분자(entity) 또는 상호작용(interaction)에 관심이 있다면, 전체 복합체가 아닌 각 체인(chain) 또는 체인 쌍(chain-pair)에 대한 신뢰도 값이 다운로드 가능한 출력 데이터에 포함되어 있음. 모든 신뢰도 지표의 세부 정보는 JSON 섹션에서 확인할 수 있음.