구글 딥마인드가 '표적이 되는 단백질에 잘 결합하는 단백질'을 설계하기 위한 새로운 AI 모델 '알파 프로테오(AlphaProteo)'를 발표했다.
열쇠가 열쇠 구멍에 딱 들어맞도록, 단백질은 다른 단백질과 결합함으로써 다양한 세포 과정을 처리하고 있는데, 그동안 딥마인드가 개발해온 알파폴드와 같은 단백질 구조 예측 도구는 단백질 간 상호작용의 구조에 대해 많은 통찰을 주지만, 상호작용을 일으키기 위한 새로운 단백질을 설계하지는 못했다.
딥마인드가 이번에 개발한 AlphaProteo는 새로운 고강도 단백질 결합제를 설계하기 위한 AI 시스템으로, 그동안 많은 실험이 필요하고 번거로웠던 단백질 설계를 원활하게 진행해준다고 한다. 약제 개발 외에, 세포나 조직의 시각화, 질병의 파악과 진단, 작물의 해충에 대한 내성 획득 등의 폭넓은 분야에 걸쳐 연구의 속도를 향상시키는 것이 가능하다.
딥마인드 연구팀은 7가지 단백질을 타깃으로, 알파프로테오에서 단백질 결합제를 생성. AI 도구 최초로 VEGF-A라는 단백질에 대한 적절한 단백질 결합제를 설계할 수 있었고, 기존의 최선의 방법보다 후보가 실제로 타깃에 결합할 수 있는 가능성이 높아 결합 친화성은 3배에서 300배나 향상됐다는 것.
AlphaProteo의 트레이닝에는 단백질 데이터 뱅크의 방대한 양의 단백질 데이터와, 알파 폴드의 1억 개 이상의 구조 예측 데이터가 사용되었고, 알파프로테오는 이러한 데이터로부터 분자가 서로 결합하기 위한 다양한 방법을 학습하고 있으며, 타겟 단백질의 구조와 우선 결합 위치의 데이터가 주어지면, 그 위치에서 타겟 단백질에 결합하는 단백질 후보를 생성할 수 있다는 것.
아래 이미지는 알파 프로테오와 기존 방법으로 생성한 단백질이 어느 정도의 확률로 타겟 단백질과 정상적으로 결합할 수 있는지 보여준 그래프. 파란색이 알파 프로테오의 데이터로, 기존 방법보다 더 높은 확률로 결합에 성공했으며, 잘 결합할 수 있는 단백질을 찾기까지 필요한 후보의 수가 감소하는 것을 알 수 있다.
또, 결합 강도를 나타내는 친화성 점수는 다음과 같다. 그래프는 로그 스케일로, 숫자가 작을수록 새롭게 설계된 단백질이 타겟 단백질에 강하게 결합할 수 있음을 의미. 파란색으로 표시된 AlphaProteo는 모든 단백질에서 기존의 것보다 더 강한 결합을 만들 수 있었다.
이러한 결과로부터, AlphaProteo를 사용하면 단백질 결합제를 만들 때 초기 실험에 필요한 시간을 크게 단축할 수 있음을 보여주고 있으며, 또한 모든 단백질에 대한 결합제를 만들 수 있는 것은 아니며, 원래 결합제의 설계가 어려운 것으로 계산 분석에서 판명된 류마티스 관절염 등의 자가면역질환과 관련된 TNF ɑ라는 단백질에 대해서는, 알파프로테오에서도 결합제를 설계할 수 없었다.
딥마인드는 출시에서, "최종적으로 TNF ɑ와 같은 어려운 타겟에 대응하는 것을 목표로, 알파 프로테오의 개선과 확장을 지속할 것"이라고 말하고 있다.