관리 메뉴

고려대학교 대학원신문

새로운 단백질부터 환자 진단까지, 의료와 AI 본문

8면/과학칼럼

새로운 단백질부터 환자 진단까지, 의료와 AI

Jen25 2024. 9. 11. 15:34

 

새로운 단백질부터 환자 진단까지, 의료와 AI

 

심혜린 과학칼럼니스트

 

최근 삼성전자에서 27세 이하의 직장인 천여 명을 대상으로 조사한 결과에 의하면 업무상 도움이 필요할 때 가장 먼저 찾아보는 수단에 관한 질문에 AI라 답한 응답자가 전체의 80%에 달한다고 한다. 또한, 응답자의 80%AI가 업무 방법을 더 낫게 바꿀 수 있을 것으로 전망했다. 이처럼 AI 기술은 우리 사회에서도 어느덧 일상의 일부가 되었다. 그렇다면, 하루가 다르게 발전하는 AI 기술은 각 분야에서 어떤 변화를 일으킬 수 있을까?

지난 27, 서울에서 열린 리서치앳 코리아행사에서 구글 리서치 소프트웨어 엔지니어인 로리 필그림은 메드-제미나이(Med-Gemini)’에 대한 연구 사례를 발표했다. 메드-제미나이는 구글 리서치와 구글 딥마인드에서 진단 및 치료 결정에 도움을 주고 의료 서비스 접근성을 향상시킬 목적으로 개발한 의료 특화 거대언어모델(Large Language Models)이다. 로리 필그램에 의하면 메드-제미나이가 작성한 흉부 엑스레이 사진 분석 보고서의 72%가 의사가 작성한 보고서보다 우수하거나 유사한 수준인 것으로 평가되었다. CT 영상 분석의 경우 메드-제미나이가 작성한 보고서의 약 53%가 의사가 작성한 보고서와 유사하거나 우수한 수준이라는 평가를 받았다.

이처럼 의/약학 분야에서도 AI를 접목하고자 하는 움직임이 다방면에서 이루어지고 있다. 스크리닝, 분류, 진단, 예후 확인, 의사 결정 지원 및 치료 권장 등 의료시스템의 다양한 과정에서 AI 시스템을 도입하고자 하는 움직임이 활발하다. 캐나다 토론토대학의 소아과병원인 SickKids에서는 응급실 분류 데이터를 사용해 환자의 진단명을 추정하고 환자에게 필요한 검사를 알려주는 AI 모델을 구축했다. SickKids에서는 이 모델의 적용이 환자가 결과 확인까지 걸리는 시간을 약 3시간 단축할 수 있다고 밝혔다.

 

ESM3  모델에 입력된  GFP  단백질 생성을 위한 요청사항 (좌)과 설계된 신규 단백질(우) (Hayes, Tomas, et al. bioRxiv (2024): 2024-07.)

 

한편, 메드-제미나이처럼 진단 및 의료 서비스에 AI를 활용하고자 하는 시도뿐만 아니라 새로운 약물, 단백질 등의 분자를 디자인하는 데에도 AI의 역할이 커질 것으로 기대된다. 기존에는 수년 이상 걸리던 신규 물질의 탐색 및 개발이 AI 도구로 인해 빠르면 몇 분 수준으로도 가능해진 것이다. 구글 딥마인드에서는 단백질의 3D 구조를 높은 정확도로 예측할 수 있는 AI 프로그램인 알파폴드(AlphaFold)를 개발했다. 지난 2020, 딥마인드에서는 알파폴드를 이용해 코로나바이러스인 SARS-CoV-2의 단백질 중 하나인 Orf3a의 구조를 예측했다. 이 예측 결과는 이후 실험적으로 확인된 단백질 구조와 매우 유사한 것으로 확인되었다. 이는 신약 개발 분야에서 큰 반향을 일으켰다. 지난해 생명공학 회사인 Recursion에서는 단백질-리간드 결합을 예측하기 위한 독자적인 AI 시스템인 MatchMaker를 개발해 알파폴드가 구조를 예측한 15,000여 개의 단백질과 360억여 개의 약물 후보군 간 상호작용을 예측했다고 발표했다.

올해 7월에는 메타 출신 엔지니어들이 모여 만든 스타트업으로 알려진 에볼루셔너리스케일(EvolutionaryScale)에서 ESM3이라는 모델을 이용해 신규 녹색 형광 단백질(GFP)을 생성하는 데 성공했다고 발표했다. ESM3 모델은 27억 개가 넘는 단백질 서열, 구조, 기능 정보를 학습해 사용자의 요청에 맞는 단백질을 생성할 수 있는 단백질 언어 모델이다. 녹색 형광 단백질은 빛을 내는 특성으로 인해 생명과학 연구에서 유전자의 발현 여부 확인 등 타겟 물질을 확인하기 위한 표지자로 널리 사용된다. 1960년대 해파리에서 최초의 GFP를 분리해 사용한 이후, 더 밝게 빛나는 단백질이나 다른 색상으로 빛나는 단백질 등 다양한 형광 단백질이 개발 및 합성되었다. 연구진은 ESM3 모델로 GFP의 발색단(chromophore)에서 발견되는 핵심 아미노산 서열을 포함하는 유사-GFP 단백질을 설계한 뒤, 이 중 가능성 있는 디자인을 실제로 합성해 형광 여부를 측정했다. 초기에 합성된 88개의 단백질의 경우 대부분에서 형광이 나타나지 않았으나, 그중 지금까지 알려진 형광 단백질과 다른 형태의 단백질 하나에서 기존 GFP 대비 1/50 밝기 수준의 희미한 형광이 관측되었다. 이 단백질의 서열을 바탕으로 개선된 형광 단백질 100여 종이 새롭게 설계되었다. 이 중 일부는 자연적으로 존재하는 GFP 단백질과 유사한 수준의 형광을 나타내는 것으로 확인되었다. ESM3 모델을 통해 만들어진 GFP 중 가장 밝은 단백질에 속하는 esmGFP는 자연에 존재하는 GFP와 구조적으로는 유사하지만, 아미노산 서열에는 큰 차이가 있었다. 연구진은 esmGFP의 아미노산 서열과 ESM3의 학습에 사용된 훈련 데이터 세트에 포함된 형광단백질의 아미노산 서열 간 일치율이 58%에 불과하다고 밝혔다.

한편, 이와 같은 단백질 설계 기술 발전의 위험성을 경고하는 목소리도 높아지고 있다. AI를 이용한 신규 분자 설계 시스템이 무료로 배포되고, 점차 고도화되는 상황에서 이러한 기술이 독성 물질이나 병원균 등 생물학적 무기 개발에 활용될 수 있다는 것이다. 지난해 10월 워싱턴 대학의 단백질 설계연구소는 AI 안전에 관한 회담을 개최했다. 올해 3월에는 <책임감 있는 AI 기반 단백질 합성 기술 개발을 위한 가치, 원칙 및 약속 (Community Values, Guiding Principles, and Commitments for the Responsible Development of AI for Protein Design)>이라는 성명문이 발표되기도 했다. 20248월 기준 약 175인의 과학자가 서명한 이 성명문은 단백질 개발 분야에서 AI 기술이 오용되지 않기 위한 열 가지 약속을 포함한다. 모델에 자체적인 위험 감지 시스템을 구축하거나, AI 모델을 통해 설계한 단백질을 실제로 합성하는 과정에서 유해 분자를 식별하는 스크리닝 과정을 거치는 방식 등이 논의 및 시행되고 있다.

현재 개발되거나 상용화 과정을 거치고 있는 의료 분야의 AI 시스템을 향한 염려도 다수 존재한다. 대표적으로 AI 구성 요소를 기반으로 하거나 AI 기술을 포함하는 신규 기술 및 시스템에 대한 검증 및 임상실험이 불충분하다는 의견이 있다. 이와 관련해 지난 202년에는 의료 산업에 AI 기술을 적용하는 경우를 고려한 임상 시험 가이드라인이 발표되기도 했다. [SPIRIT-AI(Standard Protocol Items: Recommendations for Interventional Tirals-Artificial intelligence)]는 기존에 임상 시험 계획 시 다루어야 할 최소 항목에 대한 권장 사항을 제시했던 가이드라인인 [SPIRIT 2013]에서 AI와 관련된 15개의 항목이 추가된 신규 가이드라인이다. [SPIRIT-AI]에는 AI 시스템 사용을 위한 하드웨어 및 소프트웨어 요구 사항 명시 데이터 처리 과정에서의 인간-AI 상호 작용 여부 및 사용자에게 요구되는 전문 지식수준 명시 의사 결정을 포함한 임상 과정에서 AI 시스템이 도출하는 결과가 어떤 기여를 하는지에 대한 설명 등이 추가되었다. AI를 이용하는 시스템에 대한 무작위 임상 시험 결과 보고 시 반드시 포함되어야 할 항목에 대한 가이드라인인 [CONSORT-AI(Consolidated Standards of Reporting Trials-Artificial Intelligence)] 역시 함께 발표되었다. [CONSORT-AI]에는 사용한 AI 알고리즘 표기 품질이 좋지 않거나 사용 불가한 입력 데이터에 대한 평가 및 처리 방법 명시 오류/실패 사례 보고 및 오류 식별 방법 명시 등을 포함한 14개의 항목이 신규로 추가되었다.

AI를 이용한 진단 시스템의 경우에는 AI를 학습시킬 때 사용한 데이터와 실제 AI 의료기기가 사용되는 장소의 환경조건 및 환자군이 지나치게 동떨어져서는 안 된다는 지적도 있다. 병원의 시설이나 자원 역시 진단 시스템의 성능에 영향을 미친다는 보고도 있다. 구글 헬스에서 당뇨성 망막증을 진단하기 위해 개발한 알고리즘을 태국의 진료소에서 사용 시 진단율이 크게 떨어졌다는 것이다. 연구진은 이를 태국 진료소의 조명 환경으로 인해 환자의 망막 이미지 품질이 나쁘게 생성된 것을 원인으로 추정했다.

의료 분야에서의 AI 기술 접목은 기술 적용 초기 단계인 만큼 기술적 개선이 필요한 부분도, 사회적 논의가 필요한 지점도 많다. 그러나 위험성을 인지하고 올바른 방향으로의 개발이 이루어진다면, AI 기술이 의료 분야에 지금껏 우리가 본 적 없는 새로운 도약을 이끌 수도 있지 않을까.

 

 

참고 자료

Nature 632, 722-724 (2024)

Callaway, E. Ex-Meta scientists debut gigantic AI protein design model. Nature.

Hayes, Tomas, et al. bioRxiv (2024): 2024-07.

https://responsiblebiodesign.ai/

Nat Med 26, 13641374 (2020)

Nat Med 26, 13511363 (2020).