AI가 헬스케어 영역 내 과학적 발견을 산업화 하고 있다.

Andreessen Horowitz의 General Partner인 Vijay Pande는 VC firm에 합류하기 전에 스탠포드 대학교에서 20년 간 교수로 재직하였으며 현재는 회사의 bio fund를 총괄하고 있습니다. 영상에서 Vijay는 AI가 헬스케어 영역에서 과학적 발견을 산업화하고 있고 앞으로 여러 영역에서 큰 변화가 발생할 것을 예상합니다.

Key Takeaways

  • AI로 인하여 현재 헬스케어에서 이전보다 우월하고, 비용을 절감시키는 과학적 발견들이 가능해 진 것과 같은 특징은 과거에 볼 수 있었던 산업화의 특징과 매우 비슷함
  • 이러한 헬스케어의 산업화는 최소 20년 이상 진행될 것으로 예상함
  • 헬스케어 산업화의 어려움 : image 영역과 다르게 컴퓨터를 이용해서 얻은 bio 결과는 not clean 할 수 있음, 적은 biology 데이터 양, PhD level AI pre-training에 필요한 노력의 총량
  • 현재 진행되고 있는 산업화 사례 : small molecule drug synthesis, biomarker discovery, healthcare delivery
  • 앞으로 예상하는 산업화 사례 : machine learning을 이용하여 blockbuster 임상시험 비용 절감, mice / ex-vivo models as features, antibody protein drug 비용 절감

Intro

영상 초반 부에 Vijay는 자신이 흥미롭게 읽었다는 책인 ‘Capitalism in America’의 핵심 내용들을 언급함. 

  • 산업화 과정에서 bespoke → industrial 이라는 작업을 바라보는 큰 전환(key shift)이 있었음.
  • 모든 사회 구성원들이 이러한 변화를 반긴 것은 아님. 산업화가 자신에게 위협이라고 생각한 집단들은 공장을 파괴하는 등 행동으로 자신들의 의견을 표현함.
  • 산업화 당시 공장에서 만든 제품/기술에 대한 adoption이 유럽보다 미국에서 높았음. 이는 미국은 신생 국가로서 제품의 기능성만 따졌지만 유럽의 경우 역사, 심미성 등을 고려하는 사용자들의 성향 때문으로 해석.
  • 실제로 산업화 초기 생산품들은 기존의 artisan-grade 제품과 비교하였을 때 겉보기에 조악하고 못생겼지만 가격은 매우 저렴하였음. 
  • 이어서 복리의 강력한 힘을 논한 아인슈타인의 말을 인용하며 초기에는 저렴하고 조악한 품질의 산업화 생산품도 연간 10%~20%의 발전이 누적되면 제품을 engineer(industrialize)할 수 있는 특성으로 인하여 결국엔 품질이 기하급수적으로 개선될 수 있음을 언급함.

Hallmarks of Industrialization

산업화(과거나 현재)가 진행될 때 확인할 수 있는 특징들을 언급함.

  1. The Science has been borne out sufficiently: 증기기관을 만들었던 회사들의 예를 들었음. 회사들은 증기기관을 만들기 위해 대한 모든 과학적 지식을 알고 있지는 못하였지만 산업화 할 정도는 가능한 기본 지식은 갖추고 있었으며 제품을 개발하면서 역학(기계학), 열역학 등의 과학 분야가 발전하였음. 
  2. Engineerability: Moore’s law나 검사에 필요한 비용이 기하급수적으로 감소하고 있는 Genomics를 언급하며 재료공학, 전자공학, 광학 등 다양한 분야에서의 개선이 융합하면서 연 10~20% 복리적으로 성장함.

Vijay는 drug discovery 등의 헬스케어 영역 내 지적인 업무들은 연구실의 PhD  과학자들이 주도하는 bespoke process 였지만 AI(machine learning)로 인하여 이러한 작업들이 개선되고 산업화가 진행이 되고 있다고 얘기하였으며 완료되기까지 최소 20년 혹은 그 이상이 걸릴 것이라 예상함.

Healthcare Industrialization at Present

AI를 이용하여 small molecule drug을 합성하고 lead compound를 찾거나 심지어 lead optimization에도 사용함.

일반적으로 biomarker는 정확하지 않지만(colorectal cancer용 PSA test = 50% accurate) AI가 발견한 biomarker는 sensitivity/specificity가 90%에 육박할 정도로 정확함.

AI는 환자에게 어떤 약을 처방하고 여러 치료법 중 특정 환자에게 맞는 것을 고르거나 치료 일정을 잡는 등의 healthcare delivery에도 사용되고 있음. 

Challenges in Healthcare Industrialization

헬스케어에서 산업화 과정은 사실 쉽지 않음

  • Biology는 image 등의 영역과는 다르게 컴퓨터와 연결해서 연구를 할 때 clean한 결과를 얻기가 어려움.
  • 다른 AI 영역과 다르게 biology는 데이터 양이 적음.
  • PhD가 되기 위해서는 방대한 지식/정보가 필요하기 때문에 AI pre-training에 많은 노력이 필요함.

AI in Image Recognition & Healthcare

Ai-enabled medical application을 설명하기 전에 위와 같은  facial recognition deep learning에 대한 예를 들었음.

좌측 하단 input layer에 데이터(pixels)가 입력되며 hidden layer(shapes, features, faces)등의 hierachical understanding을 통해 output layer에서 특정 얼굴을 인식함. 이와 같은 방식으로 특정 자동차, 코끼리, 의자 등을 인식할 수 있음.

헬스케어에서도 radiology, pathology 등의 분야에서 image를 이용한 AI 연구가 활발히 진행되고 있음. 위와 같은 경우 DNA를 1 dimensional image로 간주하고 AI로 DNA sequence를 학습하여 circulating tumor cell DNA로부터 암의 유무를 판단함.

AI로 인한 과학적 발견이 가능하게 되면서 기존의 대학원(PhD, MD)과 같이 지식이 사람에서 사람으로 전해지는apprenticeship/guild model에서 machine learning, robotic data generation 등의 도구가 더해진 형태로 작업의 모습이 변할 것으로 전망함.

Healthcare Industrialization in the Future

Blockbuster drug design 임상시험에서의 비용 절감 : machine learning을 이용해서 preclinical data을 바탕으로 phase 1을 예측하거나 phase 1 data로 phase 2를 예측하는 방법으로 막대한 비용을 절감할 수 있음.

Mice as features : Animal이나 ex-vivo organoid 등의 연구대상 데이터를 machine learning의 input으로 입력하고 이를 기존 연구에서 피험자로부터 얻은 데이터와 결합하여서 pre-clinical 이후에 사람에게 직접 실험하지 않아도 AI가 더 높은 정확성으로 임상시험 결과를 예측함.

Costly protein production : 현재 antibody protein drug을 제조하는 데 많은 비용이 필요하지만 미래에는 machine learning을 이용해서 가격을 반 이하로 낮출 수 있을 것이라 예상함.