AI 스타트업 창업 후 깨달은 3가지

본 글의 글쓴이 Eddie Pease는 AI 스타트업 PharmaForesight에서 technical cofounder로서 근무하면서 결과적으로는 스타트업이 성공하지 못했지만 본인이 깨달은 귀한 교훈을 블로그에서 공유하였습니다.

Key Takeaways

  • MMC Ventures에 따르면 AI를 제대로 사용하고 있는 AI 스타트업은 전체의 반 정도(대부분 Oursourced human labor나 basic statistical technique)
  • AI 스타트업에 대한 정의 (SaaS와 차이점)
  • Proprietary dataset을 확보하는 방법 3가지
  • Dataset이 아닌 알고리즘으로 성공한 사례 (DeepMind)
  • AI 스타트업 투자 유치의 어려움
  • SaaS 성공 모델에 익숙한 투자자들
  • Use case에 따라서 AI의 prediction에 대해서 설명할 수 있는 것은 accuracy만큼 중요할 수 있음

Intro

PharmaForesight는 pharmaceutical business intelligence 산업의 AI 스타트업이였음. Strong team 멤버로 구성되었고 lean startup 전략을 실행하였음. Product market fit을 찾기 위해서 노력한 결과 창업 4개월 만에 대형 제약회사의 global portfolio management office와 파트너쉽을 체결하고 이들의 재정지원을 받아 model을 만들고 IP 또한 스타트업 소유로 지킬 수 있었음.

스타트업과 관련된 best practice를 실행하였음에도 불구하고 사업은 실패하였음. 실패한 스타트업 경험을 통해 AI 스타트업은 SaaS의 스타트업과는 다른 전략과 접근이 필요한 것을 알았으며 이를 공유하고자 함

AI 스타트업에 대한 정의

많은 스타트업이 AI를 사용한다고 하지만 사실 그들은 outsourced human labor나 basic statistical technique들을 사용하는 것에 불과함. London-based MMC Vunteres에 따르면 AI 스타트업이라 주장하는 모든 회사들 중 40%는 AI를 사용하고 있지 않다고 함.

본 글에서 정의하는 AI 스타트업은 최신 machine learning technique없이는 존재할 수 없는 회사들을 의미함.

이는 AI-enabled product를 만드는 다른 회사들과는 다른 것을 의미함. 예를 들어 Spotify는 machine learning에 많은 투자를 하고 현재 핵심전략의 큰 부분을 차지하지만 이 회사는 machine learning을 적극적으로 사용하기 전에도 회사로서 존재할 수 있었으며 이는 글쓴이의 기준에 따르면 AI보다는 SaaS회사로 분류함.

Lesson 1 : Proprietary data is key

1980년대 SQL 데이터베이스가 그랬던 것처럼 AI는 비즈니스 관점에서 보면 underlying enabling technology로 보는 것이 맞음. SQL이 등장하면서 customer relationship management와 같은 수 조 규모의 산업이 생겼으며 AI 또한 새로운 산업을 만들고 많은 비즈니스 use case들을 개선할 것임.

SQL과 마찬가지로 AI 또한 데이터에 의존하며 데이터는 알고리즘 보다 중요함.

돌아보면 우리 회사의 data strategy는 잘못되었음. 우린 publicly-avaliable-data를 이용한 도구의 첫 버전을 만드는 빠르고 쉬운 방법을 선택하였음. Machine learning용도로 데이터를 clean하고 transform하는데 많은 시간이 걸렸고 우린 이를 통해 어느 정도의 defensibility를 가질 것이라 생각했음. 또한 credibility를 어느 정도 얻고 나면 그 뒤에 더 흥미롭고 defensible한 proprietary dataset에 대한 액세스가 더 쉬울 것이라 예상했음.

이러한 많은 예상들은 다 틀렸음. 모델을 만들기 시작할 때 우리는 우리와 같은 문제에 접근하는 그룹을 주위에서 본 적이 없었지만 마무리가 되어 갈 때는 여러 경쟁자가 있는 것을 확인하였음. 우리의 알고리즘이 더 정확하였지만 모든 경쟁자들이 비슷한 데이터를 사용하고 있었기 때문에 경쟁적 우위나 차별성을 가지기 어려웠음. 

“The takeaway is that access to a proprietary dataset is absolutely key for an AI company.”

 

일반적으로 proprietary dataset을 얻는 방법은 다음의 세가지가 있으며 이들은 mutually exclusive 하지 않음

  1. 사용자가 interact하면 데이터를 생성하는 제품이나 서비스를 직접 만들어서 데이터를 수집하는 방법(Facebook, Google, Spotify)
  2. 일일이 직접 small proprietary dataset을 수집하는 방법. 이는 early adopter들을 타겟으로 한 초기 machine learning mode을 훈련시키는 데 사용되고 이후엔 파트너쉽을 통해 모델을 scaling 함(Huxton Analytics)
  3. 현존하는 data holder(대기업, 공공기관)와 협력하는 방법(Sensyne Health x NHS trusts in the UK)

위의 세가지 옵션 중 글쓴이는 다음과 같은 이유로 마지막 방법을 추천함. 

  • 첫 번째 방법 : 이 경우 회사는 AI 없이도 충분히 서비스를 할 수 있기 때문에 AI 스타트업에 해당하는 방법이 아님
  • 두 번째 방법 : 이 경우로 AI 스타트업을 만들 수 있지만 성공하려면 initial dataset이 충분히 niche하거나 문제해결 접근방식이 매우 innovative해야 함. 다만 충분한 데이터를 얻기 위해 파트너쉽을 체결하기 전에 경쟁자들이 idea나 dataset을 베낄 수 있음.
  • 세 번째 방법 : 위의 두 방법들을 제외하면 이 방법 밖에는 없는 것을 알게 되며 이 때문에 대부분의 AI 스타트업들은 large data holder와 협력함(B2B). 큰 규모의 기관이나 회사는 빠르게 일이 진행되지 않기 때문에 시간이 어느 정도 소요되는 것을 상기하며 데이터 엑세스에 대해서는 추후 발생할 수 있는 분쟁을 막고자 사전에 양측 간 충분한 논의가 필요함. 일반적으로 회사들이 자사가 가지고 있는 데이터의 가치에 대한 중요성을 인식하고 있음.
  • 그 외의 방법 : 위의 방법 말고 DeepMind나 MaginPony처럼 자신들의 알고리즘이 가진 강점을 바탕으로 성공한 AI 스타트업도 있지만 일반적으로 proprietary dataset 없이 성공하기는 쉽지 않음.

Lesson 2 : Raising money for AI startups is hard

우리는 idea와 team, traction이 좋으면 투자 유치가 쉬울 것이라 생각하였지만 우리 생각이 잘못 되었음. Founder 마다 각자의 goal과 constraint이 있기 때문에 이를 스타트업 여정 초기부터 반영해서 투자유치 계획을 고려해야 함. 초기 스타트업 투자자는 다음과 같은 두 그룹이 있음.

  • Technology Venture Capital(VC) : 이들은 3가지를 봄(strong team, a large market size, good initial traction). VC는 투자할 때 1) 10x return 2) 5년대 return을 생각함. 이로 인해 VC가 투자하는 많은 회사들이 산업을 disrupt하는 SaaS임. 많은 VC들이 preference share(VC들이 투자한 valuation보다 비즈니스가 낮은 가격에 팔렸을 때 VC가 founder의 지분을 가져갈 수 있음)를 선호함.
  • Angel Investor : 매우 다양한 angel investor가 있으며 UK의 경우 VC에 비해 founder가 자신의 사업에 대한 통제권을 지키기가 쉬움. 

상기 funder constrain들과 더불어 AI 스타트업은 투자유치를 하는데 여러 어려움을 겪음

AI 스타트업은 데이터확보, 사업 및 알고리즘  개발 등의 이유로 SaaS에 비해서 더 많은 시간과 비용, 전문인력이 필요함. SaaS는 지난 10년 간 매우 성공적인 사업모델이었고 AI 스타트업에 비해서 빠르게 투자원금을 회수함. 또한 투자자들은 AI 스타트업로서는 회사 설립 후 수 년간 쉽지 않은 subscription revenue model을 요구함. 따라서 투자를 받기 위해서 AI 스타트업이 만드는 제품의 value proposition은 매우 강력해야 함.

Lesson 3 : Depending on your use case, explainability can be key

Proprietary dataset과 뛰어난 제품을 만들어도 AI 전문가가 아닌 일반인들은 AI관련 주제가 생소하고 AI가 무엇을 할 수 있는지 확신을 가지기 어려울 수 있음.

이를 해결하려면 스타트업은 자신들의 모델이 잘 작동한다는 확실한 증거가 필요하며 high-level accuracy figure보다는 live demonstartion이나 specific hand-picked example을 사용하는 것을 추천함.

스타트업 AI 모델의 prediction을 설명할 수 있으면 모델에 대한 신뢰를 더 얻을 수 있음. Use case에 따라서 prediction에 대해서 설명할 수 있는 것은 accuracy만큼 중요할 수 있음.

“A good rule of thumb is that the more important each individual prediction, the more important explainability.”