리누스 토발즈는 오픈소스 거물이다. 그리고 그가 학생으로서 “단지 재미를 위해”(Just For Fun ; 그의 저서 제목) 리눅스를 개발하고 리눅스 커널을 개발한 커뮤니티를 (다시 심술궂게) 통치한 이야기는 초기 오픈소스 운동과 해커 정신의 전형적인 사례다.
 

 

ⓒGetty Images

 


하지만 오픈소스는 분명 바뀌었다. 기업 분야에서 적극 수용했으며, 그 결과 기업과 오픈소스 커뮤니티가 모두 바뀌었다. 오늘날의 가장 영향력 있는 오픈소스 프로젝트는 개인보다는 대기업의 협업 프로세스에서 등장할 가능성이 더 높다. 하지만 오픈소스이기 때문에 프로젝트는 커뮤니티 전체에 도움이 되며, 그 창시자들은 새롭게 높아질 프로필의 이점을 누리는 경우가 많다.

오늘날 주요 오픈소스 프로젝트 이면에 자리한 혁신가들을 살펴본다. 


 

 


아파치 카프카(Apache Kafka) : 제이 크렙스, 네하 나크헤드, 준 라오


데이터 스트리밍은 디지털 배관 작업처럼 따분하고 기술적으로 들릴 수 있다. 하지만 더 많은 소스로부터 얻은 더 많은 데이터를 소화하고 처리해야 하면서 데이터 흐름를 적절한 곳에 보내기 위해 필요한 인프라가 그 어느 때보다 중요해졌다.

2000년대 말과 2010년대 초기에 링크드인(LinkedIn)은 이 문제에 부딪힌 초기 기업 중 하나였다. 링크드인의 WVMPF(Who’s Viewed My Profile Feature) 기능을 개발하는 팀에서 근무하던 엔지니어 3명(제이 크렙스(가운데), 네하 나크헤드(오른쪽), 준 라오(왼쪽))은 메시징 시스템 프로젝트에 참여했고 이것이 결국 카프카가 되었다. 참고로 카프라라는 이름은 크렙스가 좋아하는 작가 중 한 명의 이름에서 비롯됐다.

오픈소스로 공개된 아파치 카프카는 광범위한 기업들과 프로제트를 위한 배관 작업의 중요한 부분이 됐다. 한편 크렙스, 나크헤드, 라오는 상업용 클라우드 기반의 카프카 버전을 제공하는 기업인 컨플루언트(Confluent)를 설립했다.


 

 


레디스(Redis) : 살바토르 산필리포


레디스는 디스크에 상주하며 데이터베이스, 캐시, 메시지 브로커 등의 기능을 할 수 있는 NoSQL 인메모리데이터 구조 스토어이다. 다른 많은 오픈소스 프로젝트처럼 골칫거리를 풀려는 시도에서 시작되었다. 실시간 웹로그 분석 도구를 개발하던 이탈리아 스타트업 소속의 살바토르 산필리포는 작업을 위해 테스트하고 있던 다양한 데이터베이스의 기능 부족에 불만이 많았다.

산필리포는 레디스를 공개한 후 이내 오픈소스화 했으며, 프로젝트가 빠르게 성장했고 이내 깃허브 같은 대형 조직이 사용했다. 이후에도 산필리포의 직업 생활은 다른 사람들과 다르지 않았다. 자신의 고향인 시칠리아에서 머물면서 VM웨어(VMware)에 고용되어 레디스 프로젝트를 지속했다. 오픈소스의 후원자인 대기업들이 이 직업 생태계의 중요한 부분이 되었다. 산필리포는 소설도 집필했으며, 곧 출간된다!

 

 

 


쿠버네티스(Kubernetes) : 조 베다, 브렌든 번스, 크레이그 맥럭키


쿠버네티스는 컨테이너 기반 아키텍처로 이전하려는 기업들에게 이미 중요한 인프라로 자리잡은 컨테이너 오케스트레이션 시스템이다. 구글(Google) 내부에서 시작되었으며, 창시자 중 한 사람인 조 베다(왼쪽)는 브렌든 번스 및 크레이그 맥럭키와 함께 해당 기업의 초기 ‘보그(Borg)’ 클러스터 관리자로부터 해당 개념을 구축했다.

쿠버네티스의 본래 이름은 스타 트렉 : 보이저(Star Trek : Voyager)에서 보그 캐릭터 세븐 오브 나인(Seven of Nine)에서 딴 ‘프로젝트 7’이었다. 베다의 스토리 중 가장 중요한 부분은 아마도 자신, 번스, 맥럭키가 배아 프로젝트를 오픈소스화 할 수밖에 없었던 이야기일 것이다. 그는 “사람들이 정말로 이것을 사용하고, 보그에서 얻은 최고의 아이디어를 오픈소스에 적용하고 싶었다”라고 말했다. 베다와 맥럭키는 현재 VM웨어에서 클라우드 기술을 개발하고 있으며, 번스는 마이크로소프트의 애저(Azure) 사업부의 VP다.


 

 


아파치 스파크(Apache Spark) : 마테이 자하리아


아파치 스파크는 빅 데이터의 승자로서, 맥리듀스(MapReduce)를 대체한 데이터 처리 플랫폼이다. 학계에서 등장했다는 점은 오늘 소개하는 프로젝트들 중 이색적인 존재다. 창시자인 마테이 자하리아는 ICPC(International Collegiate Programming Contest)에서 우승했고 UC 버클리에서 박사 학위를 취득했으며, 그곳에서 그의 연구의 일환으로 스파크의 기초가 완성됐다. 스파크는 기업에서 만든 것이 아니기에 거의 처음부터 오픈소스였다.

스파크는 빅 데이터 세계에 폭풍을 몰고 왔고 자하리아는 비즈니스 및 학계에서 자리를 잡았다. 그는 스파크와 다른 데이터 엔지니어링, 데이터 사이언스, 머신 러닝 프로젝트를 중심으로 클라우드 서비스를 제공하는 기업 데이터브릭스(Databricks)를 설립했으며 스탠포드대학교에서 교수로 재직하고 있다. 현재도 그의 연구 그룹은 오픈소스 커뮤니티와 긴밀히 협력하고 있다.  [기사 더보기]

 

 

[출처 : CIO Korea(www.ciokorea.com)]

[기자 : Josh Fruhlinge | InfoWorld]