한국형 도박 사이트, ‘오픈소스'로 간다...글로벌 도박 사이트산업 ‘개방형 vs 폐쇄형’ 주목 < IT < ICT < 기사본문

[도박 사이트] SK텔레콤과 KT가 같은 날 자사의한국어 특화 대규모언어모델(LLM)을 오픈소스로 공개하며 누구나 자유롭게 내려받아 사용할 수 있도록 개방하며 주목받는다. SK텔레콤은 한국어 토큰 처리 효율성과 문장 구조 이해 능력을 강화한 'A.X 4.0'을, KT는 한국 사회의 고유 맥락과 문화적 특성을 반영한 '믿:음 2.0'을 각각 세계 최대 오픈소스 플랫폼 허깅페이스(Hugging Face)에 등록해 누구나 자유롭게 내려받아 사용할 수 있도록 했다.

SK텔레콤의 'A.X 4.0'은 720억 파라미터를 갖춘 표준 모델과 70억 파라미터를 갖춘 경량 모델 두 종으로 구성되어 있으며, 방대한 한국어 데이터 기반 학습을 통해 높은 한국어 처리 효율성과 보안성을 동시에 갖춘 것이 특징이다. 특히 SK텔레콤은 한국어 문장을 입력했을 때 A.X 4.0이 GPT-4o 대비 약 33% 높은 토큰 처리 효율을 보였다고 강조했다. 대표적인 한국어 벤치마크인 KMMLU에서 78.3점, CLIcK에서 83.5점을 기록해 모두 GPT-4o를 상회하는 성능을 보였으며, 기업이 자체 서버에서 운용할 수 있는 온프레미스 방식 제공과 데이터 주권 확보도 강점으로 내세웠다. SK텔레콤은 이 모델을 자사 서비스뿐 아니라 그룹 계열사에도 확대 적용하고, 수학 문제 해결 및 코드 생성 등 추론 능력을 강화한 모델을 이달 중 추가 공개할 계획이다.

KT는 '한국적 AI' 철학을 바탕으로 한국 사회의 언어적, 문화적 맥락을 정교하게 반영한 '믿:음 2.0'을 공개했다. 115억 파라미터 규모의 Base 모델과 23억 파라미터 규모의 Mini 모델로 구성된 믿:음 2.0은 Ko-Sovereign, KMMLU, HAERAE 등 다양한 한국어 특화 벤치마크에서 국내외 주요 오픈소스 모델을 상회하는 성능을 기록했다.

특히 KT는 고품질 한국어 데이터셋 확보와 자체 토크나이저 개발, 고려대 민족문화연구원과의 산학협력 등을 통해 한국 특화 AI로서의 정체성을 강화했으며, AI 영향 평가 체계와 리벨리온과의 협업으로 윤리성과 반도체 호환성도 높였다고 밝혔다. 한편 KT는 향후 마이크로소프트와의 협업을 통해 GPT 기술 기반의 한국형 모델 개발도 추진하고 있다고 밝혔다.

두 모델 모두 상업적 활용이 가능한 오픈 라이선스를 적용했으며, 양사는 자사의 모델이 한국어 특화 벤치마크에서 Open도박 사이트의 GPT-4o보다 우수한 성능을 기록했다고 밝혔다.

AI 산업이 고도화되며 글로벌 AI 기업들 사이에서는 AI 기술을 어떻게 개발하고 공개할지를 두고 '개방형(오픈소스)'과 '폐쇄형'이라는 두 전략이 맞서고 있다.

각 전략은 장단점을 지니고 있다. 오픈소스 진영은 모델의 구조, 사전 학습 가중치, 추론 코드, 토크나이저 등 핵심 구성 요소를 외부에 투명하게 공개하는 방식으로, 개발자와 기업, 공공기관 누구나 자유롭게 이를 활용하고 개선할 수 있도록 한다. 이를 통해 생태계 확장성과 투명성, 협업 가능성을 높인다. 반면, 무분별한 악용 위험과 수익화 한계, 품질 관리 부담이 뒤따른다는 평가다.

반대로 폐쇄형 진영의 경우 AI 모델의 학습 과정과 핵심 데이터를 비공개로 유지하고 위험을 방지하도록 한다. 특히 폐쇄형 그룹은 AI로 인해 발생할 수 있는 딥페이크나 가짜 정보 등의 부작용을 경계하며 AI를 통제된 환경 속에서 개발하며 남용을 방지해야 한다고 주장한다. 다만 이러한 전략은 기술 통제를 강화하고 상업화와 안전성을 확보할 수 있지만, 생태계 다양성과 접근성 측면에서 제한적일 수 있다는 지적이 나온다.

이러한 전략 구도는 글로벌 빅테크 기업들 사이에서도 명확히 드러난다. 오픈AI는 폐쇄형 전략을 고수하는 대표적인 기업으로, GPT-3까지는 일부 공개됐지만 GPT-4 이후 최신 모델은 외부에 전혀 공개되지 않으며 API 형태로만 제공되고 있다. 최근 샘 알트먼 CEO가 "우리는 오픈소스 논쟁에서 역사적으로 잘못된 편에 있었을 수 있다"며 공개 전략 재고를 시사하기도 했지만, 현재까지는 폐쇄 기조를 유지하고 있다. 이 외에도 구글, 앤트로픽 등의 기업 역시 폐쇄형 진영에 속해 있다는 평가를 받는다.

반대로 오픈소스 전략을 택하는 대표적인 기업으로는 메타가 있다. 라마(LLaMA) 시리즈를 비롯해 다양한 대규모 언어모델을 오픈소스로 공개해 누구나 내려받아 연구하거나 서비스에 활용할 수 있게 하고 있다.

다수의 중국 AI 기업들 역시 오픈소스 전략을 취하고 있다. 알리바바는 큐웬(Qwen) 시리즈를 전면 오픈소스로 개방했으며, 화웨이도 최근 '판구' 모델의 일부를 공개하면서 기술 이미지 개선에 나섰다. 스타트업 딥시크(DeepSeek)는 처음부터 완전한 오픈소스 전략을 내세워 글로벌 커뮤니티에서 존재감을 키우고 있다. 반면 바이두는 어니(Ernie) 시리즈에 대해 폐쇄형 전략을 유지하고 있으며, 정부 지원을 통해 내수 중심의 독자 생태계를 구축하고 있다.

비슷한 전략을 추구하는 기업들은 연합체를 구성해 정책 대응과 생태계 영향력 확대에 나서고 있다. 폐쇄형 AI를 추구하는 오픈AI, 구글, 마이크로소프트, 앤트로픽 등은 지난 2023년 '프론티어 모델 포럼'(Frontier Model Forum)을 설립했다. 이 포럼은 AI 모델의 안전성 확보 및 자율 실천을 위해 만들어진 협력 기구로, 각국 정부와의 협력을 강화하고 있다. 최근에는 '프론티어 AI 안전 프레임워크' 초안을 발표하고, AI 사고에 대비한 외부 감시 시스템 설계 등을 논의 중이다.

반면 오픈소스 진영은 메타와 IBM을 비롯해 50여 개의 AI 관련 기업과 정부 기관, 대학이 참여한 '글로벌 오픈소스 AI 연합'(AI Alliance)을 통해 협업 중이다. 해당 연합은 IBM과 메타가 주도하며 델, 소니, AMD와 인텔 등 대형 기술 기업과 여러 대학, AI 스타트업이 참여한다. 안전하고 책임 있는 AI 개발을 위한 기준을 수립하고, 오픈소스 모델의 품질 평가, 공정성 검증, 표준화 작업 등을 공동 추진하고 있다. 또한 유럽연합(EU) 등과의 협업을 통해 오픈소스 모델도 정책적 보호를 받을 수 있도록 노력하고 있으며, 최근에는 다국어 벤치마크 구축, 산업별 테스트베드 운영 등 실질적 지원에 집중하고 있다.

국내의 주요 AI 기업들은 일관된 노선을 유지하기보다, 개방형과 폐쇄형 전략을 유동적으로 채택하고 있는 상황이다. 네이버는 ‘하이퍼클로바X’를 그동안 자사 서비스에만 탑재하는 등 폐쇄적인 방식으로 운영해왔지만, 지난 4월에는 자체 개발한 경량화 AI 모델 ‘하이퍼클로바X 시드’를 오픈 소스로 공개했다. 국내외 기업과 연구기관 등에서는 해당 모델을 내려받아 필요에 맞게 조정해 사업과 학술 연구에 이용할 수 있다. 네이버는 이를 통해 국내 AI 생태계의 체력을 키우고, 국가적 기술 자립 기반을 강화할 것이라고 밝혔다.

카카오는 지난 5월 자체 개발 ‘카나나(Kanana)’ 언어모델 4종을 오픈소스로 허깅페이스(Hugging Face)에 공개했다. 아파치 2.0(Apache 2.0) 라이선스를 적용해 누구나 자유로운 수정과 상업적 활용이 가능하다. 카카오는 오픈소스 공개를 통해 국내 LLM 생태계의 활성화를 위한 시도와 기여를 꾸준히 이어갈 계획이라고 밝혔다.

엔씨소프트의 도박 사이트 전문 자회사 NC 도박 사이트는 지난해 말 높은 한국어 성능을 지닌중소형 오픈소스 VLM(Vision Language Model) 모델 ‘VARCO-VISION’과 한국어 멀티모달 벤치마크 5종을 오픈소스로 공개했다. 엔씨가 공개한 오픈소스 VLM 모델 VARCO-VISION은 한글, 영어 프롬프트와 함께 이미지 입력 값을 이해할 수 있는 중소형 모델이다. LLM과 유사한 수준의 언어 능력을 보유하고 있어 애플리케이션에서 LLM과 VLM 두개의 모델을 운용하지 않고 VARCO-VISION 단일 모델 만으로 이미지-텍스트 작업과 텍스트 전용 작업을 모두 처리할 수 있을 전망이다.