Skip to the content
AI

AI 인프라의 핵심, 데이터센터를 말하다 – 제8회 데보션 테크 데이 현장 스케치

A.X 요약
A.X 요약은 SK텔레콤의 A.X로 요약 후, 편집한 내용입니다.
SK텔레콤의 개발자 소통 커뮤니티 플랫폼 '데보션'이 주최한 제8회 '데보션 테크 데이' 행사가 을지로 T타워에서 열렸다. 이번 행사는 AI 인프라 개발자와 관련 업계 전문가들이 기술을 공유하고 소통할 수 있는 AI DC 테크 포럼 형식으로 진행되었으며, 'AI Cloud Platform'과 'AI Infrastructure' 두 가지 세션에서 AWS, SKT, 아토리서치, 텐, 쿠팡, 리벨리온, DDN 등 다양한 기업과 전문가가 AI DC 산업 근황과 기술에 관한 내용을 발표했다.

AI 인프라의 핵심 데이터센터를 말하다 - 제8회 데보션 테크 데이 현장 스케치

SK텔레콤의 개발자 소통 커뮤니티 플랫폼 데보션(DEVOCEAN)은 지난 2022년부터 지속적으로 기술 공유 행사 ‘데보션 테크 데이(DEVOCEAN Tech Day)’를 개최해왔다. 8회차를 맞은 이번 테크 데이는 AI 인프라 개발자와 관련 업계 전문가들이 기술을 공유하고 소통할 수 있는 자리로 마련됐다. 제8회 테크 데이가 열린 을지로 T타워를 찾아가봤다.

유연한 AI 클라우드를 만드는 기술들

데보션은 그간 지속적으로 사내외 AI 개발자들이 기술을 공유하고 네트워킹을 통해 교류할 수 있는 ‘테크 데이’ 행사를 진행해왔다. 8회차를 맞은 이번 테크 데이 행사는 AI 데이터센터(AI DC) 관련 업계 솔루션을 공유하는 <AI 인프라의 핵심, 데이터센터를 말하다>라는 주제의 AI DC 테크 포럼 성격으로 진행됐다. 양승현 CTO는 “오늘 테크데이 행사에 참여하신 여러 기업의 개발자분들이 각자 서로의 노하우와 운영 경험, 기술 등을 공유해서 좋은 인사이트를 얻어가시길 바란다”면서, “또한 이번을 계기로 개발자들의 기술 중심의 토론이 이어졌으면 좋겠다”고 말했다. 이어 이동기 AI데이터센터 Lab장은 키노트 스피치를 통해 AI DC가 ‘AI 토큰 생산 팩토리’로 진화하고 있으며, AI 인프라 산업은 전통적인 설비업에서 AI 운영체계 전반으로 확장되고 있다고 강조했다. 그러면서 “AI 인프라는 기술이자 사업이며, 더 나아가 사람과 서비스를 연결하는 시대적 기반입니다”라고 말하며 본격적인 행사의 시작을 알렸다.

제8회 데보션 테크 데이는 ▲AI Cloud Platform ▲AI Infrastructure 두 가지 세션으로 구성됐다. 첫 번째 세션은 ‘유연하고 확장 가능한 AI 클라우드는 어디까지 진화했을까?’를 주제로, AI 클라우드 아키텍처와 이를 활용한 실제 운영 사례 중심의 발표가 이어졌다.

AWS(Amazon Web Service)의 최영락 Containers Specialist는 ‘쿠버네티스로 구현하는 생성형 AI 클라우드 네이티브 아키텍처’ 발표를 통해, 생성형 AI 워크로드에 적합한 클라우드 환경을 만들기 위한 핵심 요소로 쿠버네티스 기반 GPU 스케줄링, 최적화된 Pod 오케스트레이션, 데이터와 모델의 효율적 분리를 꼽았다. 그는 특히 “AI 인프라는 이제 ‘어떻게 효율적으로 GPU 자원을 쓰느냐’의 문제로 수렴하고 있다”면서, GPU 워크로드 최적화를 위한 다양한 설정과 실전 사례를 공유했다.

두 번째 발표는 SKT의 ‘페타서스 AI 클라우드(Petasus AI Cloud)’ 소개로 이어졌다. 페타서스는 AI DC 구축과 운영을 위한 고성능·고효율 클라우드 플랫폼으로, 지난 3월 MWC25에서 SKT 부스를 통해 공개된 데 이어, GSMA 글로벌 모바일 어워드(GLOMO) 2025 ‘최고의 클라우드 솔루션(Best Cloud Solution)’ 부문을 수상한 바 있다. AI DC가상화개발팀 이건 매니저는 “국내 최초로 AI 인프라 하드웨어 환경에 최적화된 가상화 소프트웨어와 운영 자동화 소프트웨어 등 핵심 컴포넌트를 자체 개발해 탑재한 AI 클라우드 플랫폼 ”이라고 페타서스를 정의하며, 이를 기반으로 ▲초거대 AI 학습과 추론 환경 제공 ▲GPU/NPU 자원 최적화 ▲AI 서비스 운영 효율화 등 다방면의 고도화 계획을 설명했다.

이어 아토리서치(Atto Research)의 최규휘 수석은 ‘오픈스택 기반 AI 클라우드 플랫폼 설계 및 구축, 운영 경험’ 발표를 통해, 교육용 AI 인프라 및 지능형 교통망 구축 등 실전 구축 사례를 중심으로 현장에서의 시행착오와 솔루션을 소개했다. 그는 “AI 클라우드 인프라는 단지 기술의 문제가 아니라, 학습 데이터를 다루는 방식과 실제 사용자의 요구를 반영한 설계가 핵심”이라고 강조했다.

첫 번째 세션의 마지막 발표는 AI 인프라 전문기업 텐(TEN)의 여상호 책임이 맡았다. 그는 ‘MPSFlow: NVIDIA MPS를 컨테이너 레벨의 분할 기술로 확장하기’ 발표를 통해 GPU 자원의 비효율 문제를 짚으며, “초거대 GPU를 온전히 활용하지 못하는 상황에서, GPU 자원 분할과 직렬화가 비용 효율성과 SLA 보장을 위한 핵심 기술로 떠오르고 있다”고 설명했다. 발표에서는 쿠버네티스 환경에서 MPS를 효과적으로 제어하기 위한 MPSFlow 구조와 기술적 검증 결과도 함께 공유됐다.

고성능 인프라를 받치는 실전 전략

쿠팡 예기헌 이사는 ‘AI Without Limits: From Alternative Compute to Green Hyperscaler’를 주제로 발표에 나섰다. 그는 특히 초거대 모델 학습 시 필요한 전력, 열, 냉각 문제와 같은 물리적 한계를 극복하기 위한 대체 컴퓨팅 아키텍처와 그린 데이터센터 전략을 소개하며, “AI 인프라는 더 이상 단일 기술이 아닌, 환경과 비용까지 고려한 통합적인 설계가 요구된다”고 강조했다.

리벨리온의 김홍석 Chief Software Architect는 ‘리벨리온의 LLM Serving Stack’ 발표를 통해, 자사 칩 아키텍처에 최적화된 LLM 서빙 프레임워크를 공개했다. 특히 자체 개발한 NPU 기반 칩 ‘ATOM’을 활용한 서빙 구조와, 이를 통한 초저지연·고효율 추론 환경 구현 방식을 상세히 설명하며 “기존 GPU 중심에서 NPU로 서빙 인프라 패러다임이 이동하고 있다”는 점을 강조했다.

마지막 발표자는 글로벌 스토리지 솔루션 기업 DDN의 Shuichi Ihara Principal Engineer였다. 그는 ‘Building Scalable and High-performance AI Infrastructure with DDN’ 발표에서, HPC(고성능 컴퓨팅)와 AI 워크로드에 최적화된 분산 스토리지 기술과 그 확장성을 소개했다. 또한 DDN의 대표 솔루션인 ‘Exascaler’와 ‘Infinia’를 기반으로 한 초고속·초저지연 저장 구조에 대해서도 설명했다.

■ 미니 인터뷰 | AI DC가상화개발팀 이건 님

AI 인프라의 핵심 데이터센터를 말하다 - 제8회 데보션 테크 데이 현장 스케치

Q1. 간단한 소개를 부탁드립니다.
현재 AI DC 가상화개발팀에서 페타서스 AI 클라우드 아키텍트, 페타서스 핵심 컴포넌트 개발과 검증 등의 업무를 담당하고 있는 이건 입니다.

 

Q2. 이번에 페타서스 AI 클라우드와 관련된 발표를 맡게 되신 배경과, 직접 발표자로 참여하신 소감이 궁금합니다.
페타서스 AI 클라우드는 SK AI R&D 센터 에서 수년간 축적한 쿠버네티스 기반 가상화∙오케스트레이션 기술을 집대성한 플랫폼입니다. 이번 DEVOCEAN Tech Day에 AI 인프라를 가상화/클라우드화하여 유연하고도 안정적∙효율적으로 운용하는 핵심 기술 사례로서 페타서스 AI 클라우드를 공유해야겠다는 의견이 나왔습니다. 특히 페타서스는 사내 AI DC 인프라 가상화 플랫폼 전반에서 프로덕션 수준의 안정성과 성능을 동시에 잡아낸 첫 사례여서, 외부 개발자들과 경험을 나누고 싶었습니다. AI DC 인프라 관리에서 직면한 도전과 해결책을 잘 전달해야 한다는 책임감은 있었지만, 조직을 대표해서 발표하게 되어 개인적으로 매우 뜻깊었습니다.

 

Q3. 발표에서 가장 중점적으로 다루고자 한 내용은 무엇이었나요?
이번 발표에서는 AI 워크로드 특성에 최적화된 인프라 설계를 중심으로, 대규모 모델의 로딩과 추론 과정에서 발생하는 네트워크, 스토리지, GPU 자원의 병목 문제를 어떻게 해소했는지에 대해 소개했습니다. 또한, Kubernetes 기반 가상화 전략으로는 KubeVirt 기반 Kubernetes-Native 가상화 , VPC Hardware Offloading, NVLink 가상화, NFS over RDMA 등 다양한 기술을 융합해 GPU VM, GPU 컨테이너, AI 스토리지 간의 경량화 및 초고속 데이터 이동 구조를 구현한 방식도 설명했습니다. 아울러, SKT가 자체 개발한 XPU Operator를 통해 이기종 GPU/NPU를 범용적으로 가상화할 수 있는 프레임워크를 소개했으며, 특히 Rebellions사의 ATOM NPU를 실제로 가상화한 사례도 함께 공유했습니다.

 

Q4. 향후 페타서스 AI 클라우드 고도화 계획에 대해 간략하게 소개 부탁드립니다.
페타서스 AI 클라우드는 단순한 인프라 가상화를 넘어, 모델 모니터링·자동 이상 탐지·분산 학습·추론 엔진까지 아우르는 AI 서비스 스택을 하나의 매니지드 플랫폼으로 통합하고 있습니다. 또한, 실시간 워크로드에 따라 자원을 자동으로 할당·회수하는 탄력형 인프라 구조를 통해 비용 효율성과 SLA를 동시에 높였습니다. 이와 함께, NVIDIA 외에도 AMD, Intel, Rebellions 등 벤더사에서 출시한 다양한 가속기를 유연하게 가상화할 수 있도록 지원 범위를 확대 중입니다.

 

이 세 가지 고도화 방향을 통해 페타서스는 ‘내 손안의 AI DC’를 넘어 AI 서비스 전체 라이프사이클을 관리하는 토털 매니지드 솔루션으로 진화하고 있으며, 현재 과기부 GPU 임차 지원 사업에 활용 중이고, 국내 금융사 및 일본 기업들과도 도입을 협의 중입니다.

 

Q5. 정기적으로 진행되는 데보션 테크 데이가 개발자들에게 갖는 의미는 무엇이라고 생각하시나요?
이번 행사는 대기업, 스타트업, 학계가 한자리에 모여 최신 인프라 설계와 운영 노하우를 오픈소스 기반으로 공유하는 드문 기회였습니다. 단순한 발표에 그치지 않고, Q&A와 커뮤니케이션 등을 통해 피드백을 주고받을 수 있는 실전형 네트워킹 플랫폼으로도 기능했습니다. 무엇보다, 정기적인 지식 교류를 통해 SK그룹 내부 개발자뿐 아니라 외부 엔지니어들까지 함께 성장할 수 있는 커뮤니티 생태계가 자연스럽게 형성되고 있다는 점에서 큰 의미가 있었습니다.

 

Q6. 테크 데이 등 데보션에서 진행하는 여러 프로그램을 통한 개발자들과의 교류가 업무에 어떤 도움이 되고 있는지 궁금합니다.
이번 포럼을 통해 다른 기업들의 인프라 구축 사례를 접하면서, 자사 설계에서 미처 인지하지 못했던 미비점을 조기에 발견하고 보완할 수 있는 실전 검증 아이디어를 얻을 수 있었습니다.

 

또한, 공통으로 직면한 인프라 이슈에 대해 커뮤니티 차원에서 함께 논의함으로써, 개별 조직을 넘어 생태계 전체의 기술 역량을 끌어올릴 수 있는 계기가 되었습니다.

 

행사 이후에도 워킹 그룹 운영이나 GitHub 협업 등으로 자연스럽게 파트너와 멘토를 만날 수 있는 인적 네트워크가 형성되며, 신규 PoC나 파일럿 프로젝트를 추진하는 데도 실질적인 도움이 되고 있습니다.

이번 제8회 데보션 테크데이는 ‘AI Cloud 플랫폼’과 ‘AI 인프라’라는 두 축을 중심으로 구성된 세션을 통해 각 분야 현업 전문가들의 기술 경험과 노하우를 공유하고, 실무자 간의 연결을 강화하는 자리였다. SKT와 데보션은 앞으로도 개발자 커뮤니티와 기술 생태계의 성장을 위한 기술 교류의 장을 계속해서 마련해 나갈 예정이다.

콘텐츠 사용 안내
콘텐츠 사용 시에는 SK텔레콤 뉴스룸 출처 표기를 부탁드립니다.
카카오 채널 안내
SK텔레콤 뉴스룸 채널을 추가해 보세요.
추가하기