서울에서 열리는 SOSP2025에 다녀왔다. 대면으로 참석하는 첫 학회였기에 기대가 많이 되었는데, 기대 이상으로 재미있었고 스스로 연구에 대한 동기부여가 많이 되었던 경험이었다.
학회 첫 날(월요일)엔 저녁 6시 부터 conference등록이 이루어져서 등록을 하고 간단히 저녁을 먹었다.

학회 둘 째 날부터 컨퍼런스 세션이 시작되어 관심 있는 논문들에 대해선 미리 논문을 읽고 발표를 들었다. 자원의 효율적인 관리에 관심이 많아서인지 특히 LithOS와 Sailor논문이 재미있었다.

LithOS는 GPU의 Streaming Multiprocessors 2개를 묶어 TPC라는 단위로 보고 이를 수직적으로 나누어 여러 application들이 GPU를 공간적으로 공유하여 사용할 수있게 GPU OS를 구현하였다. 기존에 GPU Spatial sharing을 하는 Multi Process Service (MPS)기술과 비교해 어떤 차이와 이점이 있는지 궁금했고 Poster세션에 저자로 참여한 대학원생분들께 여러 질문을 했다. MPS와의 차이점에 대해서 MPS는 각 프로세스가 수평적으로 SM을 나누어서 쓰기에, 몇 개의 SM에 얼만큼(시간적) 수행되는 지 유저가 알 수 없는데, LithOS의 경우 각 Application이 수직적으로 SM을 나눠가질 수 있다는 점에서 CPU의 Core를 이용하는 방식과 유사했다. MPS를 이용할 경우, SM Scheduling으로 인한 각 Application의 interference를 고려하지 않아도 되어서 MPS와 비교하여 SLO Attainment가 높았다. Poster 시간동안 많은 이야기를 나누고 linkedin도 교환할 수 있었다.
Sailor논문은 Cloud환경에서 heterogeneous한 resources에 대해서 ML Training을 효율적이고 비용 절약적이게 수행하기 위한 시스템이다. ML Training을 클라우드의 여러 자원을 이용해서 수행하려면 고려해야하는 사항이 1) ML Training의 병렬방법과 병렬정도, 2) 어떤 클라우드 인스턴스-하드웨어를 이용할 것인지, 3) 각 cloud instance가 위치한 Zone에 따른 Network 3) Resource의 availability가 계속해서 달라질 수 있다는 점을 고려해야한다. 그래서 Resource allocation과 job parallelization을 결정해야하는 아주 큰 Search space를 가진다. 저자들은 이 큰 Search space를 관찰한 내용들을 토대로 pruning하고 dynamic programming방식으로 효율적인 configuration을 결정한다. 해당 논문 또한 Poster세션을 통해 저자에게 질문할 수 있었는데 Sailor이외에도 저자의 논문을 읽었던 것이 있어서 많은 얘기를 나눌 수 있었다.
Poster세션에서 IC-Cache 연구 저자분도 만나게 되어 Caching 시 Cache size 와 latency 변화에 대해서도 자세히 질문할 수 있었다. 이 분과도 오래 이야기 나누었는데, 구글에서 Notebook LM에서 포스터 카드를 만드는 일을 하셨는데, 최근에 그 기능을 유용하게 사용했던 터라 놀라웠다. 구글에서 7년(?)정도 있으시다가 퇴사하셨고 퇴사 이유부터 어떻게 살아가고 싶으신 지 등 인생에 대한 철학도 들을 수 있었다.
매일 점심, 저녁은 뷔페가 제공되었고 식사시간동안 다양한 연구자분들과 이야기를 나눌 수 있었다. 캐나다의 삼성에서 근무하는 분, 스위스의 ETH Zurich의 대학원생 분들, 데이터센터에서 일하시다가 퇴사한 분, 서강대에서 포닥하시는 분, AWS 직원, Microsoft 직원분들 등 정말 많은 분들과 이야기할 수 있엇다.
특히 AWS 직원분과 함께하는 테이블이 학회에서 처음으로 모르는 사람과 이야기했던 시간이었는데, 함께 자리했던 다른 대학원생 분께서 적극적으로 채용절차를 밟고 싶다고 이야기하시는 모습에서 학회에서 채용 기회도 잡을 수 있구나를 알게되었다. 여러모로 도움이 되는 순간이 많았다.

Banquet시간엔 ATC의 부활도 직접 볼 수 있었다.
이번 학회는 서울에서 개최되어, 학회 마지막 날 저녁엔 excursion trip이 있었고 자원봉사자로 다녀올 수 있었다. 비록 퇴근길에 차가 막혀 이동시간이 길었지만, 버스에서 자기소개를 하며 서로 알아갈 수 있었고, 남산골 한옥마을, 남산타워를 다니며 새로운 분들과 오래 이야기할 수 있는 기회가 있었다. 프랑스 사람이지만 영국에서 일하고 지금은 도쿄에서 일을하고 있는분께 Rust의 장점에 대해서 듣기도 하고 Serverless 시스템에서 어떻게 보안이 이루어지는지, 어떤 문제가 있는지 (latency문제였다) 들을 수 있었다.
가이드가 되며 정신은 없었지만, 맛있는 삼계탕도 먹고 영어로 설명되는 한국에 대해서도 들으며 감회가 새로웠다. 익숙한 도시에서 새로운 경험 (학회와 투어)이 어색하면서도 즐거웠다.
열심히 연구해서 좋은 학회를 많이 가고 싶어졌다. 모든 기회를 주신 교수님께 감사한 마음이다.