이도근군은 컴퓨팅 분야에서의 최신 연구 동향을 파악하고 이를 본인이 연구하는 Non-volatile Memory 에 적용하여 역량을 증진하기 위하여  최고 수준의 학회인 이번 2016 Annual Technical Conference(ATC’16)에 참석하였습니다.

TO7A1963-resized

 

ATC’16은 가상화, 시스템, 네크워크, 클라우드 등 폭넓은 분야를 다루는 학회로서 이번 학회에서는 총 47편의 논문, 17편의 포스터, 그리고 5편의 Indurstry Talk가 발표되었습니다. ATC’16의 메인 테마는 분산 시스템 컴퓨팅이라고 해도 과언이 아닐 정도로 많은 논문들이 분산 시스템에 집중하고 있었습니다. 네트워크, 키-밸류 스토어, 그래프, 암호화 등 여러 주제들이 분산 시스템에 적용되었을 때 나타나는 문제점 및 해결방안을 제시하는 논문들이 대부분이었습니다.

 

TO7A1953-resized

 

본인이 집중한 분야는 키-밸류 스토어와 파일시스템 분야의 논문이었습니다. SLIK 논문은 분산시스템에서의 키-밸류 스토어가 확장성의 문제 때문에 secondary indexing과 같은 사용자 편의 제공 기법들을 희생시키는 문제를 해결하고자 확장 가능한 색인구조인 Independent partitioning을 제안하였으며, 색인 구조가 분산되어 있기 때문에 발생하는 색인 업데이트시의 의 일관성 유지 문제를 해결하고자 Ordered write를 업데이트에 적용한 흥미로운 논문이었습니다. 이 논문에 대해 저자에게 질문하고자 포스터 세션에서 무려 30분간을 기다렸지만, 차례가 돌아오지 않아 답변은 받지 못했습니다.

 

TO7A1906-resized

 

Replex논문도 역시 분산 시스템 환경에서 키-밸류 스토어가 가지는 확장성 및 편의성의 문제를 해결하고자 한 논문이었습니다. Vmware에서 연구한 논문으로,  Best paper award를 받은 훌륭한 논문이었습니다. 이 논문의 메인 아이디어는 인덱싱과 복제(Replication)를 결합하여 Multiple Secondary Index를 제공하자 입니다. 기존 HyperDex의 접근법처럼 인덱스 하나마다 원본 데이터의 카피본을 유지하는 것은 너무 많은 스토리지 자원을 소모하므로, 장애 허용을 위해 어짜피 제공해야 하는 복제 데이터를 사용자가 추가하길 바라는 인덱스 기준으로 정렬하여 관리하며, Replex의 연구진은 이 기법을 HyperDex에 구현하여 Cassandra 및 오리지널 HyperDex 와 비교하여 성능을 검증하였습니다.

 

TO7A1910-resized

 

FxMark논문은 기존의 벤치마크들이 CPU 코어의 확장성 및 공유 파일자원에 대한 접근을 고려하지 않은 점에 집중하여 CPU코어의 갯수와 파일시스템들간의 상관관계에 대해 연구하고, 이를 고려한 벤치마크를 개발한 논문입니다. 연구 결과 여러 파일시스템들은 대부분의 경우 CPU코어가 증가해도 성능이 코어의 수에 비례하지는 않았고, 일부 파일시스템의 경우는 코어의 수가 늘어나도 어느정도의 성능에 수렴하거나 오히려 성능이 더 나빠지는 경우가 많았습니다. 이 원인은 모두 파일시스템의 락 때문에 일어나며, 파일시스템 메타데이터에 접근하기 위한 락, 페이지캐시의 접근 횟수를 기록하는 카운터를 막고 있는 atomic_inc()와 같은 함수들의 락 등이 병목현상입니다. 이 논문에서는 이를 해결하기 위한 해결책은 제시하지 않고 있지만, FxMark라는 벤치마크를 제공하여 파일시스템 개발의 보조적인 도구는 제공하고 있습니다.

 

TO7A1909-resized

 

포스터 세션에서는 포스터로 학회에 참석한 연구진 뿐 아니라 Technical Session에서 발표하였던 연구진들도 모두 포스터 발표를 하였습니다. 본인은 FxMark 연구진에게 “Direct IO의 경우 파일시스템 코드를 거의 바이패스하기 때문에 락으로 인한 성능 저하가 발생하지 않을 것 같은데, 실제로도 그런가” 라는 질문을 하였고, 저자로부터 Direct IO는 파일 자체에 락이 걸리기 때문에 역시나 성능 저하가 발생한다는 답변을 받았습니다. 또한 clfB-tree의 연구진에게는 “노드의 슬롯들에 첫번째 슬롯값과의 차이만 기록되게 되면 차이가 너무 클 경우 에러가 발생할 수도 있지 않느냐”는 질문을 하였고 노드 하나의 크기는 정해져 있지만 슬롯 하나의 크기는 정해지지 않은 구조라서 문제 없다는 답변을 받았습니다. Barista 논문의 저자에게는 “사용자에게 웹OS의 여러 기능을 필요한 파트별로 모듈화 시켜서 제공하는 아이디어는 좋지만, 최적화가 되어 있지 않아서 성능의 문제가 발생하는 것 같다”라는 질문을 하였고 저자로부터 이 기능이 필요한 네트워크 장비들은 데이터 전송에 필요한 CPU자원보다 더 넉넉한 성능의 CPU를 가지고 있으므로 크게 문제가 되지 않는다는 답변을 받았습니다. Erasing Belady’s Limitaitons논문의 저자에게는 인텔에서 제안한 핫 데이터의 SSD캐싱과 다른 점이 무엇이냐는 질문을 하였고, 저자로부터 캐시 에빅션 등의 정책을 사용자 마음대로 할 수 있다는 점이 다르다는 답변을 받았습니다.

 

TO7A1848-resized

 

이번 학회에서는 분산 시스템에 집중한 주제들과, 키-밸류에 관한 논문이 많이 발표됨을 확인하였고 이 부분이 우리 연구실에서 진행하여야 하는 연구 주제임을 확인하였습니다. 또한 이번 학회에서 느낀 부분은 이번 학회에서 발표된 이슈들은 본인의 연구 주제인 비 휘발성 메모리 분야에 어떻게 적용할지에 대해 고찰해야 하겠다는 점과 좋은 논문을 써서 좋은 학회에 개제함을 목표로 매일 정진해야 함을 느꼈습니다. 더불어 본 학회 참석을 허락해 주신 교수님과 출장을 지원해 주신 정보통신기술진흥센터에 깊은 감사의 말씀을 드립니다.