이도근군은 파일 시스템 및 스토리지 분야에서의 최신 연구 동향을 파악하고 이를 본인이 연구중인 NVM용 자료구조와 가비지 수집에 적용하기 위하여 국제 저명 학회인 15th USENIX Conference on File and Storage(FAST’17)에 참석하였습니다.

FAST’17은 우리 연구실에서 주로 연구하는 분야인 파일시스템 및 스토리지 분야를 깊게 다루는 최고 수준의 학회로서 이번 학회에서는 8개의 테크니컬 세션에서 총 27편의 논문들이 발표되었습니다. 학회 이름에 걸맞게, 주로 파일시스템과 스토리지가 이번 학회의 메인 테마였습니다. 스토리지 분야에서는 Open-channel SSD 및 SMR 등 최신 기술들에 대한 이슈로 논문이 발표되었고, 파일시스템 분야에서는 파일시스템 오버헤드 및 에이징에 관한 이슈들이 인상깊었습니다.

20170301-TO7A2847-resized

 

본인이 집중한 분야는 가비지 수집과 파일시스템 분야, Open-channel SSD 관련 논문이었습니다. Tiny-Tail Flash 논문은 SSD의 가비지 수집으로 인해 호스트 입출력이 블록되는 현상에 주목한 논문입니다. 가비지 수집과 관련 없는 데이터 블록에 대한 입출력이 가비지 수집 과정중의 채널 락에 의해 블록되어 입출력 오버헤드가 증가하는 현상을 개선하고자 하였습니다. 이 논문의 핵심은 가비지 수집 중 유효페이지들을 동일 플레인에 속한 프리 페이지로 복사함으로서 채널을 통한 데이터 이동을 제거하였고 이를 통해 입출력 블록을 회피한 것입니다. 본인은 논문의 저자에게 “동일 플레인의 모든 페이지들이 GC의 대상이 되면, 채널 락을 거는 것이 차라리 오버헤드가 더 적지 않느냐”는 질문을 하였고, 저자로부터 워크로드에 따라 다르게 처리할 수 있다는 답변을 받았습니다.

 

20170301-TO7A2828-resized

 

CCFS 논문은 EXT4의 DATA모드에서 글로벌한 Running transaction으로 입출력 순서를 보장하는 동작이 일으키는 오버헤에 주목한 논문이었습니다. 이 동작은 글로벌하게 입출력의 순서를 보장해주기 때문에, 순서 보장과 관계 없는 입출력들의 오버헤드가 증가하게 되는 문제를 발생시킵니다. 이 논문에서는 프로세스마다 ‘스트림’을 두고 한 스트림 안에서만 입출력 순서를 보장함으로서 이 문제를 해결하고자 하였습니다. 스트림은 한 프로세스가 발생하는 입출력의 running transaction으로 정의됩니다. 해결해야 할 challenge가 아직은 많지만, 아이디어가 매우 신선한 논문이었습니다.

 

20170301-TO7A2832-resized

 

WORT 논문은 NVM용 Radix tree 자료구조를 제안한 논문이었습니다. 그간 많은 연구들은 NVM용 B+tree자료구조에 집중하였는데, 이 논문에서는 Radix tree가 NVM에서 가지는 장점에 주목하였습니다. Radix는 B+tree처럼 노드 내부 슬롯의 정렬이 필요 없고, 밸런싱이 필요 없어서 split/merge가 발생하지 않는 장점이 있습니다. 이들은 모두 NVM에서 추가적인 write를 발생시키는 원인이고, 일관성 보장을 위한 clflush() 명령과 맞물려 큰 오버헤드가 됩니다. WORT는 자연적인 radix tree의 장점 이외에도 path header를 노드마다 붙여서 중간 노드의 탐색을 한번에 할 수 있게하여 검색 성능을 향상시켰습니다. 이 자료구조는 NVM에서 기존의 tree들에 비해 좋은 성능을 보이지만, range query와 같은 동작은 지원하지 않기 때문에 key-value나 DB같은 분야에선 사용되기 힘들지 않을까 하는 생각이 들었습니다. 이 점 때문에 저자에게 “range query가 radix tree에서는 가능하지 않은데, 어떤 앱 또는 시스템에서 contribution이 있느냐”는 질문을 하였습니다. 저자로부터 인덱스 구조에 적합하기 때문에 파일시스템 쪽에서 사용이 가능할 것이다라는 답변을 받았습니다만, 개인적으로 파일시스템이나 Key-value store, DB에서는 range query가 필수적이라고 생각하기 때문에 이 답변이 썩 만족스럽지는 않았습니다.

 

20170301-TO7A2840-resized

 

LightNVM 논문은 CNEXLABs에서 제안한 Open-channel SSD 하드웨어에 대한 논문입니다. 이 논문의 저자인 Matias bjoring은 이전에도 연락을 나누었던 사람으로써 실제 만나서 이야기를 나눌 기회가 있었습니다. 이분에게는 개발보드 구매 프로세스에 관한 질문을 하였고, Chip이 release가 되면 언제라도 구매가 가능할 것이다는 답변을 들었습니다.

이번 학회에서는 이 외에도 파일시스템과 스토리지에 관한 흥미로운 논문들이 많이 발표되어 비슷한 주제를 연구하는 저를 많이 반성하게 만들었습니다. 또한, 이번 학회에서 발표된 이슈들을 본인의 연구 주제에 어떻게 적용할지에 대해 고찰해야 하겠다는 점과 좋은 논문을 써서 좋은 학회에 개제함을 목표로 매일 정진해야 함을 느꼈습니다. 더불어 본 학회 참석을 허락해 주신 교수님과 출장을 지원해 주신 정보통신기술진흥센터에 깊은 감사의 말씀을 드립니다.