Dentbird Solutions의 기반을 지켜내는 Infra Engineer

클라우드 위에 쌓아 올리는 성장의 기록, Cloud Infra Team Leader 정대일의 발자취

대일님은 전문연구요원으로 이마고웍스에서 커리어를 시작하셨어요. ‘첫 회사=첫 커리어 무대’ 라고 하잖아요! 이마고웍스에 어떤 기대와 선택의 이유가 있었나요?

첫 회사를 선택할 때는 단순히 어디에 입사하느냐(네임밸류 등) 보다는, 장기적으로 어떤 역할을 맡아 어떤 성취를 이룰 수 있을지를 더 중요하게 생각했습니다.

그런 점에서 이마고웍스는 제가 원하는 방향으로 나아갈 가능성이 충분히 보이는 회사였어요. 특히 국내에서 클라우드를 기반으로 글로벌 서비스를 운영하는 기업은 많지 않다는 점이 인상 깊었습니다. 그만큼 도전적인 문제들을 직접 해결해 볼 기회가 많을 것이라 기대했죠. 이러한 환경에서는 제 역할이 자연스럽게 뚜렷해지고, 주도적으로 일할 수 있으리라 생각했습니다.

지금도 입사 시점의 기대와 일치하는 환경에서 일하고 있어요. 제 성장을 적극적으로 지원해줄 수 있는 조직이라고 믿었기에, 이마고웍스를 첫 커리어 무대로 선택하게 되었습니다.

입사 초기에 회사의 차별성에 대해 긍정적으로 체감하셨던 경험이 있다면 들려주세요.

가장 크게 느낀 건 자유로운 분위기였어요.

모르는 게 있으면 누구에게든 편하게 물어볼 수 있고 답도 빠르게 돌아와서 일하면서 막히는 순간이 거의 없었습니다.

덕분에 커뮤니케이션이 훨씬 효율적으로 이루어지고 일하는 과정도 자연스럽게 유연해졌어요. 이런 문화가 협업에도 좋은 영향을 주고 있다는 걸 매일 체감하고 있습니다.

개발 영역은 워낙 넓잖아요. 그 중에서도 인프라에 관심을 가지게 된 계기, 그리고 인프라 업무만의 매력은 무엇이라고 생각하시나요?

제가 생각하는 클라우드 인프라의 가장 큰 매력은 정답이 정해져 있지 않다는 점이에요. 누군가가 미리 정해둔 방식이 없기 때문에 요구사항에 맞춰 구조를 직접 설계하고 최적의 해답을 찾아가는 과정 자체가 흥미로워요.

마치 빈 도화지 위에 그림을 그려 나가듯이 인프라 환경을 정의하고 구성 요소를 하나씩 설계해 나가요. 매번 다른 조건과 제약 속에서도 최적의 구조를 찾아 이를 실제 서비스 운영에 안정적으로 반영하는 과정과 도전 속에서 배움이 생깁니다.

결과물이 서비스와 시스템 속에서 바로 확인되기 때문에 성취감도 느낄 수 있고요.

전 세계 치과 병원과 연구소에서 Dentbird Solutions를 쓰고 있잖아요. 이 모든 것들을 안정적으로 굴러가게 하는 법칙이 대일님 머릿속에 있다면요?

시스템 운영에서 가장 중요한 건 장애가 발생했을 때 얼마나 빠르게 원인을 찾아내고 그 원인을 정확히 짚어 신속하게 복구하느냐라고 생각해요.

장애를 완전히 막을 수는 없기 때문에 저는 항상 의심 지표를 빠르게 감지하고, 발견 즉시 복구한다는 원칙을 갖고 있습니다. 이를 위해 서버 상태, 트래픽 변화, 오류 신호 같은 지표를 자동화된 알림으로 실시간 확인하고, 로그-지표-알림을 연결해 원인을 정확히 좁혀가요. 

결국 인프라 엔지니어에게 중요한 건 완벽을 추구하기보다 문제를 끝까지 책임지고 빠르게 해결하는 태도라고 생각합니다.

자동화, 보안, FinOps 까지 정말 다양한 업무를 리드하고 계신데요. 최근 가장 도전적이었던 과제와 그걸 풀어내신 방식이 궁금합니다.

가장 도전적이었던 과제는 지금도 진행 중인 클라우드 마이그레이션 프로젝트를 리드했던 경험이에요.

단순히 서버 위치를 옮기는 차원이 아니라 비용 최적화와 서비스 안정성을 동시에 확보해야 하는 복잡한 작업이었죠. 클라우드 서비스 비교부터 MSP(Managed Service Provider) 선정, 마이그레이션 크레딧 펀딩, 실제 이전까지 외부 업체와의 협업과 내부 의사 결정 조율이 필수적이었어요.

업무 범위가 워낙 넓다 보니 체계적인 접근이 중요했습니다. 장기적인 계획을 세우고 단계별로 우선순위를 정해 실행했어요. 이슈가 발생하면 관련된 이해관계자들과 긴밀하게 소통하며 빠르게 해결했고요. 

이 프로젝트를 가능하게 한 가장 큰 힘은 계획적인 접근 꾸준한 커뮤니케이션이었어요. 기본적인 원칙이 가장 강력한 해결책임을 다시 한 번 실감했습니다.

올해 초 최연소 팀리더 타이틀을 다신 대일님! 리더가 된 이후 스스로 제일 달라졌다고 느낀 포인트가 있으실까요?

이마고웍스는 ‘님’ 호칭 문화를 갖고 있어서 직책이 달라졌다고 해서 분위기가 크게 달라지진 않았어요.

다만 리더가 되고 나서는 업무 효율과 일정 관리에 훨씬 더 신경을 쓰게 되었습니다. Cloud Infra Team은 정해진 업무 외에도 예기치 못한 이슈나 다른 팀의 협조 요청이 자주 발생하는 환경이기 때문에 ‘어떻게 하면 더 효율적으로 일할 수 있을까?’ 라는 질문의 무게가 훨씬 커졌어요.

예를 들어 인프라 변경 사항은 Jira 티켓을 통해 작은 부분까지 아카이빙하고 있고, 작업을 시작하기 전에는 항상 ‘무엇을, 어떻게, 왜?’ 라는 질문을 던지며 불필요한 일을 줄이려 합니다. 이런 습관들이 쌓이면서 업무에 대한 사고방식이 점점 더 체계적으로 바뀌어가는 걸 느끼고 있어요.

Cloud Infra Team은 내부 개발자, 운영 부서, 클라우드 관련 외부 파트너 등과 긴밀히 협업하고 계시죠! 대일님이 생각하는 ‘좋은 협업’의 핵심 원칙은 무엇인가요?

좋은 협업은 결국 자주 소통하는 것에서 시작된다고 생각해요. 자주 소통할수록 의견 차이가 줄어들고 제가 미처 놓쳤던 부분도 빠르게 확인할 수 있습니다.

그 과정에서 얻은 피드백을 결과물에 반영해 예기치 못한 오류를 줄일 때 가장 이상적인 협업이 이루어진다고 느껴요. 그래서 저는 항상 소통의 빈도를 높이고 그 안에서 얻은 인사이트를 최대한 빠르게 녹여내려 해요.

‘이건 내가, 또는 우리 팀이 확실히 회사의 성장에 힘을 보탰다!’ 하고 자부할 만한 순간이 있다면 자랑해주세요.

자부심을 느꼈던 순간은 매년 진행되는 Dentbird Solutions의 대규모 패치 배포 시간을 눈에 띄게 단축했을 때예요.

글로벌 전역의 인프라 리소스를 동시에 업데이트해야 해서 작업이 매우 복잡하고 길었는데, 제가 처음 참여했을 당시에는 24시간이 넘게 걸렸습니다.

이후 전체 배포 프로세스를 분석하고 직접 주도하면서 개선을 시도했어요. 배포 순서를 재정비하고 인프라 리소스 생성을 사전에 자동화했으며, 장애 발생 가능성을 시나리오로 정리해 선제적으로 대응할 수 있는 구조로 바꿨습니다.

그 결과 최근에는 배포 시간이 8~10시간으로 단축되었고 안정성도 함께 확보할 수 있었어요. 무엇보다 이 개선이 일회성에 그치지 않고 체계화되어 이후 배포에도 꾸준히 적용되고 있다는 점에서 큰 의미가 있었습니다.

앞으로는 사용자가 중단을 전혀 체감하지 못하는 무중단 배포 구조로 발전시키는 것을 목표로 하고 있습니다.

글로벌 인프라는 24/7이 기본이라 체력, 멘탈 관리가 필수잖아요. 대일님만의 활력 충전 루틴은 무엇인가요?

저는 산책과 여행을 통해 활력을 충전해요.

퇴근 후에는 회사에서 반포까지 걸으며 하루 동안의 생각을 정리합니다. 계절이 조금씩 바뀌는 풍경이나 지나가는 사람들의 모습을 관찰하다 보면 머릿속이 맑아지고 하루가 차분히 정돈되는 기분이 들어요.

주말에는 여행을 다니곤 합니다. 가까운 동네를 산책하듯 걷기도 하고 해외 맛집을 찾아 단기 여행을 다녀오기도 하죠.

요즘은 카메라를 들고 풍경 사진을 찍는 여행을 자주 하고 있는데, 사진을 다시 보며 그때의 감정을 떠올리거나 지인들과 이야기를 나누다 보면 자연스럽게 에너지가 채워지더라고요.

앞으로 인프라 엔지니어로서 꼭 도전해보고 싶은 기술이나 프로젝트가 있다면 소개해주세요.

현재 제가 가장 도전적으로 삼고 있는 과제는 멀티 클라우드 기반의 아키텍처 설계입니다.

단일 클라우드에만 의존하면 장애 발생 시 서비스 전체가 중단될 리스크가 늘 존재하기 때문에 AWS, Azure, GCP 등 여러 클라우드를 조합해서 운영하는 구조가 필요하다고 생각해요.

물론 쉽지 않은 과제예요. 각 클라우드의 특성과 네트워크 구성, 권한 관리까지 모두 이해해야 하고 아키텍처 자체가 특정 클라우드에 종속되지 않도록 설계하는 역량도 요구됩니다.

하지만 그만큼 인프라 엔지니어로서 제 역량을 한 단계 더 끌어올릴 수 있는 기회라고 믿고, 퇴근 후에도 꾸준히 관련 공부를 이어가고 있어요.

마지막으로 이마고웍스 Cloud Infra Team만의 성장 포인트가 있다면 말씀해 주세요!

이마고웍스는 클라우드를 적극적으로 활용해 여러 국가에서 자체 서비스를 직접 런칭해 안정적으로 운영하고 있습니다.

이런 글로벌 환경에서는 국가별로 분산된 인프라 리소스를 효율적으로 관리해야 하기에 자연스럽게 다양한 과제를 마주하게 돼요. 글로벌 서비스에 맞는 모니터링 체계 구축, 신규 서비스 아키텍처 설계, 고성능 컴퓨팅 자원의 효율적 활용, 클라우드 비용 최적화 등 끊임없이 고민해야 할 지점들이 있어요.

Cloud Infra Team은 이러한 문제들을 직접 다루며 클라우드 상에서 발생하는 거의 모든 과제에 대응하고 있습니다. 다양한 지역과 환경에서 서비스를 운영하는 경험은 흔치 않기 때문에, 그만큼 도전적이면서도 성취감을 크게 느낄 수 있어요.

클라우드 인프라에 대한 깊이 있는 경험과 넓은 시야를 얻고 싶으신 분들께 이마고웍스의 Cloud Infra Team 은 값진 도전과 성장의 기회가 될 것이라고 생각합니다.