권태관

Software development engineer

About taetaetae

12년 차 백엔드 개발자로서, 1,000만 명 이상의 회원을 관리하고 대용량 데이터를 처리하며, 국내 및 글로벌 서비스를 포함한 대규모 트래픽을 처리하는 웹 서비스 운영과 개발을 경험했습니다. 동시에 읽기 쉽고 유지보수 가능한 코드를 작성하고, 정리와 꼼꼼함을 바탕으로 복잡한 시스템을 구조화하여 코드의 일관성, 성능 최적화, 기술 부채 해소를 통해 개발 과정에서 발생할 수 있는 문제를 사전에 방지하고 해결하는 데 기여하고 있습니다.
개인의 성장뿐만 아니라 팀 전체가 함께 성장하는 문화를 만들어가는 데 관심이 많습니다.
현재는 조직 내 시니어 개발자로써 트러블 슈팅·성능 개선·고성능 API 설계에 집중하며 비즈니스 성장에 기여하고 있습니다.

Work Experience.

NAVER Corporation

Software Engineer

2014.05 ~ 현재

네이버 쇼핑https://shopping.naver.com(2022.02~현재)

  • 신규 서비스(퀵커머스) 상품 API 개발 및 개발 TF 내 레이어 아키텍처/테스트 코드 컨벤션 정립
    ㆍ 배경 : 무분별한 레이어 간 호출로 인해 모듈 책임이 모호해지고, 테스트 코드 부재로 인한 잦은 리그레션 필요
    ㆍ 진행
    ㅤㅤㆍ레이어 아키텍처 정립 : 각 레이어간 명확한 책임 분리를 리팩토링 및 제안하고 팀 내 개발 컨벤션 확립
    ㅤㅤㆍArchUnit 기반 피트니스 함수를 CI 파이프라인에 연동, 레이어 간 의존성 위반 자동 검증
    ㅤㅤㆍ테스트 코드 작성 가이드 : unit test best practice를 문서화, 팀원이 쉽게 적용할 수 있도록 샘플 코드 제공
    ㅤㅤㅤㆍ코드 품질 향상 및 유지보수 용이성 확보
    ㅤㅤㆍ리더십 및 협업 : 상품 원본 수신팀, 클라이언트(Front-End)팀, 기획/디자인 부서 등과 주기적인 스크럼 진행
    ㆍ 결과 : 우선순위 설정과 일정 조율을 주도해 신규 기능을 마감일 내 안정적으로 배포
  • 패션타운 서비스 운영 간 대규모 트래픽 처리 & 장애 대응을 위한 실시간 모니터링 시스템 구축
    ㆍ 배경 : 장애 상황 발생 시 로그 분석 기반 수동 대응으로 평균 5분 이상의 장애 대응이 지연됨
    ㆍ 진행
    ㅤㅤㆍNginx VTS 모듈 + Prometheus로 메트릭 수집 → Grafana 대시보드에서 실시간 트래픽 분석 체계 구축
    ㅤㅤㆍNginx Rate Limit 설정(dry_run 적용 후 안정적인 적용)으로 비정상 트래픽 차단 및 성능 저하 방지
    ㅤㅤㆍApplication 메트릭(응답 시간, DB 쿼리 속도 등)을 시각화하여 병목 구간 우선 개선
    ㆍ 결과 : peak traffic 알림 수신 및 로그를 통합 분석하여 장애 원인 파악 및 대응 시간 단축(5분 → 1분 이내)
  • 상품 표준화(‘그룹상품’ 서비스) 개발 및 데이터 파이프라인 설계
    ㆍ 배경 : 동일 상품의 여러 옵션이 각각 다른 상품으로 등록되어 검색 정확도가 낮고, 사용자 혼란 유발
    ㆍ 진행
    ㅤㅤㆍElasticSearch의 collapse 쿼리를 활용해 그룹상품 단위로 중복 제거, 필터링·페이징 시 처리 성능 최적화
    ㅤㅤㆍ정렬별 우선순위 정책에 맞춰 그룹 내 대표 상품 노출 로직 구현
    ㅤㅤㆍMongoDB와 ElasticSearch 간 상품 수신 데이터 파이프라인 설계 및 마이그레이션 주도
    ㅤㅤㆍ부하 테스트로 목표 TPS 기준 성능 검증 후 쿼리 질의 전략 개선
    ㅤㅤㆍ상품 데이터 수신팀, QA 조직과 협의하여 누락 데이터·품질 이슈 발견 및 조치 플랜 마련
    ㆍ 결과
    ㅤㅤㆍ과제 리딩 및 일정 관리, 리스크 식별을 주도하여 프로젝트를 기한 내 완료
    ㅤㅤㆍ운영 인원(컨설턴트)의 상품 관리 작업 시간 단축
  • 신규 서비스 안정성을 위한 장애 복구 전략 수립 및 Chaos Engineering 도입
    ㆍ 배경 : 서비스 출시 전 장애 복구 시나리오 마련 및 실제 환경에서의 실패 상황 시뮬레이션 목표
    ㆍ 진행
    ㅤㅤㆍ외부 응답 지연 시 Fallback Cache(Redis) 적용으로 빈 응답 문제 해소
    ㅤㅤㆍToxiproxy를 통한 응답 지연/네트워크 장애 재현, 재시도·연결 복구 로직 검증
    ㆍ 결과
    ㅤㅤㆍ테스트 과정에서 Fallback Cache 전환 실패 결함 발견 → 로직 수정 후 성공률 100% 달성
    ㅤㅤㆍ서비스 출시 후 6개월간 치명적 장애 0건 기록, SLA(99.99%) 준수
  • 대규모 실시간 유저 이벤트 처리를 위한 고가용성 데이터 파이프라인 구축
    ㆍ 배경 : 유저 행동 기반 개인화 상품 추천 및 실시간 랭킹/피드 서비스 구현
    ㆍ 진행
    ㅤㅤㆍKafka 기반 실시간 스트리밍 데이터 처리로 사용자 이벤트를 분석 및 추천 시스템 연계
    ㅤㅤㆍ기존 배치 기반 랭킹 시스템(1시간 단위) → Redis를 활용하여 준 실시간 랭킹 계산 (최신성 개선)
    ㆍ 결과 : 서비스 론칭 후 Page View 10% 상승 기여

V Livehttp://www.vlive.tv(2018.08~2022.02)

  • 방송 알림 속도 개선 (관련 블로깅)
    ㆍ 배경 : 느린 알림속도로 스타와 팬간의 소통 단절 및 방송 시청률 저하
    ㆍ 진행
    ㅤㅤㆍ기존 프로세스의 문제점 도출, 플래닝 및 설계, 구현 등 전 과정 참여 및 3단계에 걸친 단계적 배포
    ㅤㅤㆍ발송 대상 조회방식 변경하고 메시지 큐(RabbitMQ) 병렬처리 방식을 개선하여 속도 개선
    ㅤㅤㆍ중복 발송을 제어하기 위한 Redis 키 파티셔닝을 통해 Redis 부하 감소 및 프로세스 속도 증가
    ㆍ 결과
    ㅤㅤㆍ1,000만 사용자 대상 방송 알림 속도 개선(11분 → 30초)으로 푸시 알림 시스템 성능 95% 향상
    ㅤㅤㆍ알림 기능을 활용한 비즈니스 모델 다각화 및 신규 기능(새소식) 출시
  • 서비스 전면 개편: Monolithic → MSA 구조 전환 으로 확장성 및 장애 대응력 강화
    ㆍ EDA 도입, Circuit Breaker, 모듈 분리를 적용하여 마이크로서비스 간 결합도를 낮추고 장애 격리 가능하도록 설계
    ㆍ Kubernetes 기반 컨테이너 오케스트레이션 도입으로 배포 유연성 확보
  • 검색/피드 파트장 역임 : 서비스 안정화 및 이벤트 기반의 검색/피드 시스템 설계
  • CI/CD 자동화 및 코드 품질 개선을 위한 정적 분석 도구(SonarQube) 및 온라인 코드 리뷰 도입 (관련 블로깅)
  • Batch 무중단 배포 적용을 통해 서비스 연속성 유지 및 장애 최소화 (관련 블로깅)

네이버페이 카드 직가맹 시스템 (Payment Gateway)(2016.04~2018.08)

  • 프로젝트 초기 환경 셋팅 (빌드/배포 파이프라인 구축, CI/CD 설계, 서버 및 인프라 구성)
  • Elastic Stack 기반 비즈니스 통합 모니터링 시스템 구축으로 서비스 장애 감지 및 이상 탐지 자동화 (관련 블로깅)
  • 거래비 하락 모니터링 시스템 구축을 통해 비정상 거래 패턴 자동 감지 및 대응 시스템 마련 (관련 블로깅)
  • 트랜잭션 추적 및 성능 모니터링을 위한 분산 트레이싱 도입으로 결제 시스템 안정성 강화

네이버 날씨https://weather.naver.com(2014.05~2016.04)

  • CP사 수신 데이터 모니터링 툴 개발로 데이터 정합성 검증 및 장애 감지 자동화
  • Crontab 기반 데이터 수집을 Spring Batch 및 Jenkins로 전환하여 데이터 흐름 시각화 및 운영 자동화
  • 데이터 파이프라인 로깅 체계 구축으로 이상 데이터 탐지 및 처리 지연 문제 개선
  • 지도 기반 날씨 서비스 아이데이션 및 프로토타이핑 → 향후 서비스에 적용

NHN Technology Services

Software Engineer

2013.05 ~ 2014.05

네이버 게임https://game.naver.com

  • 네이버 아이디 기반 게임 채널링 서비스 운영 및 게임사별 연동 최적화
  • NHN Entertainment → NHN 으로 서비스 이관하는 과정에서 DB 마이그레이션 및 서버 이전을 안정적으로 수행
  • 불필요한 초기 로딩 제거 및 지연 로딩 적용, 서비스 메인 페이지 성능 개선(2.1초 → 1.7초), 로딩 속도 19% 단축

대한민국 육군 장교 (ROTC)

보병대대 통신소대장

2009.02 ~ 2012.06

  • 대대 특별참모 역할 수행 및 통신소대 병력 운영, 교육 및 유지보수 관리
  • GOP 및 FEBA 부대 유/무선 통신망 개선
  • 수기 기록으로 인한 보안 취약점을 개선하기 위해 위병소 전자 출입관리 시스템 개발 (php)

Patent.

대량 알림 발송 방법 및 시스템kipris

  • V Live 서비스에서 진행한 대량 알림 발송 방법 및 시스템에 대한 특허 출원
  • 메세징 큐와 Redis를 활용하여 대량 알림 발송 속도 개선 및 네트워크 부하 감소
  • 1,000만 사용자 대상 방송 알림 속도 개선(11분 → 30초)

Other Experience.

Toy Project

👨‍💻꿈꾸는 태태태의 공간ㆍhttps://taetaetae.github.io/

  • 개인 기술블로그 (2016년 9월~)
  • 새로운 기술을 습득했거나 업무간 트러블 슈팅을 기록하며 공유

Daily DevBlogㆍhttp://daily-devblog.com/

  • 기술블로그 구독서비스 (2018년 7월~)
  • Python, Flask
  • 매일 오전 10시마다 어제 등록된 글, 매주 월요일 오후 2시 지난주 인기글을 정리하여 메일 발송

Skill.

  • Language : Java, Kotlin
  • Framework : Spring (Boot, Batch, Core)
  • ORM : Mybatis, Spring Data JDBC
  • Database : MySql, MongoDB, Redis, Elasticsearch
  • Message Queue : Kafka
  • Build automation tool : Maven, Gradle
  • Web Server : Apache, Nginx, Tomcat
  • DevOps : CI/CD, Jenkins, Ansible, Github Actions
  • Container : Docker, Kubernetes
  • Pinpoint, nGrinder
  • Monitoring : ELK, Prometheus, Grafana