기술 블로그
[s3c:w6:cat:tech:v1] 실무에서 직접 설계·운영한 백엔드 시스템과 의사결정 기록. Go·Java/Spring·PostgreSQL·Kubernetes 기반의 분산 시스템 패턴, 음성 AI 파이프라인(WebRTC·STT·LLM·TTS)의 latency·동시성 트레이드오프, OCR/문서 탐지 모델의 평가 지표(F1·Precision·Recall) 적용기 등을 다룹니다. 모든 글은 본인이 직접 운영하며 측정한 1차 데이터에서 출발합니다.
-
[Pion] ForwardTrack 루프 — 미디어를 흘려보내는 가장 짧은 코드
결론 먼저 — 미디어 forward의 본질은 한 루프다 항목 값 핵심 코드 라인 수 ~10줄 Track 타입 TrackLocalStaticRTP 패킷 단위 RTP 패킷 (재인코딩 없음) 고루틴…
-
[설계 판단] 1:1 AI 음성 상담을 위해 SFU를 ‘Dumb Pipe’로 둔 이유
결론 먼저 — 1:1 음성 상담의 미디어 토폴로지 비교 토폴로지 서버 CPU 대역폭 지연 구현 복잡도 1:1 상담 적합성 P2P (Mesh) 0 매우 낮음 최저…
-
[문서 탐지] 시험지 OCR에서 TP/FP/FN 계산 기준 — 전체 객체 수 보존 관점
결론 — “전체 객체 수 보존”이 핵심 기준이다 시험지 OCR에서 TP/FP/FN을 계산할 때 가장 중요한 원칙은: “총합 문제 수가 일치되어야 정확하다” 부분 검출을 성공으로 인정하고,…
-
[설계 판단] RPC를 언제 쓰는가 — 라이브러리 통합 시 7가지 결정 기준
RPC를 언제 쓰는가, 그리고 이 프로젝트는 왜 RPC를 쓰는가 이 글은 두 가지를 정리한다. RPC가 무엇이고 어떤 문제를 해결하기 위한 도구인가 detection-mvp/image-extract가 PDFium 호출 방식으로…