2026년 05월
-
[AI 음성 상담] 데이터 플로우 5단계 — 각 단계의 실패 모드와 fallback
결론 먼저 — 5단계 × 실패 모드 × 복구 가능성 단계 핵심 동작 대표 실패 복구 1. 사용자 요청 인증·세션 토큰 발급 토큰 만료 /…
-
[설계 판단] 미디어 평면과 비즈니스 평면을 두 서비스로 쪼갠 이유
결론 먼저 — 한 서비스 vs 두 서비스, 4축 비교 축 한 서비스 두 서비스 분리 장애 격리 한쪽이 죽으면 둘 다 격리됨 배포 주기…
-
[WebRTC] STUN과 TURN, 언제 무엇을 — NAT 종류 × 성공률 매트릭스
결론 먼저 — Symmetric NAT가 양쪽이면 STUN은 0%다 A 측 NAT B 측 NAT STUN만으로 P2P 가능? fallback 필요 Full Cone 아무거나 O — Restricted…
-
[Gemini] 2.0 Flash를 고른 이유 — 음성 상담의 응답 속도 vs 품질
결론 먼저 — 음성 상담에서 latency는 품질이다 축 Pro 계열 Flash 계열 응답 latency (체감) 높음 낮음 긴 문맥 (32k+) 추론 품질 우수 충분 function…
-
[음성 파이프라인] STT → LLM → TTS 전체 latency 분해 — 4구간 절단법
결론 먼저 — 음성 파이프라인 latency는 4구간으로 쪼개야 줄일 수 있다 구간 이름 대표 단축 전략 1 VAD → STT 종료 (사용자 발화 끝 인식)…
-
[WebRTC] 연결의 6단계 — Offer/Answer부터 ICE Connected까지
결론 먼저 — 단계별 실패 위치를 알면 디버깅이 빨라진다 단계 이름 대표 실패 원인 1 Signaling 채널 수립 WebSocket 인증/CORS/방화벽 2 SDP Offer/Answer 교환 codec…
-
[Pion] ForwardTrack 루프 — 미디어를 흘려보내는 가장 짧은 코드
결론 먼저 — 미디어 forward의 본질은 한 루프다 항목 값 핵심 코드 라인 수 ~10줄 Track 타입 TrackLocalStaticRTP 패킷 단위 RTP 패킷 (재인코딩 없음) 고루틴…
-
[설계 판단] 1:1 AI 음성 상담을 위해 SFU를 ‘Dumb Pipe’로 둔 이유
결론 먼저 — 1:1 음성 상담의 미디어 토폴로지 비교 토폴로지 서버 CPU 대역폭 지연 구현 복잡도 1:1 상담 적합성 P2P (Mesh) 0 매우 낮음 최저…
-
[어원] permanent — per(끝까지) + man(머무르다) + ent(~하는) = 영구적인
permanent 는 한국어 번역으로는 “영구적인” 한 줄이지만, storage 공식 문서 에서 만나 보면 결이 다르다 — PersistentDisk / persistent storage 가 permanent 와 같은 man-…
-
[문서 탐지] 시험지 OCR에서 TP/FP/FN 계산 기준 — 전체 객체 수 보존 관점
결론 — “전체 객체 수 보존”이 핵심 기준이다 시험지 OCR에서 TP/FP/FN을 계산할 때 가장 중요한 원칙은: “총합 문제 수가 일치되어야 정확하다” 부분 검출을 성공으로 인정하고,…