진행 중 · 2026년 5월 23일

Mimi

YouTube 영상 아무거나 간격반복 영어 쉐도잉으로 바꾸고, 저절로는 안 나오는 문장 패턴·콜로케이션·전치사를 매일 드릴로 굳히는 풀스택 영어 학습 앱. Java/Spring + Next.js, 1인 개발.

8,892 LOC · 49 endpoints · 121 tests · multi-tenant · AWS ECS Fargate

사이트 보기 ↗GitHub ↗아키텍처 →전체 README →English version →

역할: Solo (Claude Code 페어 프로그래밍)
스택: Java 21 · Spring Boot 3.3 · PostgreSQL 16 · Next.js 16 · TypeScript · Gemini / Claude · AWS ECS

영어 문서는 하루 종일 읽는데 막상 말하거나 쓰려면 굳는 개발자를 위한 풀스택 영어 학습 앱. Java 21 / Spring Boot API + Next.js / TypeScript 프론트엔드, 현재 iOS App Store에 Mimi — English Shadowing으로 출시되어 있다. 핵심은 기능 수가 아니라 마찰 제거 — 이미 소비하는 입력(YouTube)을 피하던 출력 연습으로 바꾼다.

서로 먹여주는 두 반쪽

YouTube 쉐도잉. URL 붙여넣고 자막 구간을 클립하면, LLM 한 번 호출로 번역 + 직독직해(단어별) + 어휘 + 전치사별 노트 + 연습 시나리오가 돌아와 Postgres JSONB에 캐싱 — 공부할 때마다 API 재과금 없음. SM-2 간격반복이 클립마다 일정을 잡고, 복습은 reveal / write(토큰 단위 diff) / scenario 모드.
Practice hub. 매일 Leitner 간격 드릴 — 문장 패턴 82개, 단어+전치사 콜로케이션 101개, 애니메이션 전치사 다이어그램, AI 작문 첨삭, 그리고 본인 오답 데이터로 만든 약점 대시보드.

엔지니어링 하이라이트

트랜잭션 안전 비동기 AI 파이프라인. 클립 생성이 도메인 이벤트를 발행하고, 분석은 @TransactionalEventListener(AFTER_COMMIT) + @Async로 백그라운드 스레드에서 — 수 초짜리 LLM 호출이 DB 트랜잭션 바깥에서 돌아 커넥션 풀을 붙들지 않음. 트랜잭션은 PENDING → READY / FAILED라는 작은 쓰기뿐. 일시적 실패(429 / 5xx / timeout)는 재시도, 영구 실패는 빠르게 실패.
환경변수로 갈리는 가장자리. 같은 코드가 로컬에서도 실서버에서도 돌고 env var 하나로 전환 — AI 프로바이더(Gemini ↔ Claude)는 @ConditionalOnProperty로 호출부 변경 0, 녹음 저장(로컬 디스크 ↔ S3 / R2)도 같은 방식, 바이트는 항상 백엔드를 통해 스트림(공개 URL 아님).
채점 모양에 맞춘 SRS 2개. 클립 복습은 SM-2(4단계), 이진 드릴(알았음 / 다시)은 Leitner 박스 — 2개 버튼에 SM-2의 0~5 스케일을 욱여넣는 건 틀린 도구라서. 둘 다 I/O 없는 순수 함수.
한계비용 $0 + 남용 방지. 클립당 LLM 호출 1회, 캐싱. 돈 드는 유일한 엔드포인트(AI 작문 첨삭)는 사용자별 rate-limit, 가입/로그인의 IP별 limiter와 분리.
멀티테넌트 안전. stateless JWT에 token-version 클레임(비번 변경 시 이전 토큰 폐기), 쿼리 레벨 사용자 격리(findByIdAndUserId — 남의 id는 404), BCrypt, 접근 제어된 녹음.

스택 & 인프라

Java 21 · Spring Boot 3.3 · PostgreSQL 16(Flyway, JSONB, raw-SQL CHECK) · Next.js 16 / React 19 / TypeScript strict · Tailwind 4 · shadcn/ui. 관측성: Micrometer + Actuator → Prometheus, MDC 요청/사용자 로깅. Docker(멀티스테이지, ffmpeg + yt-dlp); GitHub Actions CI; AWS ECS Fargate + RDS로 keyless OIDC 배포; 프론트는 Vercel. Testcontainers(실제 Postgres) + Vitest + Playwright(14 spec).

아직 안 하는 것

1인, AI 보조 — 제품 방향, 아키텍처(프로바이더 추상화, 트랜잭션 안전 비동기 파이프라인, SRS 2분할), 프롬프트 설계, 콘텐츠 정확도 감수는 내가; Claude Code가 페어.
rate-limit과 idempotency가 인메모리 — 단일 인스턴스엔 맞지만 다중 인스턴스는 durable 저장소(Redis) 필요.
ja / zh / es는 스캐폴딩만(영문 문자열), en·ko만 완역.
AWS 인프라는 문서화된 런북 + task definition이지 아직 Terraform 아님.
자막 추출에 yt-dlp 사용 — YouTube ToS 회색지대라 개인용은 괜찮지만 상업 전엔 재검토.

프로젝트 로그

이 프로젝트를 만들면서 남긴 트러블슈팅 · 회고 · 업데이트의 시간순 기록.

28 로그됨

마지막 업데이트: 2026년 7월 20일

필터

2026년 7월 20일 주2 개 · 2 기술 회고

2026년 7월 13일 주16 개 · 5 업데이트 · 2 트러블슈팅 · 3 기술 회고 · 6 사용성 회고

2026년 7월 6일 주2 개 · 1 업데이트 · 1 사용성 회고

2026년 6월 1일 주8 개 · 6 기술 회고 · 2 사용성 회고

Mimi

서로 먹여주는 두 반쪽

엔지니어링 하이라이트

스택 & 인프라

아직 안 하는 것

프로젝트 로그

PAY-1 — free/pro 한 칸을 capability 테이블로 교체하고 AI 비용 구멍을 막다

PAY-2 — RevenueCat 연동에서 적대 리뷰가 진짜 경쟁 조건과 보안 오탐지를 잡다

AI 스파링을 앱의 중심으로 — 독립 중앙 탭 승격 (R2)

U1 mastery 데이터 레이어와 스파링 리포트 클라이언트

U3 세션 goal-gradient와 peak-end

U4 팩별 진행과 조용한 마일스톤

공용 API 요청에 15초 deadline 추가

신규 사용자를 무료 학습 루프로 안내

모바일 저장 실패를 보이게 — 카드 진행 전에 서버 응답 기다리기

모바일 다크 입력창과 눌림 피드백 — 터치가 보이게

R3 Home 우선순위와 Practice 팩 그리드

R1 의미 토큰과 공용 Pressable 기반

Review·Me·drill 채점 표면을 공용 토큰으로 통일

저장 세션을 네이티브 splash 아래에서 조용히 검증

스파링 연결에 끝을 만들다 — 12초 상한, 취소, 복구 문구

AI 403을 초대제 안내와 무료 연습 복귀로 바꾸기

스파링에 신규 학습 표현 모드 — 낮은 box부터 입으로 꺼내기

기본 동사 스파링을 한 축으로 — 동사별·파티클·전치사별 하위 범위

대화가 어색한 이유 — AI에게 '목록 다 쓰지 마라'를 가르치다

주제 골라 스파링 — 팩 하나로 대화를 한 결로 묶기 (③)

모바일 사용성 갈아엎기 — 영상을 버리지 않고 '내 영상'으로 쌓는 TubeShad식 플로우

자막 캐시를 1000만 명 규모로 — 전역 공유 캐시의 두 빈틈(경합 insert + 무한 재긁기)

쉐도잉 루프 고도화 — 한 줄 반복 / A-B 구간 / 자동 다음 줄을 폴링 하나로

우리가 서울에 올린 AWS 49개 — 실제 배포된 리소스 전체 딥 정리

YouTube 자막 가져오기 7가지 방안 — 하나도 모르는 사람을 위한 딥 해설

YouTube 자막 — 검증된 방법 랭킹 + 폴백 런북 (이게 깨지면 어디로 가나)

YouTube 자막의 진짜 벽은 IP가 아니라 POToken이었다 — 그리고 WebView 우회

YouTube 자막을 어디서 가져올 것인가 — 서버 vs 클라이언트, 웹 vs 모바일 (CORS의 벽)