유대선

진행 중 · 2026년 5월 25일

Meta Smart Glass — English Assistant

워홀 한국인을 위한 실시간 영어 어시스턴트. Meta Ray-Ban Display 대상. iPhone 앱 + Bun 백엔드 + Gemini vision; Display SDK 접근 대기 중 Mock Device Kit으로 빌드.

역할
Solo
스택
Swift / iOS · Bun · Node.js · Gemini 2.5 Flash (vision) · BLE · Mock Device Kit

프로젝트 로그

이 프로젝트를 만들면서 남긴 트러블슈팅 · 회고 · 업데이트의 시간순 기록.

8 로그됨
마지막 업데이트: 2026년 5월 31일
필터
2026년 5월 25일 주8 · 1 업데이트 · 7 기술 회고
  1. Look: 보이는 사물을 영어로 — 실기기 아이폰에서 작동

    기술 회고

    2026년 5월 31일 · 3

    텍스트 번역에서 진짜 차별 기능으로 피벗 — 장면을 보면 각 사물의 영어 이름 + 한국어 뜻. Gemini 비전으로, 실기기 아이폰에서 end-to-end 작동.

  2. Phase 1 기능: /api/suggest end-to-end (GPT-4o-mini → Claude Haiku fallback)

    기술 회고

    2026년 5월 30일 · 3

    첫 실제 제품 기능 — 프로바이더 fallback이 있는 백엔드 영어 코칭 제안 엔드포인트 + 이를 구동하는 SwiftUI 클라이언트. API 키 경계 전까지 검증 완료.

  3. Gemini를 (무료) primary 프로바이더로 — 첫 실제 end-to-end 응답

    기술 회고

    2026년 5월 30일 · 2

    무료 티어 Gemini 프로바이더를 추가해 suggest/translate가 드디어 실제 출력. 함정은 Gemini 2.5 Flash의 기본 thinking이 토큰 예산을 먹은 것.

  4. Scan용 라이브 카메라 소스 — 그리고 Swift 6 strict concurrency 씨름

    기술 회고

    2026년 5월 30일 · 3

    Scan의 두 번째 소스로 라이브 AVFoundation 카메라 추가(PhotosPicker와 병행), 같은 OCR→번역 파이프라인에 연결. 진짜 일은 AVFoundation을 Swift 6 strict concurrency에서 컴파일시키는 거였음.

  5. Scan & Translate: Vision OCR → /api/translate, 그리고 메타 글래스 현실 점검

    기술 회고

    2026년 5월 30일 · 5

    두 번째 Phase 1 기능 — 메뉴/표지판 온디바이스 OCR → 한국어 번역 — 그리고 메타 글래스가 이걸 실제로 돌릴 수 있는지 알아본 결과.

  6. Phase 1 프로토타입 스캐폴드: Bun /health 백엔드 + SwiftUI mock 글래스 HUD

    기술 회고

    2026년 5월 28일 · 2

    첫 실제 스캐폴드 — /health만 노출하는 Bun 백엔드 + 그걸 폴링해서 mock 글래스 HUD로 그리는 SwiftUI 앱. LLM/STT/Vision과 Meta SDK는 계획으로만 잡혀 있고 아직 미배선.

  7. 리포지토리 초기화

    업데이트

    2026년 5월 26일 · 1

    첫 커밋 — repo는 README만 있는 상태로 시작, 진짜 Phase 1 스캐폴드는 이틀 뒤에 들어옴.

  8. 스택·범위 결정: Swift 네이티브, iOS 우선, 클라우드 LLM 우선

    기술 회고

    2026년 5월 25일 · 2

    스마트글래스 영어 어시스턴트의 기반 스택과 범위를 확정 — Swift 네이티브 iOS, 로컬보다 클라우드 LLM 우선, 하드웨어 구매 대신 Mock Device Kit.