<aside>
👋 5년 차 머신러닝 엔지니어 문형민입니다.
컴퓨터비전, sLLM, 경량 모델 개발에 전문 기술을 보유하고 있습니다.
빠른 러닝커브를 가지고 주도적인 개발을 합니다.
</aside>
연락처
📧 [email protected]
📑 포트폴리오 →
🔗 LinkedIn →
👾 GitHub →
경력
머신러닝 엔지니어 (LLM)
ADOS*, 서울시 송파구*
2023년 08월 - 현재
<aside>
💡 메인프로젝트 포트폴리오 →
</aside>
- LLM 학습, 배포 End to End 파이프라인 구성
- DeepSpeed, QLoRA 를 결합하여 A100 x8 클러스터에서 학습
- GPTQ 양자화, vllm 을 결합하여 추론 메모리 및 속도 최적화
- 데이터 중심 파인튜닝
- 다양한 추론문제를 정의하여 800만 대화 데이터 수집
- 데이터 품질 개선 및 중복제거 알고리즘 개발
- 두 단계의 SFT와 한 단계의 DPO로 나누어 학습
- RAG(Retrieval-Augmented Generation)
- 검색엔진과 pdf 리더기, 벡터스토어를 연동한 RAG 기술 구현
- 한국어 LLM리더보드 8위 달성(2024년 2월)
머신러닝 엔지니어 (이상징후 탐지)
ADOS*, 서울시 송파구*
2022년 05월 - 현재
<aside>
💡 메인프로젝트 포트폴리오 →
</aside>
- ‘높은 보안이 요구되는 업무공간에서 발생하는 보안위협을 감지하라’ 는 주제를 풀 수 있는 작은 문제로 쪼개어 풀어냄.
- 온디바이스 실시간 얼굴인식 기술
- DeepSort 트래킹 알고리즘을 사용하여 비용이 큰 얼굴인식 동작 빈도 최소화하여 CPU 및 메모리 사용량을 90% 이상 감소
- 안면 밝기 정규화, 안티스푸핑 개발
- 온디바이스 실시간 보안위협 감지 기술
- 오픈 데이터셋 + 웹캠 데이터를 리밸런싱하여 데이터셋 제작
- 비디오 Label을 최소화 하기 위해 Semi-Supervised Learning을 적용
- Sliding Window(Hidden State)를 활용하여 실시간 감지
- CPU에서 실시간 동작 가능하며, 메모리 사용량 70% 감소
- 데이터 로그화 & 시각화
- ELK 스택을 활용하여 감지 데이터 로그화 및 시각화
- 로그 데이터로부터 위협이 될 사용자를 사전에 감지하여 문제를 예방하는 것이 목표
Project Manager
ADOS*, 서울시 송파구*
2023년 08월 - 현재
- 이상징후 탐지 로그 수집 및 분석, 관리자 대시보드, 정책 설정, 윈도우 클라이언트 등
- LLM 데모 페이지 TF팀 리드, 1개월 내에 완성
머신러닝 엔지니어 (Vision, System)
비타소프트*, 서울시 구로구*
2021년 9월 - 2022년 04월
<aside>
💡 프로젝트설명 →
</aside>
- (GAN) 광고영상을 N컷만화로 변환하는 프로젝트에서 영상→스케치 변환 담당.
- (Torchserve, k8s) 분산 학습 및 추론을 할 수 있는 시스템 제작.