•
지난주 업무
◦
품 플랫폼 오프라인 교육 (화, 수)
◦
GPU 성능 및 파인튜닝 테스트 // A100 → 4시간 37분 / H100 → 5시간 10분
◦
학습시간 오래 걸리는 이슈 해결 (기존 5시간 10분→ 2시간 10분)
▪
연산 최적화 기술로 해결 (Flash Attention 2 + Packing) → 3시간 단축
→ 메모리 최적화하여 풀 파인튜닝 가능할 것으로 판단 (4B 이하 모델 기준)
◦
◦
품 플랫폼 활용 방안 및 장단점
▪
장점 - 고성능 GPU 할당, 워크플로우 설계 가능, 모델 배포 가능
▪
단점 - 백그라운드 실행 안됨, 가끔 인터넷 불안정하면 서버 연결 끊김
•
금주 업무
◦
선정된 모델 테스트 및 베이스 모델 채택
◦
첫 유저 AI 추천 루틴 [위클리]
▪
사용자 정보 기반 데이터 처리 (필요한 데이터 정리 및 json 형태로 변경)
▪
(기획 측면 완료 이후) → 데이터셋 구성 및 학습, 결과 평가 및 수정