Daniel

•

지난주 업무 

◦

품 플랫폼 오프라인 교육 (화, 수)

◦

GPU 성능 및 파인튜닝 테스트 // A100 → 4시간 37분 / H100 → 5시간 10분

◦

학습시간 오래 걸리는 이슈 해결 (기존 5시간 10분→ 2시간 10분)

▪

연산 최적화 기술로 해결 (Flash Attention 2 + Packing) → 3시간 단축

→ 메모리 최적화하여 풀 파인튜닝 가능할 것으로 판단 (4B 이하 모델 기준)

◦

모델 선정 비교 공유 → 오픈 LLM 비교9.47 KB (후보 3개 선정)

◦

품 플랫폼 활용 방안 및 장단점

▪

장점 - 고성능 GPU 할당, 워크플로우 설계 가능, 모델 배포 가능

▪

단점 - 백그라운드 실행 안됨, 가끔 인터넷 불안정하면 서버 연결 끊김

•

금주 업무

◦

선정된 모델 테스트 및 베이스 모델 채택

◦

첫 유저 AI 추천 루틴 [위클리]

▪

사용자 정보 기반 데이터 처리 (필요한 데이터 정리 및 json 형태로 변경)

▪

(기획 측면 완료 이후) → 데이터셋 구성 및 학습, 결과 평가 및 수정