Efficient Training of Language Models to Fill in the Middle (FIM)
발표자료
(발표)Efficient Training of Language Models to Fill in the Middle.pdf
느낀점
- 첫인상은 data augmentation 기법에 관련된 내용을 extensive하게 검증했다정도..?
- free-form generation을 하고 싶다에 초점을 두고 논문 전개
Note
- 50%란게 어떤걸까
- 데이터셋에서 FIM으로 transformation하는 비율 (FIM 자체는 랜덤하게 짜르니까)
- SPM에서 캐싱이 무슨 의미 일까