📋 뉴스 브리핑

AI 모델 학습에 필요한 데이터셋 구축 비용이 최근 급격히 상승하고 있으며, 500만 달러에서 최대 2억 5천만 달러까지 이를 수 있다는 분석이 나왔습니다. 이는 특히 대규모 언어 모델(LLM) 및 이미지 생성 AI의 등장으로 고품질 데이터에 대한 수요가 폭증했기 때문입니다. 데이터의 양뿐만 아니라, 데이터를 정제하고 라벨링하며 특정 목적에 맞게 특수화하는 과정에서 막대한 비용이 발생합니다. GPT-3와 같은 초기 모델 학습에도 수백만 달러가 소요되었으며, 향후 AI 모델의 복잡성과 규모가 더욱 커짐에 따라 이러한 비용은 계속해서 상승할 것으로 예상됩니다. 이에 따라 AI 개발에서 데이터 수집 및 준비 단계는 가장 시간과 비용이 많이 드는 과정으로 자리 잡고 있습니다.

원문 (English)

The price of AI training data, from $5M to $250M