AI

챗GPT같은 초거대언어모델(LLM) 로컬 구축 방안과 활용안을 제언드리고자 합니다.

담락 이승훈 실장 2023. 3. 30. 16:43

최근 폭발적인 이슈가 되고 있는 챗GPT와 BARD는 AI업계에서 말하는 초거대언어 모델(Large Language Model)이라고 일컫는 AI 모델으로서 그 시작은 구글의 Transformer 라는 알고리즘으로부터 촉발되어 이제는 거의 모든 글로벌 AI업계가 활용하는 AI서비스의 기초가 되고 있습니다.

그러나, 한 가지 아쉬운 점은 대부분의 서비스가 클라우드 기반으로 인터넷 접속이 가능해야 활용이 가능하며 더군다나 나만의 데이터셋이나 문서를 해당 서비스 업체로 보내야 하기 때문에 여러가지 보안상, 절차상, 비용상의 문제가 되고 있습니다.

 

이에 귀 기관에서 온프레미스, 즉 로컬로 초거대언어모델(LLM)을 구축하고 활용하실 수 있도록 몇 가지 안을 제시하여 드리고자 합니다.

 

1. ChatGPT API 사용 (GPT3는 fine-tuning 가능)

2. 특정 BERT모델 기반 fine-tuning (기존에 많이 적용된 방식)

3. ChatGPT 방식의 오픈소스 사용 (최신 방식)

 

LLM을 3번의 방식으로 구축하려는 경향이 많으며 전체 개발 일정은 대체적으로 데이터 수집 및 전 처리에 3달, 학습 및 검증에 3개월 (학습 당 ~2일), 웹 서비스 개발 (추론) 1개월 등으로 6-7개월 시간이 소요되며 저희는 비상주 형태로 구축 서비스를 제공하고 있습니다.

 

그리고, 해당 제언 자료는 별도 아래 메일로 요청하시면 보내드리도록 하겠습니다.

 

추가로 혹시 사전 지원 사항이나 내부 세미나 및 브레인 스토밍 미팅이 필요하시면 언제든지 연락 주시면 감사하겠습니다.바쁘신 와중에도 관심에 항상 감사 드리 오며 금주도 평안한 시간 되십시오.

(주)코세나 마케팅팀 드림

문의처 : 코세나(kosena) 이승훈 실장, 010-9338-6400, admin@kosena.kr, kosena21@naver.com