
Azure OpenAI 서비스는 GPT-4, GPT-3.5-Turbo 및 Embeddings 모델 시리즈를 포함하여 OpenAI의 강력한 언어 모델에 대한 REST API 액세스를 제공합니다.
해당 서비스를 이용하여 사내용 통합 GPT 환경을 구축, 데이터 인사이트, 마케팅 인텔리전스, 문서 요약 등 데이터 분석과 뛰어난 자연어 처리 능력을 바탕으로 업무 지원 및 효율성을 증가시킬 수 있습니다.
Azure OpenAI 서비스를 이용하기 위해서는 우선 액세스 요청을 해야합니다.
Azure OpenAI Studio - Microsoft Azure
oai.azure.com
해당 Potal에 접속하여 요청 폼을 작성하고 (Subscription ID가 필요하니 혹시 없다면 Azuer Potal 에서 구독을 생성해야 함) 신청하면 10영업일 이내에 확인 메일을 수신할 수 있다.
리소스 사용 확인 메일을 수신하면 위 OpenAI Studio에서 리소스 만들기를 통해 서비스를 생성할 수 있다.
리소스 생성 후 배포할 수 있는 모델과 모델 별 과금 정책은 아래와 같다.
언어 모델
모델 | 컨텍스트 | 질문(토큰 1,000개당) | 답변(토큰 1,000개당) |
GPT-3.5-Turbo | 4K | $0.0015 | $0.002 |
GPT-3.5-Turbo | 16K | $0.003 | $0.004 |
GPT-4 | 8K | $0.03 | $0.06 |
GPT-4 | 32K | $0.06 | $0.12 |
GPT-4 모델
GPT-4는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있습니다.
GPT-3.5 Turbo와 마찬가지로 GPT-4는 채팅에 최적화되어 있고 기존 완료 작업에 적합합니다.
GPT-4를 사용하려면 채팅 Completions API를 사용합니다.
Model ID | 최대 요청(토큰) | 학습 데이터(최대) |
gpt-4 (0314) | 8,192 | 2021년 9월 |
gpt-4-32k (0314) | 32,768 | 2021년 9월 |
gpt-4 (0613) | 8,192 | 2021년 9월 |
gpt-4-32k (0613) | 32,768 | 2021년 9월 |
가용성 | gpt-4 (0314) | gpt-4 (0613) |
Azure OpenAI 액세스를 사용하여 모든 구독에서 사용 가능 | 캐나다 동부 프랑스 중부 스웨덴 중부 스위스 북부 |
|
지역의 모델 버전에 대한 현재 액세스 권한이 있는 구독에서 사용 가능 | 미국 동부 프랑스 중부 미국 중남부 영국 남부 |
오스트레일리아 동부 미국 동부 미국 동부 2 일본 동부 영국 남부 |
GPT-3.5 모델
GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다.
GPT-3.5 제품군에서 가장 유능하고 비용 효율적인 모델은 GPT-3.5 Turbo로, 이는 채팅에 최적화되었으며 기존 답변 작업에도 잘 작동합니다.
GPT-3.5 Turbo는 채팅 답변 API에서 사용할 수 있으며, GPT-3.5 모델 보다 GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 사용하는 것이 좋습니다.
Model ID | 가용성 | 최대 요청(토큰) | 학습 데이터(최대) |
gpt-35-turbo1(0301) | 미국 동부 프랑스 중부 미국 중남부 영국 남부 서유럽 |
4,096 | 2021년 9월 |
gpt-35-turbo(0613) | 오스트레일리아 동부 캐나다 동부 미국 동부 미국 동부 2 프랑스 중부 일본 동부 미국 중북부 스웨덴 중부 스위스 북부 영국 남부 |
4,096 | 2021년 9월 |
gpt-35-turbo-16k(0613) | 오스트레일리아 동부 캐나다 동부 미국 동부 미국 동부 2 프랑스 중부 일본 동부 미국 중북부 스웨덴 중부 스위스 북부 영국 남부 |
16,384 | 2021년 9월 |
gpt-35-turbo-instruct(0914) | 미국 동부 스웨덴 중부 |
4,097 | 2021년 9월 |
기본 모델
모델 | 토큰 1,000개당 사용량 |
Babbage-002 | $0.0004 |
Davinci-002 | $0.002 |
튜닝 모델
모델 | 가용성 | 컴퓨팅 시간당 학습 | 시간당 호스팅 | 질문(토큰 1,000개당) | 답변(토큰 1,000개당) |
Babbage-002 | 미국 중북부 스웨덴 중부 |
$34 | $1.70 | $0.0004 | $0.0004 |
Davinci-002 | 미국 중북부 스웨덴 중부 |
$68 | $3 | $0.002 | $0.002 |
GPT-3.5-Turbo | 미국 중북부 스웨덴 중부 |
$102 | $7 | $0.0015 | $0.002 |
이미지 모델
모델 | 가용성 | 최대 요청(문자) | 이미지 100개당 사용량 |
Dall-E | 미국 동부 | 1,000 | $2 |
음성 모델
모델 | 가용성 | 최대 요청 (파일 크기) | 시간당 |
Whisper | 미국 중북부 서유럽 |
25MB | $0.36 |
'Cloud > Azure' 카테고리의 다른 글
AKS - Azure Kubernetes Service (0) | 2023.11.21 |
---|---|
Azure - 가용성 집합 (Availability Set) (0) | 2023.11.17 |