Gemini API 가격 비용 python 코드 open ai 호환용

Gemini API: 가격, 모델, Python 사용 방법 및 OpenAI 호환성

Google의 Gemini API는 Google AI Studio와 Vertex AI를 통해 제공되는 강력한 생성 AI 모델입니다. 이 API를 사용하면 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 처리할 수 있습니다. 본 블로그에서는 Gemini API의 모델, 가격, Python을 사용한 사용 방법, 그리고 OpenAI와의 호환성에 대해 자세히 알아보겠습니다.

1. Gemini API 소개

Gemini API는 Google의 최신 AI 기술을 기반으로, 개발자들이 애플리케이션에 생성 AI 기능을 통합할 수 있도록 설계된 도구입니다. Google AI Studio를 통해 간단한 API 키로 접근하거나, Vertex AI를 통해 프로덕션 환경에서 사용할 수 있습니다. 텍스트 생성, 이미지 분석, 비디오 요약 등 다양한 작업을 수행할 수 있으며, OpenAI의 API와 유사한 방식으로 호출할 수 있는 호환성 옵션을 제공하여 기존 OpenAI 사용자들이 쉽게 전환할 수 있습니다.

Gemini API는 두 가지 주요 접근 방식을 지원합니다:

Google AI Studio: 프로토타이핑을 위한 간단한 API 키 기반 접근.
Vertex AI: 프로덕션 환경을 위한 Google Cloud 인증 기반 접근.

본 블로그에서는 Google AI Studio를 중심으로 OpenAI 호환성을 다룹니다.

2. Gemini API 모델

Gemini API는 다양한 용도에 맞게 설계된 여러 모델을 제공합니다. 아래는 주요 모델과 그 특징입니다:

모델 이름	설명
Gemini 2.5 Pro	가장 진보된 추론 모델으로, 복잡한 작업에 적합
Gemini 2.0 Flash	최신 멀티모달 모델로, 차세대 기능과 향상된 성능 제공
Gemini 2.0 Flash-Lite	비용 효율성과 저지연성을 위해 최적화된 모델
Gemini 1.5 Pro	고성능 멀티모달 작업에 적합
Gemini 1.5 Flash	빠른 처리 속도가 필요한 작업에 적합
Gemini 1.0 Pro	기본적인 생성 작업에 적합한 초기 모델

각 모델은 지원하는 언어와 입력 유형(텍스트, 이미지, 오디오, 비디오 등)이 다르며, 자세한 정보는 공식 모델 문서에서 확인할 수 있습니다. 예를 들어, Gemini 2.0 Flash와 Gemini 1.5 Pro는 100개 이상의 언어를 지원하며, 멀티모달 입력을 처리할 수 있습니다.

3. 가격

Gemini API의 가격은 모델, 입력/출력 유형, 토큰 수에 따라 달라집니다. 아래는 주요 모델의 가격 예시입니다:

모델	유형	가격 (USD, 100만 토큰당)
Gemini 2.5 Pro	텍스트 입력 (≤200K 토큰)	$1.25
	텍스트 출력 (≤200K 토큰)	$10
Gemini 2.0 Flash	텍스트 입력	$0.15
	텍스트 출력	$0.60
Gemini 1.5 Pro	텍스트 입력 (≤128K 토큰)	$0.0003125/1k 문자
	텍스트 출력 (≤128K 토큰)	$0.00125/1k 문자

참고사항:

PDF는 이미지 입력으로 청구되며, 1페이지=1이미지로 계산됩니다.
Google Search 기반 그라운딩은 웹 URL이 포함된 요청에 대해 추가 요금이 부과됩니다.
배치 처리 시 50% 할인이 적용됩니다.

가격은 사용량과 지역에 따라 달라질 수 있으므로, 최신 정보는 Vertex AI 가격 페이지에서 확인하세요. 또한, Count Tokens API를 사용해 요청의 토큰 수를 추정할 수 있습니다.

4. Python을 사용한 Gemini API 사용 (OpenAI 라이브러리 호환성)

Google AI Studio를 통해 Gemini API를 호출할 때, OpenAI 라이브러리를 사용하면 OpenAI API와 유사한 인터페이스로 Gemini 모델을 쉽게 활용할 수 있습니다. 이는 기존 OpenAI 코드를 재사용하거나 마이그레이션하려는 개발자에게 특히 유용합니다.

설치

필요한 라이브러리를 설치합니다:

pip install openai

Gemini API 키 발급 방법

Google AI Studio에서 API 키를 생성합니다.
환경 변수로 설정합니다 (Linux/macOS):

텍스트 입력 예제

아래 코드는 Google AI Studio의 Gemini API를 OpenAI 라이브러리로 호출하는 예제입니다:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",  # GEMINI_API_KEY
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = client.chat.completions.create(
    model="gemini-2.0-flash",
    n=1,
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "인공지능은 어떻게 작동하나요?"}
    ]
)

print(response.choices[0].message.content)

멀티모달 입력 예제

Gemini API는 이미지와 같은 멀티모달 입력도 지원합니다. 아래는 텍스트와 이미지를 함께 처리하는 예제입니다:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",  # GEMINI_API_KEY
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = client.chat.completions.create(
    model="gemini-2.0-flash",
    n=1,
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "이 이미지에 무엇이 보이나요?"},
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/image.jpg"}
                }
            ]
        }
    ]
)

print(response.choices[0].message.content)

스트리밍 예제

실시간 응답을 받으려면 stream=True를 추가합니다:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",  # GEMINI_API_KEY
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = client.chat.completions.create(
    model="gemini-2.0-flash",
    n=1,
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "하늘이 왜 파란가요?"}
    ],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

지원되는 매개변수:

messages: 시스템, 사용자(텍스트, 이미지 URL), 어시스턴트 등
model, max_tokens, temperature, top_p, stop 등
n: 응답 수
자세한 매개변수는 Google AI Studio 문서를 참조하세요.

참고사항:

API 키는 소스 코드에 직접 포함시키지 말고, 환경 변수로 관리하세요.
Google AI Studio는 프로토타이핑용으로 적합하며, 프로덕션 환경에서는 Vertex AI를 권장합니다.
이미지 입력은 URL 또는 Base64 인코딩된 데이터를 지원합니다.

5. 결론

Gemini API는 강력한 생성 AI 기능을 제공하며, Python을 통해 쉽게 접근할 수 있습니다. OpenAI 라이브러리를 사용하면 Google AI Studio의 Gemini 모델을 OpenAI API와 유사한 방식으로 호출할 수 있어, 기존 OpenAI 코드를 재사용하거나 마이그레이션하기에 이상적입니다. 가격과 모델에 대한 최신 정보는 Vertex AI 문서와 Google AI Studio를 참고하세요.

개발자는 Google AI Studio로 빠르게 프로토타입을 만들거나, Vertex AI로 안정적인 프로덕션 환경을 구축할 수 있습니다. OpenAI 호환성은 특히 기존 OpenAI 사용자에게 매력적인 옵션으로, 코드 마이그레이션을 간소화합니다.

참고 문헌:

Gemini API: 가격, 모델, Python 사용 방법 및 OpenAI 호환성

1. Gemini API 소개

2. Gemini API 모델

3. 가격

4. Python을 사용한 Gemini API 사용 (OpenAI 라이브러리 호환성)

설치

Gemini API 키 발급 방법

텍스트 입력 예제

멀티모달 입력 예제

스트리밍 예제

5. 결론

답글 남기기 응답 취소

Related Posts

채용관리 솔루션 그리팅 만든 이야기 정리

일론머스크 Zip2 그의 첫 사업 분석(3,000억 엑싯했다고?)

Stitch 구글이 만든 AI기반 UI 디자인 서비스