From 6806314208425dd21c2fedcd753d6dc5d5239b43 Mon Sep 17 00:00:00 2001
From: Concordia Contributor <concordia-team+github@google.com>
Date: Wed, 6 Dec 2023 05:49:07 -0800
Subject: [PATCH] Add a LanguageModel implementation that uses OpenAI api

PiperOrigin-RevId: 588395702
Change-Id: Iabce697a14c77168eba608769eeedaf69c408e64
---
 concordia/language_model/gpt_model.py | 115 ++++++++++++++++++++++++++
 setup.py                              |   1 +
 2 files changed, 116 insertions(+)
 create mode 100644 concordia/language_model/gpt_model.py

diff --git a/concordia/language_model/gpt_model.py b/concordia/language_model/gpt_model.py
new file mode 100644
index 00000000..3dfb5e9c
--- /dev/null
+++ b/concordia/language_model/gpt_model.py
@@ -0,0 +1,115 @@
+# Copyright 2023 DeepMind Technologies Limited.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     https://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""Language Model that uses OpenAI's GPT models."""
+
+from collections.abc import Collection, Sequence
+from concordia.language_model import language_model
+from concordia.utils import measurements as measurements_lib
+import openai
+from typing_extensions import override
+
+_MAX_MULTIPLE_CHOICE_ATTEMPTS = 3
+
+
+class GptLanguageModel(language_model.LanguageModel):
+  """Language Model that uses OpenAI GPT models."""
+
+  def __init__(
+      self,
+      api_key: str,
+      model_name: str,
+      measurements: measurements_lib.Measurements | None = None,
+      channel: str = language_model.DEFAULT_STATS_CHANNEL,
+  ):
+    """Initializes the instance.
+
+    Args:
+      api_key: The API key to use when accessing the OpenAI API.
+      model_name: The language model to use. For more details, see
+        https://platform.openai.com/docs/guides/text-generation/which-model-should-i-use.
+      measurements: The measurements object to log usage statistics to.
+      channel: The channel to write the statistics to.
+    """
+    self._api_key = api_key
+    self._model_name = model_name
+    self._measurements = measurements
+    self._channel = channel
+
+  @override
+  def sample_text(
+      self,
+      prompt: str,
+      *,
+      max_tokens: int = language_model.DEFAULT_MAX_TOKENS,
+      max_characters: int = language_model.DEFAULT_MAX_CHARACTERS,
+      terminators: Collection[str] = language_model.DEFAULT_TERMINATORS,
+      temperature: float = language_model.DEFAULT_TEMPERATURE,
+      timeout: float = language_model.DEFAULT_TIMEOUT_SECONDS,
+      seed: int | None = None,
+  ) -> str:
+    messages = [{'role': 'user', 'content': prompt}]
+    response = openai.ChatCompletion.create(
+        api_key=self._api_key,
+        model=self._model_name,
+        messages=messages,
+        temperature=temperature,
+        max_tokens=max_tokens,
+        timeout=timeout,
+        request_timeout=timeout,
+        stop=terminators,
+        seed=seed,
+    )
+    if self._measurements is not None:
+      self._measurements.publish_datum(
+          self._channel,
+          {'raw_text_length': len(response.choices[0].message.content)},
+      )
+    return response.choices[0].message.content
+
+  @override
+  def sample_choice(
+      self,
+      prompt: str,
+      responses: Sequence[str],
+      *,
+      seed: int | None = None,
+  ) -> tuple[int, str, dict[str, float]]:
+    max_characters = len(max(responses, key=len))
+
+    attempts = 1
+    for _ in range(_MAX_MULTIPLE_CHOICE_ATTEMPTS):
+      sample = self.sample_text(
+          prompt,
+          max_characters=max_characters,
+          temperature=0.0,
+          seed=seed,
+      )
+      try:
+        idx = responses.index(sample)
+      except ValueError:
+        attempts += 1
+        continue
+      else:
+        if self._measurements is not None:
+          self._measurements.publish_datum(
+              self._channel, {'choices_calls': attempts}
+          )
+        debug = {}
+        return idx, responses[idx], debug
+
+    raise language_model.InvalidResponseError(
+        'Too many multiple choice attempts.'
+    )
diff --git a/setup.py b/setup.py
index ea878912..7afa3802 100644
--- a/setup.py
+++ b/setup.py
@@ -58,6 +58,7 @@
         'ipython',
         'matplotlib',
         'numpy',
+        'openai',
         'pandas==1.5.3',
         'python-dateutil',
         'reactivex',