Remote models

`labridge.models.remote.remote_models` ¶

`labridge.models.remote.remote_models.AsyncModelClient` ¶

Bases: object

This is an asynchronous client to communicate with a LLM deployed on a server through HTTP.

PARAMETER	DESCRIPTION
`base_url`	The base URL of the server. TYPE: `URL`
`model_type`	LLM or Embed. TYPE: `RemoteModelType`
`timeout`	The timeout of a request. TYPE: `Timeout` DEFAULT: `None`
`limits`	The limits configuration to use. TYPE: `Limits` DEFAULT: `None`

Source code in labridge\models\remote\remote_models.py

class AsyncModelClient(object):
	r"""
	This is an asynchronous client to communicate with a LLM deployed on a server through HTTP.

	Args:
		base_url (URL): The base URL of the server.
		model_type (RemoteModelType): LLM or Embed.
		timeout (Timeout): The timeout of a request.
		limits (Limits): The limits configuration to use.
	"""
	def __init__(
		self,
		model_type: RemoteModelType,
		timeout: Timeout = None,
		limits: Limits = None,
	):
		self._model_type = model_type
		self._timeout = timeout or DEFAULT_LLM_TIMEOUT
		self._limits = limits or DEFAULT_LLM_LIMITS
		self._client = httpx.AsyncClient(
			timeout=self._timeout,
			limits=self._limits,
		)

	def formatted_input(self, input_str: str) -> dict:
		r""" Pack the query string in a JSON format to send to the server. """
		return {
			"text": input_str,
		}

	async def arequest(self, url: URL, input_str: str):
		r"""
		Asynchronous version.

		Send the query string to the server's model and get the results.

		Args:
			url (URL): The server's serve URL.
			input_str (str): The query string.

		Returns:
			Union[str, List[float]]: The results of a remote LLM or remote embedding model.
		"""
		query = self.formatted_input(input_str=input_str)

		response = await self._client.send(
			request=Request(
				method="post",
				url=url,
				json=query
			)
		)
		output_dict = json.loads(response.text)
		output = output_dict["output"]
		return output

`labridge.models.remote.remote_models.AsyncModelClient.arequest(url, input_str)` `async` ¶

Asynchronous version.

Send the query string to the server's model and get the results.

PARAMETER	DESCRIPTION
`url`	The server's serve URL. TYPE: `URL`
`input_str`	The query string. TYPE: `str`

RETURNS	DESCRIPTION
	Union[str, List[float]]: The results of a remote LLM or remote embedding model.

Source code in labridge\models\remote\remote_models.py

async def arequest(self, url: URL, input_str: str):
	r"""
	Asynchronous version.

	Send the query string to the server's model and get the results.

	Args:
		url (URL): The server's serve URL.
		input_str (str): The query string.

	Returns:
		Union[str, List[float]]: The results of a remote LLM or remote embedding model.
	"""
	query = self.formatted_input(input_str=input_str)

	response = await self._client.send(
		request=Request(
			method="post",
			url=url,
			json=query
		)
	)
	output_dict = json.loads(response.text)
	output = output_dict["output"]
	return output

`labridge.models.remote.remote_models.AsyncModelClient.formatted_input(input_str)` ¶

Pack the query string in a JSON format to send to the server.

Source code in labridge\models\remote\remote_models.py

def formatted_input(self, input_str: str) -> dict:
	r""" Pack the query string in a JSON format to send to the server. """
	return {
		"text": input_str,
	}

`labridge.models.remote.remote_models.ModelClient` ¶

Bases: object

This is a client to communicate with a LLM deployed on a server through HTTP.

PARAMETER	DESCRIPTION
`base_url`	The base URL of the server. TYPE: `URL`
`model_type`	LLM or Embed. TYPE: `RemoteModelType`
`timeout`	The timeout of a request. TYPE: `Timeout` DEFAULT: `None`
`limits`	The limits configuration to use. TYPE: `Limits` DEFAULT: `None`

Source code in labridge\models\remote\remote_models.py

class ModelClient(object):
	r"""
	This is a client to communicate with a LLM deployed on a server through HTTP.

	Args:
		base_url (URL): The base URL of the server.
		model_type (RemoteModelType): LLM or Embed.
		timeout (Timeout): The timeout of a request.
		limits (Limits): The limits configuration to use.
	"""
	def __init__(
		self,
		base_url: URL,
		model_type: RemoteModelType,
		timeout: Timeout = None,
		limits: Limits = None,
	):
		self._model_type = model_type
		self._timeout = timeout or DEFAULT_LLM_TIMEOUT
		self._limits = limits or DEFAULT_LLM_LIMITS
		self._client = httpx.Client(
			base_url=base_url,
			timeout=self._timeout,
			limits=self._limits,
		)

	def formatted_input(self, input_str: str) -> dict:
		r""" Pack the query string in a JSON format to send to the server. """
		return {
			"text": input_str,
		}

	def request(self, url: URL, input_str: str) -> Union[str, List[float]]:
		r"""
		Send the query string to the server's model and get the results.

		Args:
			url (URL): The server's serve URL.
			input_str (str): The query string.

		Returns:
			Union[str, List[float]]: The results of a remote LLM or remote embedding model.
		"""
		query = self.formatted_input(input_str=input_str)

		response = self._client.send(
			request=Request(
				method="post",
				url=url,
				json=query
			)
		)
		output_dict = json.loads(response.text)
		output = output_dict["output"]
		return output

`labridge.models.remote.remote_models.ModelClient.formatted_input(input_str)` ¶

Pack the query string in a JSON format to send to the server.

Source code in labridge\models\remote\remote_models.py

def formatted_input(self, input_str: str) -> dict:
	r""" Pack the query string in a JSON format to send to the server. """
	return {
		"text": input_str,
	}

`labridge.models.remote.remote_models.ModelClient.request(url, input_str)` ¶

Send the query string to the server's model and get the results.

PARAMETER	DESCRIPTION
`url`	The server's serve URL. TYPE: `URL`
`input_str`	The query string. TYPE: `str`

RETURNS	DESCRIPTION
`Union[str, List[float]]`	Union[str, List[float]]: The results of a remote LLM or remote embedding model.

Source code in labridge\models\remote\remote_models.py

def request(self, url: URL, input_str: str) -> Union[str, List[float]]:
	r"""
	Send the query string to the server's model and get the results.

	Args:
		url (URL): The server's serve URL.
		input_str (str): The query string.

	Returns:
		Union[str, List[float]]: The results of a remote LLM or remote embedding model.
	"""
	query = self.formatted_input(input_str=input_str)

	response = self._client.send(
		request=Request(
			method="post",
			url=url,
			json=query
		)
	)
	output_dict = json.loads(response.text)
	output = output_dict["output"]
	return output

`labridge.models.remote.remote_models.RemoteLLM` ¶

Bases: CustomLLM

A remote LLM deployed on the server.

ATTRIBUTE	DESCRIPTION
`context_window`	The maximum number of tokens available for input. TYPE: `int`
`num_output`	The maximum number of tokens to generate. TYPE: `int`
`model_name`	The model name to use from HuggingFace or local model directory. TYPE: `str`
`is_chat_model`	is a chat model or not. TYPE: `bool`
`base_url`	The base URL of the server. TYPE: `str`
`llm_url`	Server's URL for receiving local inputs. TYPE: `str`
`async_llm_url`	Server's URL for asynchronously receiving local inputs. TYPE: `str`
`_client`	The local client. TYPE: `ModelClient`
`_async_client`	The asynchronous local client. TYPE: `AsyncModelClient`

Source code in labridge\models\remote\remote_models.py

class RemoteLLM(CustomLLM):
	r"""
	A remote LLM deployed on the server.

	Attributes:
		context_window (int): The maximum number of tokens available for input.
		num_output (int): The maximum number of tokens to generate.
		model_name (str): The model name to use from HuggingFace or local model directory.
		is_chat_model (bool): is a chat model or not.
		base_url (str): The base URL of the server.
		llm_url (str): Server's URL for receiving local inputs.
		async_llm_url (str): Server's URL for asynchronously receiving local inputs.
		_client (ModelClient): The local client.
		_async_client (AsyncModelClient): The asynchronous local client.
	"""
	context_window: int = 16000 # useless
	num_output: int = 1024	# useless
	model_name: str = "remote"
	is_chat_model: bool = False

	base_url: str = Field(
		default=DEFAULT_BASE_URL,
		description="Base URL",
	)
	llm_url: str = Field(
		default=DEFAULT_LLM_URL,
		description="URL for receiving local inputs"
	)
	async_llm_url: str = Field(
		default=DEFAULT_ASYNC_LLM_URL,
		description="URL for asynchronously receiving local inputs"
	)

	_client: ModelClient = PrivateAttr()
	_async_client: AsyncModelClient = PrivateAttr()

	def __init__(
		self,
		base_url: str,
		llm_url: Optional[str] = None,
		async_llm_url: Optional[str] = None,
		context_window: int = 16000,
		num_output: int = 1024,
		model_name: str = "remote",
		is_chat_model: bool = False,

	):
		llm_url = llm_url or f"{base_url}/user_input"
		async_llm_url = async_llm_url or f"{base_url}/async_user_input"
		self._client = ModelClient(
			base_url=URL(base_url),
			model_type=RemoteModelType.LLM,
		)
		self._async_client = AsyncModelClient(
			model_type=RemoteModelType.LLM,
		)
		super().__init__(
			base_url=base_url,
			llm_url=llm_url,
			async_llm_url=async_llm_url,
			context_window=context_window,
			num_output=num_output,
			model_name=model_name,
			is_chat_model=is_chat_model,
		)

	@property
	def metadata(self) -> LLMMetadata:
		"""Get LLM metadata."""
		return LLMMetadata(
			context_window=self.context_window,
			num_output=self.num_output,
			model_name=self.model_name,
		)

	@llm_completion_callback()
	def complete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
		r""" Get response from the Remote LLM. """
		try:
			response = self._client.request(
				url=URL(self.llm_url),
				input_str=prompt,
			)
			return CompletionResponse(text=response)
		except Exception as e:
			return CompletionResponse(text=f"{e}")

	@llm_completion_callback()
	async def acomplete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
		r""" Asynchronously get response from the Remote LLM. """
		try:
			print("User: ", prompt)
			response = await self._async_client.arequest(
				url=URL(self.async_llm_url),
				input_str=prompt,
			)
			return CompletionResponse(text=response)
		except Exception as e:
			return CompletionResponse(text=f"{e}")

	@llm_completion_callback()
	def stream_complete(self, prompt: str, **kwargs: Any) -> CompletionResponseGen:
		try:
			response = self._client.request(
				url=URL(self.llm_url),
				input_str=prompt,
			)
		except Exception as e:
			response = e

		gen_tokens = ""
		for token in response:
			gen_tokens += token
			yield CompletionResponse(text=response, delta=token)

`labridge.models.remote.remote_models.RemoteLLM.metadata: LLMMetadata` `property` ¶

Get LLM metadata.

`labridge.models.remote.remote_models.RemoteLLM.acomplete(prompt, **kwargs)` `async` ¶

Asynchronously get response from the Remote LLM.

Source code in labridge\models\remote\remote_models.py

@llm_completion_callback()
async def acomplete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
	r""" Asynchronously get response from the Remote LLM. """
	try:
		print("User: ", prompt)
		response = await self._async_client.arequest(
			url=URL(self.async_llm_url),
			input_str=prompt,
		)
		return CompletionResponse(text=response)
	except Exception as e:
		return CompletionResponse(text=f"{e}")

`labridge.models.remote.remote_models.RemoteLLM.complete(prompt, **kwargs)` ¶

Get response from the Remote LLM.

Source code in labridge\models\remote\remote_models.py

@llm_completion_callback()
def complete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
	r""" Get response from the Remote LLM. """
	try:
		response = self._client.request(
			url=URL(self.llm_url),
			input_str=prompt,
		)
		return CompletionResponse(text=response)
	except Exception as e:
		return CompletionResponse(text=f"{e}")

Remote models

labridge.models.remote.remote_models ¶

labridge.models.remote.remote_models.AsyncModelClient ¶

labridge.models.remote.remote_models.AsyncModelClient.arequest(url, input_str) async ¶

labridge.models.remote.remote_models.AsyncModelClient.formatted_input(input_str) ¶

labridge.models.remote.remote_models.ModelClient ¶

labridge.models.remote.remote_models.ModelClient.formatted_input(input_str) ¶

labridge.models.remote.remote_models.ModelClient.request(url, input_str) ¶

labridge.models.remote.remote_models.RemoteLLM ¶

labridge.models.remote.remote_models.RemoteLLM.metadata: LLMMetadata property ¶

labridge.models.remote.remote_models.RemoteLLM.acomplete(prompt, **kwargs) async ¶

labridge.models.remote.remote_models.RemoteLLM.complete(prompt, **kwargs) ¶

`labridge.models.remote.remote_models` ¶

`labridge.models.remote.remote_models.AsyncModelClient` ¶

`labridge.models.remote.remote_models.AsyncModelClient.arequest(url, input_str)` `async` ¶

`labridge.models.remote.remote_models.AsyncModelClient.formatted_input(input_str)` ¶

`labridge.models.remote.remote_models.ModelClient` ¶

`labridge.models.remote.remote_models.ModelClient.formatted_input(input_str)` ¶

`labridge.models.remote.remote_models.ModelClient.request(url, input_str)` ¶

`labridge.models.remote.remote_models.RemoteLLM` ¶

`labridge.models.remote.remote_models.RemoteLLM.metadata: LLMMetadata` `property` ¶

`labridge.models.remote.remote_models.RemoteLLM.acomplete(prompt, **kwargs)` `async` ¶

`labridge.models.remote.remote_models.RemoteLLM.complete(prompt, **kwargs)` ¶