跳转至

Labridge

Summarize

Summarize

`labridge.func_modules.paper.synthesizer.summarize` ¶

`labridge.func_modules.paper.synthesizer.summarize.PaperBatchSummarize` ¶

Bases: BaseSynthesizer

Summarize a paper in a batch style (Because of the video memory limits).

Firstly, the paper contents are seperated into overlapped batches, with no batch exceeds the max_tokens.
The batch contents are then summarized individually.
Finally, those summaries are summarized to get the summary of the paper.

PARAMETER	DESCRIPTION
`llm`	The used LLM. TYPE: `LLM` DEFAULT: `None`
`max_tokens`	The max_tokens of a batch, set a proper value according to the video memory size. TYPE: `int` DEFAULT: `SUMMARIZE_MAX_TOKENS`
`overlap_chunk_num`	The overlap chunks between two adjacent batches. TYPE: `int` DEFAULT: `SUMMARIZE_OVERLAP_CHUNK_NUM`
`summary_query`	The summary prompt in the batch summary. TYPE: `str` DEFAULT: `PAPER_SUMMARIZE_QUERY`
`secondary_query`	The summary prompt in the final summary. TYPE: `str` DEFAULT: `PAPER_SECONDARY_SUMMARIZE_QUERY`

Source code in labridge\func_modules\paper\synthesizer\summarize.py

class PaperBatchSummarize(BaseSynthesizer):
	r"""
	Summarize a paper in a batch style (Because of the video memory limits).

	- Firstly, the paper contents are seperated into overlapped batches, with no batch exceeds the max_tokens.
	- The batch contents are then summarized individually.
	- Finally, those summaries are summarized to get the summary of the paper.

	Args:
		llm (LLM): The used LLM.
		max_tokens (int): The max_tokens of a batch, set a proper value according to the video memory size.
		overlap_chunk_num (int): The overlap chunks between two adjacent batches.
		summary_query (str): The summary prompt in the batch summary.
		secondary_query (str): The summary prompt in the final summary.
	"""
	def __init__(
		self,
		llm: LLM = None,
		max_tokens: int = SUMMARIZE_MAX_TOKENS,
		overlap_chunk_num: int = SUMMARIZE_OVERLAP_CHUNK_NUM,
		summary_query: str = PAPER_SUMMARIZE_QUERY,
		secondary_query: str = PAPER_SECONDARY_SUMMARIZE_QUERY,
	):
		super().__init__(llm=llm)
		self._summary_template = DEFAULT_TREE_SUMMARIZE_PROMPT_SEL
		self._synthesizer = get_response_synthesizer(
			llm=self._llm,
			response_mode=ResponseMode.TREE_SUMMARIZE,
		)
		self._tokenizer = global_tokenizer or get_tokenizer()
		self._max_tokens = max_tokens
		self._overlap_chunk_num = overlap_chunk_num
		self._summary_query = summary_query
		self._secondary_query = secondary_query


	@property
	def summary_query(self) -> str:
		return self._summary_query

	@summary_query.setter
	def summary_query(self, value: str):
		self._summary_query = value

	@property
	def secondary_query(self) -> str:
		return self._secondary_query

	@secondary_query.setter
	def secondary_query(self, value: str):
		self._secondary_query = value

	def _get_prompts(self) -> PromptDictType:
		"""Get prompts."""
		return {"summary_template": self._summary_template}

	def _update_prompts(self, prompts: PromptDictType) -> None:
		""" Update prompts."""
		if "summary_template" in prompts:
			self._summary_template = prompts["summary_template"]

	def _calculate_batch_size(self, text_chunks: Sequence[str]) -> Tuple[bool, int]:
		r"""
		Decide whether to use batch mode and the batch size, according to the `text_chunks` and `self.max_tokens`.

		Args:
			text_chunks (Sequence[str]): The chunks of a paper.

		Returns:
			Tuple[bool, int]:
				- batch_mode (bool): Whether to use batch summarize.
				- batch_size (int): Batch size in batch summarizing.
		"""
		token_num, max_node_tokens = 0, 0
		batch_mode = False
		for chunk in text_chunks:
			tokens = len(
				self._tokenizer(chunk)
			)
			token_num += tokens
			max_node_tokens = max(tokens, max_node_tokens)

		if token_num < self._max_tokens:
			return batch_mode, 0

		batch_mode = True
		batch_size = self._max_tokens // max_node_tokens
		return batch_mode, batch_size

	def batch_chunks(self, text_chunks: Sequence[str], batch_size: int):
		r"""
		Yield batch chunks according to the `batch_size` and `self._overlap_chunk_num`.

		Args:
			text_chunks (Sequence[str]): The chunks of a paper.
			batch_size (int): The calculated batch size.

		Returns:
			Sequence[str]: A batch.
		"""
		n = len(text_chunks)
		for start in range(0, n, batch_size - self._overlap_chunk_num):
			yield text_chunks[start: start + batch_size]

	def batch_get_response(self, batch_chunks: Sequence[str], query_str: str) -> RESPONSE_TEXT_TYPE:
		r"""
		Batch summarize.

		Args:
			batch_chunks (Sequence[str]): A batch of chunks.
			query_str (str): The batch query prompt.

		Returns:
			RESPONSE_TEXT_TYPE: The summary.
		"""
		summary_template = self._summary_template.partial_format(query_str=query_str)
		response = self._llm.predict(
			summary_template,
			context_str="\n".join(batch_chunks),
		)
		return response

	async def abatch_get_response(self, batch_chunks: Sequence[str], query_str: str) -> RESPONSE_TEXT_TYPE:
		r"""
		Asynchronously batch summarize.

		Args:
			batch_chunks (Sequence[str]): A batch of chunks.
			query_str (str): The batch query prompt.

		Returns:
			RESPONSE_TEXT_TYPE: The summary.
		"""
		summary_template = self._summary_template.partial_format(query_str=query_str)
		response = await self._llm.apredict(
			summary_template,
			context_str="\n".join(batch_chunks),
		)
		return response

	def get_response(
        self,
        query_str: str,
        text_chunks: Sequence[str],
        **response_kwargs: Any,
    ) -> RESPONSE_TEXT_TYPE:
		r"""
		Summarize a paper.

		Args:
			query_str (str): Not used.
			text_chunks (Sequence[str]): The text chunks of a paper.
			**response_kwargs (Any): Not used.

		Returns:
			RESPONSE_TEXT_TYPE: The summary.
		"""
		batch_mode, batch_size = self._calculate_batch_size(text_chunks=text_chunks)

		print("summary batch size: ", batch_size)
		print("Total chunks: ", len(text_chunks))
		print(text_chunks[0])
		if not batch_mode:
			return self.batch_get_response(
				batch_chunks=text_chunks,
				query_str=self.summary_query,
			)

		summary_texts = []
		for chunks in self.batch_chunks(text_chunks=text_chunks, batch_size=batch_size):


			response = self.batch_get_response(
				batch_chunks=chunks,
				query_str=self.summary_query
			)
			summary_texts.append(response)

		final_response = self.batch_get_response(
			batch_chunks=summary_texts,
			query_str=self.secondary_query,
		)
		return final_response

	async def aget_response(
        self,
        query_str: str,
        text_chunks: Sequence[str],
        **response_kwargs: Any,
    ) -> RESPONSE_TEXT_TYPE:
		r"""
		Summarize a paper.

		Args:
			query_str (str): Not used.
			text_chunks (Sequence[str]): The text chunks of a paper.
			**response_kwargs (Any): Not used.

		Returns:
			RESPONSE_TEXT_TYPE: The summary.
		"""
		batch_mode, batch_size = self._calculate_batch_size(text_chunks=text_chunks)
		if not batch_mode:
			return await self.abatch_get_response(
				batch_chunks=text_chunks,
				query_str=self.summary_query,
			)

		tasks = [
			self.abatch_get_response(
				batch_chunks=batch_chunks,
				query_str=self.summary_query,
			) for batch_chunks in self.batch_chunks(text_chunks=text_chunks, batch_size=batch_size)
		]

		summary_texts = await asyncio.gather(*tasks)

		final_response = self.batch_get_response(
			batch_chunks=summary_texts,
			query_str=self.secondary_query,
		)
		return final_response

	@dispatcher.span
	def synthesize(self, query: QueryType, nodes: List[NodeWithScore],
		additional_source_nodes: Optional[Sequence[NodeWithScore]] = None, **response_kwargs: Any, ) -> RESPONSE_TYPE:
		dispatcher.event(SynthesizeStartEvent(query=query, ))

		if len(nodes) == 0:
			if self._streaming:
				empty_response = StreamingResponse(response_gen=empty_response_generator())
				dispatcher.event(SynthesizeEndEvent(query=query, response=empty_response, ))
				return empty_response
			else:
				empty_response = Response("Empty Response")
				dispatcher.event(SynthesizeEndEvent(query=query, response=empty_response, ))
				return empty_response

		if isinstance(query, str):
			query = QueryBundle(query_str=query)

		with self._callback_manager.event(CBEventType.SYNTHESIZE,
				payload={EventPayload.QUERY_STR: query.query_str}, ) as event:
			response_str = self.get_response(query_str=query.query_str,
				text_chunks=[n.node.get_content(metadata_mode=MetadataMode.NONE) for n in nodes], **response_kwargs, )

			additional_source_nodes = additional_source_nodes or []
			source_nodes = list(nodes) + list(additional_source_nodes)

			response = self._prepare_response_output(response_str, source_nodes)

			event.on_end(payload={EventPayload.RESPONSE: response})

		dispatcher.event(SynthesizeEndEvent(query=query, response=response, ))
		return response

	@dispatcher.span
	async def asynthesize(self, query: QueryType, nodes: List[NodeWithScore],
		additional_source_nodes: Optional[Sequence[NodeWithScore]] = None, **response_kwargs: Any, ) -> RESPONSE_TYPE:
		dispatcher.event(SynthesizeStartEvent(query=query, ))
		if len(nodes) == 0:
			if self._streaming:
				empty_response = AsyncStreamingResponse(response_gen=empty_response_agenerator())
				dispatcher.event(SynthesizeEndEvent(query=query, response=empty_response, ))
				return empty_response
			else:
				empty_response = Response("Empty Response")
				dispatcher.event(SynthesizeEndEvent(query=query, response=empty_response, ))
				return empty_response

		if isinstance(query, str):
			query = QueryBundle(query_str=query)

		with self._callback_manager.event(CBEventType.SYNTHESIZE,
				payload={EventPayload.QUERY_STR: query.query_str}, ) as event:
			response_str = await self.aget_response(query_str=query.query_str,
				text_chunks=[n.node.get_content(metadata_mode=MetadataMode.NONE) for n in nodes], **response_kwargs, )

			additional_source_nodes = additional_source_nodes or []
			source_nodes = list(nodes) + list(additional_source_nodes)

			response = self._prepare_response_output(response_str, source_nodes)

			event.on_end(payload={EventPayload.RESPONSE: response})

		dispatcher.event(SynthesizeEndEvent(query=query, response=response, ))
		return response

`labridge.func_modules.paper.synthesizer.summarize.PaperBatchSummarize.abatch_get_response(batch_chunks, query_str)` `async` ¶

Asynchronously batch summarize.

PARAMETER	DESCRIPTION
`batch_chunks`	A batch of chunks. TYPE: `Sequence[str]`
`query_str`	The batch query prompt. TYPE: `str`

RETURNS	DESCRIPTION
`RESPONSE_TEXT_TYPE`	The summary. TYPE: `RESPONSE_TEXT_TYPE`

Source code in labridge\func_modules\paper\synthesizer\summarize.py

async def abatch_get_response(self, batch_chunks: Sequence[str], query_str: str) -> RESPONSE_TEXT_TYPE:
	r"""
	Asynchronously batch summarize.

	Args:
		batch_chunks (Sequence[str]): A batch of chunks.
		query_str (str): The batch query prompt.

	Returns:
		RESPONSE_TEXT_TYPE: The summary.
	"""
	summary_template = self._summary_template.partial_format(query_str=query_str)
	response = await self._llm.apredict(
		summary_template,
		context_str="\n".join(batch_chunks),
	)
	return response

`labridge.func_modules.paper.synthesizer.summarize.PaperBatchSummarize.aget_response(query_str, text_chunks, **response_kwargs)` `async` ¶

Summarize a paper.

PARAMETER	DESCRIPTION
`query_str`	Not used. TYPE: `str`
`text_chunks`	The text chunks of a paper. TYPE: `Sequence[str]`
`**response_kwargs`	Not used. TYPE: `Any` DEFAULT: `{}`

RETURNS	DESCRIPTION
`RESPONSE_TEXT_TYPE`	The summary. TYPE: `RESPONSE_TEXT_TYPE`

Source code in labridge\func_modules\paper\synthesizer\summarize.py

	async def aget_response(
        self,
        query_str: str,
        text_chunks: Sequence[str],
        **response_kwargs: Any,
    ) -> RESPONSE_TEXT_TYPE:
		r"""
		Summarize a paper.

		Args:
			query_str (str): Not used.
			text_chunks (Sequence[str]): The text chunks of a paper.
			**response_kwargs (Any): Not used.

		Returns:
			RESPONSE_TEXT_TYPE: The summary.
		"""
		batch_mode, batch_size = self._calculate_batch_size(text_chunks=text_chunks)
		if not batch_mode:
			return await self.abatch_get_response(
				batch_chunks=text_chunks,
				query_str=self.summary_query,
			)

		tasks = [
			self.abatch_get_response(
				batch_chunks=batch_chunks,
				query_str=self.summary_query,
			) for batch_chunks in self.batch_chunks(text_chunks=text_chunks, batch_size=batch_size)
		]

		summary_texts = await asyncio.gather(*tasks)

		final_response = self.batch_get_response(
			batch_chunks=summary_texts,
			query_str=self.secondary_query,
		)
		return final_response

`labridge.func_modules.paper.synthesizer.summarize.PaperBatchSummarize.batch_chunks(text_chunks, batch_size)` ¶

Yield batch chunks according to the batch_size and self._overlap_chunk_num.

PARAMETER	DESCRIPTION
`text_chunks`	The chunks of a paper. TYPE: `Sequence[str]`
`batch_size`	The calculated batch size. TYPE: `int`

RETURNS	DESCRIPTION
	Sequence[str]: A batch.

Source code in labridge\func_modules\paper\synthesizer\summarize.py

def batch_chunks(self, text_chunks: Sequence[str], batch_size: int):
	r"""
	Yield batch chunks according to the `batch_size` and `self._overlap_chunk_num`.

	Args:
		text_chunks (Sequence[str]): The chunks of a paper.
		batch_size (int): The calculated batch size.

	Returns:
		Sequence[str]: A batch.
	"""
	n = len(text_chunks)
	for start in range(0, n, batch_size - self._overlap_chunk_num):
		yield text_chunks[start: start + batch_size]

`labridge.func_modules.paper.synthesizer.summarize.PaperBatchSummarize.batch_get_response(batch_chunks, query_str)` ¶

Batch summarize.

PARAMETER	DESCRIPTION
`batch_chunks`	A batch of chunks. TYPE: `Sequence[str]`
`query_str`	The batch query prompt. TYPE: `str`

RETURNS	DESCRIPTION
`RESPONSE_TEXT_TYPE`	The summary. TYPE: `RESPONSE_TEXT_TYPE`

Source code in labridge\func_modules\paper\synthesizer\summarize.py

def batch_get_response(self, batch_chunks: Sequence[str], query_str: str) -> RESPONSE_TEXT_TYPE:
	r"""
	Batch summarize.

	Args:
		batch_chunks (Sequence[str]): A batch of chunks.
		query_str (str): The batch query prompt.

	Returns:
		RESPONSE_TEXT_TYPE: The summary.
	"""
	summary_template = self._summary_template.partial_format(query_str=query_str)
	response = self._llm.predict(
		summary_template,
		context_str="\n".join(batch_chunks),
	)
	return response

`labridge.func_modules.paper.synthesizer.summarize.PaperBatchSummarize.get_response(query_str, text_chunks, **response_kwargs)` ¶

Summarize a paper.

PARAMETER	DESCRIPTION
`query_str`	Not used. TYPE: `str`
`text_chunks`	The text chunks of a paper. TYPE: `Sequence[str]`
`**response_kwargs`	Not used. TYPE: `Any` DEFAULT: `{}`

RETURNS	DESCRIPTION
`RESPONSE_TEXT_TYPE`	The summary. TYPE: `RESPONSE_TEXT_TYPE`

Source code in labridge\func_modules\paper\synthesizer\summarize.py

	def get_response(
        self,
        query_str: str,
        text_chunks: Sequence[str],
        **response_kwargs: Any,
    ) -> RESPONSE_TEXT_TYPE:
		r"""
		Summarize a paper.

		Args:
			query_str (str): Not used.
			text_chunks (Sequence[str]): The text chunks of a paper.
			**response_kwargs (Any): Not used.

		Returns:
			RESPONSE_TEXT_TYPE: The summary.
		"""
		batch_mode, batch_size = self._calculate_batch_size(text_chunks=text_chunks)

		print("summary batch size: ", batch_size)
		print("Total chunks: ", len(text_chunks))
		print(text_chunks[0])
		if not batch_mode:
			return self.batch_get_response(
				batch_chunks=text_chunks,
				query_str=self.summary_query,
			)

		summary_texts = []
		for chunks in self.batch_chunks(text_chunks=text_chunks, batch_size=batch_size):


			response = self.batch_get_response(
				batch_chunks=chunks,
				query_str=self.summary_query
			)
			summary_texts.append(response)

		final_response = self.batch_get_response(
			batch_chunks=summary_texts,
			query_str=self.secondary_query,
		)
		return final_response