Measuring The Efficacy Of Large Language Models On Classification Tasks
Fuente:
WIPO "tomato"
Techniques for evaluating the efficacy of large language models on classification tasks are disclosed. A prompt that includes an instruction and a content item to be classified is submitted multiple times to a large language model. For each submission of the prompt, a corresponding classification label from a set of two or more classification labels is returned. Each classification label is compared to the expected classification label for the content item using a label distance value metric. Using the label distance value metric, a confidence score is generated.
Al elegir "Aceptar todas las cookies", acepta el uso de cookies para ayudarnos a brindarle una mejor experiencia de usuario y analizar el uso del sitio web. Al hacer clic en "Ajuste sus preferencias" puede elegir qué cookies permitir. Solo las cookies esenciales son necesarias para el correcto funcionamiento de nuestro sitio web y no pueden ser rechazadas
Configuración de cookies
Nuestro sitio web almacena cuatro tipos de cookies. En cualquier momento puede elegir qué cookies acepta y cuáles rechaza. Puede obtener más información sobre qué son las cookies y qué tipos de cookies almacenamos en nuestra Política de cookies.
Son necesarios por razones técnicas. Sin ellos, es posible que este sitio web no funcione correctamente.
Son necesarios para una funcionalidad específica en el sitio web. Sin ellos, algunas funciones pueden estar deshabilitadas.
Nos permite analizar el uso del sitio web y mejorar la experiencia del visitante
Permítanos personalizar su experiencia y enviarle contenido y ofertas relevantes, en este sitio web y en otros sitios web