跳到主要内容

Categorize 组件 (Categorize Component)

该组件用于对用户输入进行分类,并据此应用相应的处理策略。


Categorize (分类) 组件通常是 Interact (交互/Await response) 组件的下游。

适用场景 (Scenarios)

当您需要大语言模型 (LLM) 协助您识别用户意图并采用适当的处理策略时,Categorize 组件是必不可少的。

配置项 (Configurations)

Query variables (查询变量)

必填

选择要进行分类的数据源。

Categorize 组件依赖查询变量来指定其 data inputs(查询)。在 Categorize 组件之前定义的所有全局变量都可以在下拉列表中选择。

Input (输入)

Categorize 组件依赖输入变量来指定其 data inputs(查询)。点击 Input 区域中的 + Add variable (添加变量) 以添加所需的输入变量。有两种类型的输入变量:Reference (引用)Text (文本)

  • Reference (引用):使用组件的输出或用户输入作为数据源。您需要从下拉菜单中进行选择:
    • Component Output (组件输出) 下的组件 ID,或
    • Begin input (起始输入) 下的全局变量(在 Begin 组件中定义)。
  • Text (文本):使用固定的文本作为查询。您需要输入静态文本。

Model (模型)

点击 Model 的下拉菜单以显示模型配置窗口。

  • Model (模型):要使用的聊天模型。
    • 请确保已在 Model providers(模型提供商)页面正确设置了聊天模型。
    • 您可以为不同的组件使用不同的模型,以增加灵活性或提高整体性能。
  • Creativity (创造力)Temperature(温度)、Top P(核采样)、Presence penalty(存在惩罚)和 Frequency penalty(频率惩罚)设置的快捷方式,表示模型的自由度级别。从 Improvise (即兴)Precise (精准)Balance (平衡),每个预设配置都对应 TemperatureTop PPresence penaltyFrequency penalty 的独特组合。 此参数有三个选项:
    • Improvise (即兴):产生更具创造性的回答。
    • Precise (精准):(默认)产生更保守的回答。
    • Balance (平衡):介于 ImprovisePrecise 之间的折中方案。
  • Temperature (温度):模型输出的随机性级别。
    默认值为 0.1。
    • 较低的值会使输出更具确定性和可预测性。
    • 较高的值会使输出更具创造性和多样性。
    • 温度为 0 时,相同的提示词总是产生相同的输出。
  • Top P (核采样):核采样。
    • 通过设置阈值 P 并将采样限制在累积概率超过 P 的词元上,降低生成重复或不自然文本的可能性。
    • 默认值为 0.3。
  • Presence penalty (存在惩罚):鼓励模型在回答中包含更丰富多样的词元。
    • 较高的 presence penalty 值会使模型更有可能生成尚未包含在已生成文本中的新词元。
    • 默认值为 0.4。
  • Frequency penalty (频率惩罚):防止模型在生成的文本中过于频繁地重复相同的单词或短语。
    • 较高的 frequency penalty 值会使模型在重复使用已出现的词元时更加保守。
    • 默认值为 0.7。
  • Max tokens (最大词元数)
    用于设置模型输出的最大长度(以词元数衡量)。默认情况下它是禁用的,允许模型自主决定其响应中的词元数量。
注意
  • 所有组件不一定必须使用相同的模型。如果特定模型在某项任务中表现不佳,可以考虑换用其他模型。
  • 如果您对 TemperatureTop PPresence penaltyFrequency penalty 的底层机制不太确定,只需从 Creativity 的三个选项中选择一个即可。

Message window size (消息窗口大小)

一个整数,指定输入到大语言模型 (LLM) 中的历史对话轮数。例如,如果设置为 12,则最后 12 轮对话的 token 将提供给大语言模型。此功能会消耗额外的 token。

默认值为 1。

重要提示

此功能用于多轮对话。如果您的 Categorize 组件不属于多轮对话的一部分(即,它不在循环中),请保持该字段的默认值不变。

Category name (分类名称)

一个 Categorize 组件必须至少包含两个分类。此字段设置分类的名称。点击 + Add Item (添加项) 可以包含所需的分类。

注意

您会发现分类名称是自动填充的。请不用担心,每个分类在创建时都会被赋予一个随机名称。您可以自由地将其修改为大语言模型易于理解的名称。

Description (描述)

该分类的描述。

您可以输入一些判定标准、具体场景或信息,帮助大语言模型决定哪些输入属于这一分类。

Examples (示例)

辅助大语言模型判定哪些输入属于该分类的额外示例。

重要提示

如果您希望大语言模型将特定情况归入此类,示例会比描述更加有用。

添加新分类后,在画布上导航到 Categorize 组件,找到对应情况旁边的 + 按钮,点击它以指定下游组件。

Output (输出)

该组件输出的全局变量名称,可以被工作流中的其他组件所引用。默认值为 category_name