Значение может быть числовым, определяющим, как быстро температура уменьшается, например, «temperature_decay=0.9», что означает постепенное снижение температуры. Значения могут варьироваться от 0.1 до 1.0, в зависимости от желаемой динамики.
Top-K
Параметр «top_k» контролирует выбор следующего слова из фиксированного количества наиболее вероятных вариантов. Это метод ограничивает выбор слов до наиболее вероятных, что помогает улучшить качество генерации текста и избежать непредсказуемых результатов.
Параметр «top_k» задает, сколько лучших вариантов слов модель будет рассматривать при каждом шаге генерации. Это ограничивает выбор и помогает предотвратить появление низкокачественных слов или фраз.
Значение «top_k» является целым числом, определяющим количество слов в рассмотрении. Например, «top_k=50» означает, что будут рассматриваться 50 наиболее вероятных слов. Значения могут варьироваться от 1 (жадный поиск) до 100 или более, в зависимости от желаемого уровня разнообразия и качества.
Top-K Decay
Параметр «top_k_decay» управляет изменением значения «top_k» в процессе генерации текста. Этот параметр позволяет динамически изменять количество вариантов слов, которые рассматриваются на каждом шаге генерации.
Использование «top_k_decay» позволяет постепенно уменьшать количество рассматриваемых вариантов, что может улучшить стабильность и когерентность текста по мере его генерации. Это помогает достичь лучшего баланса между креативностью и точностью.
Значение «top_k_decay» может быть числовым, указывающим на скорость изменения «top_k». Например, «top_k_decay=0.95» означает, что «top_k» будет уменьшаться на 5% на каждом шаге. Значения могут варьироваться от 0.1 до 1.0, определяя, насколько быстро происходит уменьшение.
Top-P
Параметр «top_p» (также известный как «nucleus sampling») управляет выбором следующего слова из наиболее вероятных слов, сумма вероятностей которых достигает порогового значения «top_p». Это метод помогает сохранять разнообразие при генерации текста, фокусируясь на наиболее вероятных словах, которые составляют наиболее значимую часть распределения вероятностей.
Параметр «top_p» задает порог вероятности, до которого суммируются вероятности слов. Например, «top_p=0.9» означает, что будут рассматриваться слова, вероятность которых в сумме составляет 90% от всей вероятности. Это помогает избежать генерации текстов с низким качеством и повысить их разнообразие.
Значение «top_p» может быть числовым, например, от 0.1 до 1.0. Значение «top_p=0.9» обычно используется для сохранения хорошего баланса между разнообразием и когерентностью текста. Значения близкие к 1.0 приводят к более широкому выбору слов, а значения близкие к 0.1 – к более узкому выбору.
Top-P Decay
Параметр «top_p_decay» регулирует изменение значения «top_p» в процессе генерации текста. Этот параметр позволяет динамически изменять порог вероятности, который используется для выбора слов.
Использование «top_p_decay» позволяет постепенно корректировать уровень разнообразия текста, начиная с более высоких значений «top_p» и уменьшая его по мере генерации. Это может улучшить когерентность текста по мере его создания.
Значение «top_p_decay» может быть числовым, определяющим скорость изменения порога «top_p». Например, «top_p_decay=0.95» означает, что «top_p» будет уменьшаться на 5% на каждом шаге.
Рассмотрим на примерах промпты с параметрами, которые могут быть использованы для генерации и перефразирования текстов.
Пример 1, контроль длины и разнообразия, рис. 20.
Перефразируй следующий текст, используя следующие параметры:
– max_length: 120
– min_length: 80
– diversity_penalty: 0.7
– temperature: 0.9
– top_p: 0.85
Текст:
Рисунок 20 – Перефразированный текст, левое окно, источник – правое окно, отличие Ш2=96%
Пример 2, фокус на когерентности и отсутствие повторений, рис. 21.
Перефразируй данный текст с учетом следующих параметров:
– coherence_threshold: 0.8
– no_repeat_ngram_size: 2
– frequency_penalty: 0.5
– presence_penalty: 0.3
– temperature: 0.7
Текст:
Рисунок 21 – Перефразированный текст, левое окно, источник – правое окно, отличие Ш2=100%
Пример 3, контроль за разнообразием и последовательностью, рис. 22.
Перефразируй текст, используя следующие параметры:
– diversity_temperature: 0.8
– top_k: 50
– coherence_threshold: 0.9
– early_stopping: true
– repetition_penalty: 1.2
Текст:
Рисунок 22 – Перефразированный текст, левое окно, источник – правое окно, отличие Ш2=95%
Пример 4, фокус на разнообразие и контекст, рис. 23.
Перефразируй текст, используя следующие параметры:
– diversity_penalty: 0.6
– diversity_temperature: 0.9
– context_window: 15