LLM'lerden en iyi yanıtları almak için sıcaklık (temperature) ve top-p (nucleus) sampling parametrelerini doğru ayarlamak kritik öneme sahiptir. Bu iki yöntem, modelin çıktı dağılımını şekillendirerek daha yaratıcı veya daha deterministik sonuçlar üretmenizi sağlar. Hangi parametrenin hangi durumda tercih edileceğini anlamak, Chain-of-Thought Prompting gibi tekniklerle birleştiğinde çok daha etkili olur.
Temperature Nedir?
Temperature, modelin softmax çıktısındaki olasılık dağılımını yumuşatan bir parametredir. Düşük sıcaklık (0.1-0.5) olasılık farklarını büyüterek daha yüksek olasılıklı tokenleri kuvvetlendirir, bu da daha tutarlı ve tahmin edilebilir yanıtlara yol açar. Yüksek sıcaklık (0.8-1.5) ise daha düz bir dağılım oluşturarak düşük olasılıklı tokenlerin seçilme şansını artırır, yaratıcı ve çeşitli çıktılar üretir. Sıcaklık 0'a yaklaştıkça model neredeyse deterministik hale gelir; her zaman en yüksek olasılıklı tokeni seçer.
Top-p (Nucleus) Sampling Nedir?
Top-p sampling (nucleus sampling), olasılık dağılımının kümülatif toplamı p'ye ulaşana kadar en olası tokenleri bir havuzda toplar ve sonra bu alt kümeden rastgele örnekleme yapar. Örneğin p=0.9 ise, toplam olasılığın %90'ını oluşturan en olası tokenler seçilir. Bu yöntem, düşük olasılıklı tokenlerin kesilmesini sağlar ve modelin gereksiz varyasyonunu azaltır. Top-p değeri düşük (0.5-0.7) iken daha odaklı çıktılar, yüksek (0.9-1.0) iken daha çeşitli çıktılar elde edilir.
Top-k Sampling
Top-k sampling ise en yüksek olasılığa sahip k tane tokeni seçerek bir alt küme oluşturur ve ardından bu kümeden örnekleme yapar. Örneğin k=50 ise, en olası 50 token dikkate alınır. Bu yöntem sabit sayıda token seçtiği için olasılık dağılımının şekline duyarsızdır. Ancak dağılım çok düzgünse düşük olasılıklı tokenleri dahil edebilir. Günümüzde top-p daha yaygın kullanılmaktadır.
Karşılaştırma Tablosu
| Parametre | Çalışma Prensibi | Kontrol Derecesi | Avantajları | Dezavantajları |
|---|---|---|---|---|
| Temperature | Olasılık dağılımını yumuşatır | Küresel, tüm kelimeleri etkiler | Basit, tek parametre; düşük değerlerde tutarlılık sağlar | Yüksek değerlerde anlamsız çıktı riski; dağılım şekline duyarlı |
| Top-p | Kümülatif olasılık eşiğine göre kelime seçer | Uyarlanabilir, dağılıma göre dinamik | Düşük olasılıklı kelimeleri keser; dağılım şekline uyum sağlar | Karmaşık; eşik değer seçimi zor |
| Top-k | Sabit sayıda en olası kelimeyi seçer | Sabit, dağılımdan bağımsız | Anlaşılması kolay; az varyasyon istenen durumlarda işe yarar | Dağılım genişse düşük olasılıklı kelimeler dahil olur; dar dağılımda gereksiz kısıtlama |
Hangi Durumda Hangi Parametre Kullanılmalı?
Temperature ve top-p birlikte de kullanılabilir, ancak genellikle ikisinden biri tercih edilir. Aşağıdaki senaryolar rehberiniz olabilir:
- Yaratıcı metin yazımı (hikaye, şiir): Yüksek temperature (0.8-1.2) veya yüksek top-p (0.95) kullanarak çeşitlilik artırın.
- Teknik ve doğru yanıt gerektiren görevler (kod, hesaplama): Düşük temperature (0.1-0.3) veya düşük top-p (0.5-0.7) ile tutarlılığı artırın.
- Sohbet asistanı: Orta değerler (temp=0.7, top-p=0.9) iyi bir denge sağlayabilir.
- Fikir üretme (brainstorming): Yüksek temperature (1.2-1.5) veya top-p (1.0) ile daha beklenmedik çıktılar alın.
Örneğin, Few-shot ve Zero-shot Prompting kullanırken doğru parametrelerle çıktı kalitesini artırabilirsiniz. Role Prompting ile birleştiğinde ise rolün karakterine uygun çıktılar elde etmek mümkündür.
Sık Yapılan Hatalar ve Dikkat Edilmesi Gerekenler
- Çok yüksek temperature (≥2.0): Anlamsız, rastgele kelimelerden oluşan çıktılara yol açar. Genelde 0.1-1.5 arası yeterlidir.
- Top-p ve top-k’yi birlikte kullanırken çakışma: Her ikisini birden kullanmak bazen beklendiği gibi çalışmayabilir; test edin.
- Her görev için tek bir parametre seti kullanmak: Her senaryo farklıdır; deneme yanılma ile en uygun değerleri bulun.
- Düşük temperature ile yaratıcılık beklemek: Düşük sıcaklık yaratıcılığı kısıtlar; yaratıcı görevler için daha yüksek değerler deneyin.
Sonuç: Doğru Parametreyi Seçmek
Temperature ve top-p sampling, LLM çıktılarını kontrol etmenin iki etkili yoludur. Temperature, dağılımı yumuşatarak genel bir ayar sağlarken; top-p, dağılımın dinamik yapısına uyum sağlar. Hangi yöntemin daha iyi olduğu kullanım amacına bağlıdır. Pratik yaparak ve ince ayarlarla hem yaratıcı hem de tutarlı sonuçlar elde edebilirsiniz. Unutmayın, Chain-of-Thought Prompting gibi tekniklerle birleştiğinde bu parametrelerin etkisi katlanarak artar.
Sık Sorulan Sorular
Temperature ve top-p arasındaki temel fark nedir?
Temperature, olasılık dağılımını yumuşatarak tüm tokenleri etkilerken; top-p, kümülatif olasılık eşiğine göre bir alt küme seçerek dağılıma uyarlanır. Temperature daha küresel, top-p ise daha dinamik bir kontrol sağlar.
Hangi parametre daha iyi sonuç verir: temperature mi top-p mi?
Kesin bir cevap yoktur; her ikisi de farklı durumlarda avantajlıdır. Yaratıcılık için temperature, tutarlılık için düşük top-p daha uygun olabilir. Genelde birlikte kullanılmaz, test ederek size uygun olanı bulun.
Top-p ve top-k birlikte kullanılabilir mi?
Evet, bazı API'ler her ikisini aynı anda kabul eder. Ancak bu durumda önce top-k uygulanır, ardından top-p. Çakışma olabileceği için dikkatli ayar yapmak gerekir.
Düşük sıcaklık (0.1) ile garantili doğru yanıt alabilir miyim?
Düşük sıcaklık modeli deterministiğe yaklaştırır ancak yanıtın doğruluğunu garanti etmez. Modelin eğitim verisinden kaynaklanan hatalar devam edebilir.






