Large Language Model (Büyük Dil Modeli) Nedir?

Perform Yazılım
2 min readMay 25, 2023

--

Büyük dil modeli teriminin resmi bir tanımı olmasa da, genellikle milyarlarca veya daha fazla parametre sayısına sahip derin öğrenme modellerini ifade eder.

Büyük dil modeli (LLM), kendi kendini denetleyen öğrenme veya yarı denetimli öğrenme kullanılarak büyük miktarlarda etiketlenmemiş metin üzerinde eğitilen, birçok parametreye (tipik olarak milyarlarca ağırlık veya daha fazla) sahip bir sinir ağından oluşan bir dil modelidir.

LLM’ler 2018 civarında ortaya çıktı ve çok çeşitli görevlerde iyi performans göstermektedir. Bu, doğal dil işleme araştırmasının odağını, belirli görevler için özel denetimli modelleri eğitmeye yönelik önceki paradigmadan uzaklaştırdı.

Büyük dil modeli teriminin resmi bir tanımı olmasa da, genellikle milyarlarca veya daha fazla parametre sayısına sahip derin öğrenme modellerini ifade eder.

LLM’ler, belirli bir görev için eğitilmenin aksine (duyarlılık analizi, adlandırılmış varlık tanıma veya matematiksel akıl yürütme gibi) çok çeşitli görevlerde öne çıkan genel amaçlı modellerdir.

Görevleri yerine getirme becerileri ve yapabilecekleri görev aralığı, bağımlı olmayacak şekilde, onlara ayrılan kaynak miktarının (veri, parametre boyutu, bilgi işlem gücü) bir fonksiyonu gibi görünmektedir.

Cümledeki bir sonraki kelimeyi tahmin etme gibi basit görevler üzerinde eğitilmiş olsalar da, yeterli eğitim ve parametre sayımına sahip nöral dil modellerinin, insan dilinin sözdiziminin ve anlambiliminin çoğunu yakaladığı bulunmuştur.

Ek olarak, büyük dil modelleri dünya hakkında hatırı sayılır bir genel bilgi sergiler ve eğitim sırasında çok sayıda olguyu “ezberleyebilir”.

https://en.wikipedia.org/wiki/Large_language_model

--

--

Perform Yazılım
Perform Yazılım

No responses yet