Dil modelleri: nedir bunlar, neden onlar hakkında bu kadar çok konuşuluyor ve nasıl bir geleceğe sahip olacaklar

Suzan · 7 Ocak 2024

THE dil modelleri Büyük boyutların (Büyük Dil Modeli, LLM) bugün tartışmanın merkezinde, özellikle yapay zekanın demokratikleşmesine katkıda bulunan, kullanımını herkesin ve dolayısıyla belirli bir bilgi birikimine sahip olmayanların da kullanımına sunan ChatGPT sayesinde tartışmanın merkezinde yer alıyor. .

Ancak hikayeleri resmen geçen yüzyılın altmışlı yıllarında, Massachusetts Teknoloji Enstitüsü'nün (MIT) laboratuvarlarından, doğal dil işlemeye şekil veren, dünyadaki ilk sohbet robotu sayılabilecek Eliza'nın ortaya çıkmasıyla başlıyor. Bugün, geniş bir kullanıcı kitlesini ve geniş kullanım çeşitliliklerini fetheden başka bir gençlik deneyimi yaşıyor.

Büyük dil modellerinin geleceğinin ne olduğunu daha iyi anlamak için Search On Media Group mühendisi ve Yapay Zeka Başkanı Alessio Pomaro'nun deneyiminden yararlandık.

Sayılar

Yılda 6 milyar dolardan 180 milyar dolara: Yapay zekaya yapılan yatırımlar 2013'ten bu yana 30 kat arttı

kaydeden Emanuele Capone

26 Nisan 2023

Dil modelleri nelerdir?

Büyük dil modelleri (LLM'ler), insan dilini anlayabilen ve oluşturabilen makine öğreniminin bir dalıdır. Bunu yapmak için derin sinir ağlarını, büyük miktarda veriyi işleyebilen ve insan beynini taklit edebilen teknikleri kullanıyor. Teknik detaylardan uzak: bir dil modeli insan dilini taklit eden bir yazılımdır istatistiksel hesaplamalar ve algoritmalar kullanan ve büyük miktarda veriyi analiz ederek bağlamı dikkate alarak cümledeki bir sonraki kelimeyi tahmin etmeyi öğrenen.

Hangi alanlarda kullanılırlar

Kısa cevap “her alanda”dır ve bunun nedeni, onları eğitmek için belirli bir sözlük kullanıldığında, dil modellerinin hukuk, tıp, turizm, tarım ve daha birçok sınırlı alanda belirli bir kolaylıkla hareket etmesidir; bunu da göz önünde bulundurarak, bunların kullanımı Chatbot'un oluşturulmasını reddetti, belirli soruları yanıtlamanıza ve böylece kaliteyi artırmak için hala yapılması gereken çok şeyin olduğu bir bağlam olan müşteri desteği dünyasına girmenize olanak tanır. Bununla birlikte, bunlar için kullanılırlar metin, resim, ses, video ve hatta programlama kodu oluşturun. Yeni kapılar açan, yeni sorular ortaya atan ve eski sorunları çözen çok yönlü dijital çözümler.

Alessio Pomaro'nun açıkladığı gibi belki de alanlar hakkında konuşmak yerine yüksek lisansların yayılmasına izin veren mantık hakkında konuşmak daha iyidir: yazılım, CMS, platformlar, işletim sistemleri bu tür modelleri entegre ediyori, bunları kullanıcıların artık beklediği gelişmiş özelliklere veya gelişmiş asistanlara dönüştürüyorum. Örneğin Google, Workspace'te Duet AI'yi geliştiriyor, Microsoft, Copilot'u Windows'a ve paketindeki tüm yazılımlara entegre ediyor, Amazon, AWS içinde bir asistan olan Q'yu yarattı, Adobe, Photoshop'u görüntü düzenleme ve beklenen şaşırtıcı işler için gelişmiş araçlarla donattı video düzenleme ve benzeri alanlardan, dil modellerinin çevrimiçi aramanın geleceğine entegrasyonuna kadar (örneğin, Bing'de Copilot, Google'ın Arama Üretken Deneyimi, Perplexity). Şirketlerin bakış açısından, Üretken modeller, operasyonel akışlara entegre edilen giderek daha gelişmiş araçlar sunacak araştırma ve veri işleme için ve daha derin otomasyona ulaşmak için. Bugün, RAG (Retrieval Augmented Generation) kavramından, yani büyük veri koleksiyonlarını (potansiyel olarak kurumsal bilgi) bunların çıkarılmasını, işlenmesini ve farklı çıktılara dönüştürülmesini kolaylaştırmak için bir dil modeline arayüzleyebilen sistemler hakkında giderek daha sık konuşuyoruz. Bu sistemlere özel veri yapıları da onları son derece yüksek performanslı ve güvenli hale getirmek için oluşturuluyor; örneğin Infinity, Yapay Zeka yerel veritabanı”.

Özel şablonlar

Yüksek Lisans'lar bir şirketin sahip olduğu verileri kullanmak için özelleştirilebilir; bu, gelecekte giderek yaygınlaşacak olan mevcut bir uygulamadır: “Büyük ölçekli kişiselleştirme, üretken modellerden kaynaklanacak bir başka etkidir ve bu, şirketlerin operasyonlarını bugün erişilemez bir şekilde genişletmelerine olanak tanıyacaktır. gerektirecekleri yüksek çaba nedeniyle. Uber Hindistan, markanın onuncu yıl dönümü vesilesiyle, tüm çalışanlara kişiselleştirilmiş bir video gönderdi aktör Sonu Sood'un herkesi ismiyle selamladığı film. Bu, tek bir çekimle ve tamamı Hintçe ve İngilizce olmak üzere sesi klonlayarak, dinamik parçalar ekleyerek ve dudak senkronizasyonu uygulayarak videoyu değiştirebilen üretken algoritmalar sayesinde mümkün oldu”, diye açıklıyor Pomaro.

Hala yapılacak çok şey var

Herkes, genellikle bir tedarikçinin müşteri hizmetleriyle arayüz oluşturmak amacıyla bir Chatbot kullanmıştır. Çoğunlukla bununla ilgili bazen sinir bozucu bile olan deneyimler bu da bana aptalca bir şeyle konuşuyormuşum hissini veriyor. Pomaro şöyle açıklıyor: “Kesinlikle sanal asistanlarla ilgili oldukça 'üzücü' bir dönem yaşadık, bu da bizi 'özür dilerim, anlamıyorum' yanıtlarının kurbanı haline getirdi ve bu sistemlere karşı kaçınılmaz bir güvensizliği tetikledi. Bunların hepsi olgunlaşmamış teknolojiden kaynaklandı. Daha sonra ne olduğunu gördük: Eğitim verilerinin yapısal gelişimi ve ölçeği sayesinde dil modelleri etkileyici bir hızla gelişti. Bugün, sanal asistanların geliştirilmesindeki üzücü parantezlerin, kullanıcılarla sadece yazılı sohbetler yoluyla değil aynı zamanda çok modlu bir şekilde etkileşim kurabilen sistemler üretecek, büyük esneklikle karakterize edilen bir parantez açmak için kapandığını söylemek isterim. birden fazla dilde görüntü, belge, ses alışverişi yoluyla. Yüksek Lisans, dil engelinin yıkılmasını kolaylaştırmamıza olanak tanıyacak”.

Yüksek Lisans ve ilgili teknolojiler geliştikçe, yeni olmayan ancak daha da büyüyen sorunlarla da uğraşmak zorundayız.

Çözülmesi gereken sorunlar

Her ilerleme biçimi sorunları beraberinde getirir ve Yüksek Lisans'lar da istisna değildir. Dil modelleri veriler (girdi) üzerinde çalışır ve eğitim aşamalarına rağmen istenmeyen etkilere sahip olabilir: “Madalyonun diğer yüzü risklerle temsil ediliyor ve Yüksek Lisans'ların karşı karşıya kaldığı, farklı alanlarda özetleyebileceğimiz zorluklar. Bengüvenilirliközellikle yüksek riskli durumlarda. Modeller kıyaslamalarda iyi performans gösterebilir ancak gerçek verilerle veya biraz değiştirilmiş girdilerle karşı karşıya kaldıklarında beklenmedik şekillerde başarısız olurlar. Orada mahremiyet: Yüksek Lisans'lar, hassas bilgiler içerebilecek çok büyük miktarda veriyi bir araya topladıklarından önemli gizlilik riskleri oluşturur.”

Sonra şu soru var telif hakkı en son haberlere atıfta bulunan: 2023'ün sonunda New York Times, OpenAI ve Microsoft'a dava açtı çünkü bunların yapay zekaları, telif hakkıyla korunan metnin bölümlerini kullanıyor ve yeniden üretiyor. Modellerin eğitildiği verilerden kaynaklanan önyargılara da değinen Pomaro, “Büyük olasılıkla telif hakkıyla korunan verilerle ilgili eğitimden kaynaklanan görüntüler üreten kullanıcılardan da çok sayıda şikayet görüyoruz” diye ekliyor.

Öğrenim görünüyorum

Yapay zeka ve politika: ChatGPT solcu, Google sağcı

kaydeden Bruno Ruffilli

14 Ağustos 2023

Açık kaynak ve Yüksek Lisans

Aslında LLM'lere erişmeyi ve kullanmayı kolaylaştıran Açık kaynaklı projeler var (örneğin The Cheshire Cat) ve bu, faydaların yanı sıra risklerin kapsamını da genişletebilir. Açık modellerin kullanımı nasıl düzenleniyor? Yüksek Lisans'ın etik sonuçlarının kontrolünü kaybetme riski var mı? Bunlar yanıtlanması gereken iki meşru soru: “Açık kaynak modellerinin Üretken Yapay Zekadan kaynaklanan riskleri artırabileceğine dair düşünce akımları var. Ancak açık temel modellerinin çeşitli nedenlerden dolayı güvenlik açısından önemlidir”diye açıklıyor Pomaro.

“Öncelikle, açık modeller çok büyük güvenlik araştırması miktarı son derece gerekli, ikinci olarak açık modeller şeffaflık ve doğrulanabilirlik sunar. Örneğin İnternet ekosisteminin büyük bir kısmı açık kaynaklı yazılımlara (Linux, Apache, MySQL vb.) dayanmaktadır ve bu onu daha güvenli hale getirmiştir. Jailbreak yapmanın kolaylığı veya güvenlik kontrollerini aşmayı amaçlayan eylemler göz önüne alındığında, mevcut modeller üzerinde çok az anlayışa ve kontrole sahip olduğumuz ve açık modellerin bizi bu riske maruz bıraktığı açıktır. Kritik altyapının tamamını kararsız sistemlere dayandırmadan önce bu hususun araştırma yoluyla çözülmesi gerekiyor.”

Açık kaynak modelleri uygunsuz bir şekilde kullanılabilir, ancak hakim olan, onları destekleyen ve gelişimlerini ve kullanımlarını düzenlemeye yardımcı olan toplulukların tutumlarıdır. “Aslında ister yapay zeka olsun ister diğer teknolojiler olsun açık kaynağın prensipleri aynıdır.”

Sorunların üstesinden gelmek için gerekenler

Devam eden değişimi kabul etmek ve yönetmek için gerekli bir kültürden sıklıkla bahsediyoruz. Hangisi kesinlikle doğru ama daha iyi anlaşılmayı hak ediyor: Bu kültürün gelişimini destekleyen şey nedir? “Bu sistemleri kaynaklar ve çıktılar arasındaki ilişkiler konusunda giderek daha güvenilir ve şeffaf hale getirecek teknolojik evrim. Eğitimi ve kullanımı düzenleyen yeni yönetişim sistemleri. Bu, araştırma ve geliştirmeyi sınırlamak değil, anlayışı artırmak ve hangi yönlerin mümkün olduğunu anlamaktır”, diye bitiriyor Pomaro.

Gelecek

Yapay zeka yaratıcılarını bile şaşırttığında ortaya çıkan davranışlar

kaydeden Andrea Daniele Signorelli

30 Mart 2023

Dil modelleri: nedir bunlar, neden onlar hakkında bu kadar çok konuşuluyor ve nasıl bir geleceğe sahip olacaklar

Suzan

New member