Eğitimli 1,5 trilyon kelimeİtalyan büyük dil modellerinin güvenlik standardını yükseltmeyi amaçlıyor. Ailenin son versiyonu 26 Kasım sabahı Roma Sapienza Üniversitesi'nde tanıtıldı MinervaCapitoline üniversitesinin yapay zeka dil modeli. Kesin olarak söylemek gerekirse, bu 7B'dir ve Leonardo süper bilgisayarını kullanıma sunan Cineca ile işbirliği içinde FAIR (Geleceğin Yapay Zeka Araştırması) projesi kapsamında geliştirilmiştir.
Minerva'lar LLM'dir İtalyan dili için “sıfırdan” eğitim verildi. Bilgisayar Mühendisliği Bölümü'nde doğal dil işleme profesörü Roberto Navigli liderliğindeki Sapienza NLP (Doğal Dil İşleme) araştırma grubu tarafından oluşturulan plan, Pnrr fonları sayesinde yapay zekaya ilişkin ulusal stratejinin bir parçası.
Minerva 7B'nin özellikleri
Navigli'nin bir demoyla gösterdiği gibi Minerva 7B, geçen Nisan ayında çevrimiçi hale getirilen versiyondan daha güçlü bir versiyon. 7 milyar parametre öncekinin 3'üne karşı ve dolayısıyla metinleri ezberleme ve yeniden detaylandırma konusunda daha büyük kapasiteye sahip, her zaman açık veri kaynaklarına (veya daha doğrusu internetten alınan ancak korumalı veritabanlarından alınmayan veya telif hakkı kapsamında açıkça kapsanmayan metinlere) dayanan, Yüksek Lisans panoramasında ayırt edici bir unsur. Beş aydan fazla süren aralıksız çalışmanın ardından araştırma ekibi, yaklaşık 1,5 trilyon kelimeye karşılık gelen toplam iki trilyondan (binlerce milyar) fazla jeton içeren bu yeni sürüme ulaştı. Minerva 7B, özellikle İtalyanca olarak oluşturulan yeni bir talimat karışımıyla “talimat ayarlama”, yapay zeka modellerine yönelik, talimatları takip etme ve kullanıcıyla İtalyanca konuşma yeteneği sağlamayı amaçlayan ileri düzey bir eğitim tekniğidir.
Söylentiler
ChatGpt yavaşlıyor. Ve diğer yapay zekalar da biraz yavaşlıyor
kaydeden Pier Luigi Pisa
13 Kasım 2024
Daha az halüsinasyon, uygunsuz içerik yok
Bu teknik sayesinde Minerva, istekleri daha iyi yorumlayabiliyor ve daha alakalı, tutarlı ve bağlama uyarlanmış yanıtlar üretebiliyor; bu sistemlerin karşılaştığı sözde halüsinasyonlardan ve kaba, cinsel içerik üretiminden mümkün olduğunca kaçınıyor. , ayrımcı ve duyarlı. Bu, özellikle Sapienza ekibinin araştırmacıları tarafından hissedilen, tüm chatbotları ilgilendiren çok önemli bir konudur.
Yapay zeka
İtalyan AI'ya doğru: İtalya, “ulusal” LLM başlattı
kaydeden Vittorio Emanuele Orlando
06 Haziran 2024
Navigli: “Minerva kalıcı bir laboratuvardır”
Roma sunumunda Sapienza Üniversitesi rektörü Antonella Polimeni, Fuar başkanı Giuseppe De Pietro ve Cineca genel müdürü Alessandra Poggiani vardı. Navigli, demo sırasında modelle bir hikaye yazma, kısa bir metni tercüme etme ve özetleme talebi de dahil olmak üzere birçok konuşmayı gösterdi ve modelin hassas veya ayrımcı içerik oluşturabilecek taleplere karşı dayanıklılığını gösterdi. “Taahhüdümüz, çalışmaya devam etmektir” bir tür kalıcı laboratuvarda güvenliği ve konuşma özelliklerini en üst düzeye çıkarınBugünkü yayınımızın bir dönüm noktası değil, bir dönüm noktası olduğunun bilimsel farkındalığıyla başlangıç noktası – proje yöneticisinin altını çiziyor – hem dil ön eğitimi hem de konuşmalar ve talimatlar için İtalyanca'da kaliteli verinin azlığı, önümüzdeki aylarda ele almayı planladığımız temel konulardan biridir. Bu perspektiften bakıldığında projenin yeni işbirliklerine açılarak büyüyebileceğini umuyoruz. yayıncılık dünyası Ve kamu kurumları Minerva'nın kurumsal ortamlarda kullanımı için. Minerva, kullanıcıların kullanımına uygun, tamamen açık ilk ve bugüne kadarki tek modeldir. Kamu idareleritam da kaynakların ve eğitim sürecinin şeffaflığı nedeniyle. Ayrıca, Yüksek Lisans'ın daha güçlü ve sofistike endüstriyel versiyonları ve uygulamaları üzerinde yoğun bir şekilde çalışan Sapienza'nın başarılı bir yan ürünü olan Babelscape sayesinde gerçekleşen teknolojik transferden büyük gurur duyuyorum.”
Minerva'yı nerede deneyebilirim?
Modele https://minerva-llm.org adresinden ulaşılabilmektedir ve önümüzdeki haftalarda indirilmeye hazır olacaktır. Test aşaması doğal olarak önümüzdeki günlerde yapılacak görüşmelere dayanarak daha fazla iyileştirme yapılmasına olanak tanıyacak. Minerva ile bazı fikir alışverişinde bulunmaya çalıştık ve güncel olaylar, programlama ve tariflerden ev otomasyonu için kod parçalarına kadar mevcut bağlamla ilgisi olmayan diğer daha geniş sorular hakkında bizi tam olarak takip edemiyorsa, çok iyi çalışıyor. Navigli, “Karşılaştırma koşullarının büyük şirketlerin modelleri olduğunu unutmamalıyız: Trilyonlarca parametre, örneğin ChatGPT durumunda,” dedi. İtalyan Teknolojisi – birçok endüstriyel uygulama için hala geçerli bir sayı olan 7'ye sahibiz. Güncel olaylara dair birçok konuda, 2023'e kadar eğitim almış olmasına rağmen, belki de güncel olmayan cevaplar verebiliyor. açıkça yönlendirilinceye kadar (örneğin Konsey Başkanlığı durumunda, “başkanın” kim olduğunu sormak yeterlidir ve model, Mario Draghi'den Giorgia Meloni, ed.'ye cevap verir). Her şeyden önce ilgilendiğimiz şey güvenlikti. Hassas bir görüşme tespit ettiğinde yanıt vermeyi reddeder ve sohbeti kapatır. Bu anlamda İtalya için kesinlikle bir yenilik.”.
“Birçok şirket, örneğin Almawave ve Fastweb gibi İtalyanca modellerin piyasaya sürüleceğini duyurdu. akademik araştırma dünyası en ileri alanlarda yaşıyor ve hızla ilerleyebilir – yönetici açıklıyor – web bağlantısı da gelecek ve bu da en son araştırmaları ve aynı zamanda araştırmaları güçlendirecek çok modlulukörneğin görüntüleri istem olarak alma ve bunları çıktı veya çapraz referans olarak üretme yeteneği. Gelecek yıldan itibaren AI Fair genişletilmiş ortaklık projesinde diğer üniversitelerden meslektaşlarımızla birlikte bunun üzerinde çalışacağız.”
Yakın geleceğe yönelik planlara gelince: “Model doğal olarak açık ancak kullanıcı konuşmalarının modeli daha da geliştirmek için değerli olduğu bir yumuşak lansman aşamasındayız. Önümüzdeki birkaç hafta içinde indirilebilir hale gelecektir. Ve biz de şunu düşünüyoruz özel bir uygulama”.
Rektör Polimeni, “La Sapienza'nın teknolojik ve bilimsel araştırma alanında uzun bir mükemmellik geleneği var” diye ekledi, son yıllarda yapay zeka gibi stratejik sektörlerde ileri becerilerin geliştirilmesine ve disiplinler arası bir yaklaşımın teşvik edilmesine olan bağlılığımızı güçlendirdik. akademik titizliği inovasyon odaklı bir vizyonla birleştiren. Minerva projesiyle misyonumuzu doğruluyoruz: toplumun ve geleceğin hizmetinde inovasyon ve ilerlemenin itici gücü olmak”.
Yapay Zekada sayılan 500 İtalyan erkek ve kadın
Italian Tech editör ekibi tarafından düzenlendi
19 Mart 2024
Minerva'lar LLM'dir İtalyan dili için “sıfırdan” eğitim verildi. Bilgisayar Mühendisliği Bölümü'nde doğal dil işleme profesörü Roberto Navigli liderliğindeki Sapienza NLP (Doğal Dil İşleme) araştırma grubu tarafından oluşturulan plan, Pnrr fonları sayesinde yapay zekaya ilişkin ulusal stratejinin bir parçası.
Minerva 7B'nin özellikleri
Navigli'nin bir demoyla gösterdiği gibi Minerva 7B, geçen Nisan ayında çevrimiçi hale getirilen versiyondan daha güçlü bir versiyon. 7 milyar parametre öncekinin 3'üne karşı ve dolayısıyla metinleri ezberleme ve yeniden detaylandırma konusunda daha büyük kapasiteye sahip, her zaman açık veri kaynaklarına (veya daha doğrusu internetten alınan ancak korumalı veritabanlarından alınmayan veya telif hakkı kapsamında açıkça kapsanmayan metinlere) dayanan, Yüksek Lisans panoramasında ayırt edici bir unsur. Beş aydan fazla süren aralıksız çalışmanın ardından araştırma ekibi, yaklaşık 1,5 trilyon kelimeye karşılık gelen toplam iki trilyondan (binlerce milyar) fazla jeton içeren bu yeni sürüme ulaştı. Minerva 7B, özellikle İtalyanca olarak oluşturulan yeni bir talimat karışımıyla “talimat ayarlama”, yapay zeka modellerine yönelik, talimatları takip etme ve kullanıcıyla İtalyanca konuşma yeteneği sağlamayı amaçlayan ileri düzey bir eğitim tekniğidir.
Söylentiler
ChatGpt yavaşlıyor. Ve diğer yapay zekalar da biraz yavaşlıyor
kaydeden Pier Luigi Pisa
13 Kasım 2024
Daha az halüsinasyon, uygunsuz içerik yok
Bu teknik sayesinde Minerva, istekleri daha iyi yorumlayabiliyor ve daha alakalı, tutarlı ve bağlama uyarlanmış yanıtlar üretebiliyor; bu sistemlerin karşılaştığı sözde halüsinasyonlardan ve kaba, cinsel içerik üretiminden mümkün olduğunca kaçınıyor. , ayrımcı ve duyarlı. Bu, özellikle Sapienza ekibinin araştırmacıları tarafından hissedilen, tüm chatbotları ilgilendiren çok önemli bir konudur.
Yapay zeka
İtalyan AI'ya doğru: İtalya, “ulusal” LLM başlattı
kaydeden Vittorio Emanuele Orlando
06 Haziran 2024
Navigli: “Minerva kalıcı bir laboratuvardır”
Roma sunumunda Sapienza Üniversitesi rektörü Antonella Polimeni, Fuar başkanı Giuseppe De Pietro ve Cineca genel müdürü Alessandra Poggiani vardı. Navigli, demo sırasında modelle bir hikaye yazma, kısa bir metni tercüme etme ve özetleme talebi de dahil olmak üzere birçok konuşmayı gösterdi ve modelin hassas veya ayrımcı içerik oluşturabilecek taleplere karşı dayanıklılığını gösterdi. “Taahhüdümüz, çalışmaya devam etmektir” bir tür kalıcı laboratuvarda güvenliği ve konuşma özelliklerini en üst düzeye çıkarınBugünkü yayınımızın bir dönüm noktası değil, bir dönüm noktası olduğunun bilimsel farkındalığıyla başlangıç noktası – proje yöneticisinin altını çiziyor – hem dil ön eğitimi hem de konuşmalar ve talimatlar için İtalyanca'da kaliteli verinin azlığı, önümüzdeki aylarda ele almayı planladığımız temel konulardan biridir. Bu perspektiften bakıldığında projenin yeni işbirliklerine açılarak büyüyebileceğini umuyoruz. yayıncılık dünyası Ve kamu kurumları Minerva'nın kurumsal ortamlarda kullanımı için. Minerva, kullanıcıların kullanımına uygun, tamamen açık ilk ve bugüne kadarki tek modeldir. Kamu idareleritam da kaynakların ve eğitim sürecinin şeffaflığı nedeniyle. Ayrıca, Yüksek Lisans'ın daha güçlü ve sofistike endüstriyel versiyonları ve uygulamaları üzerinde yoğun bir şekilde çalışan Sapienza'nın başarılı bir yan ürünü olan Babelscape sayesinde gerçekleşen teknolojik transferden büyük gurur duyuyorum.”
Minerva'yı nerede deneyebilirim?
Modele https://minerva-llm.org adresinden ulaşılabilmektedir ve önümüzdeki haftalarda indirilmeye hazır olacaktır. Test aşaması doğal olarak önümüzdeki günlerde yapılacak görüşmelere dayanarak daha fazla iyileştirme yapılmasına olanak tanıyacak. Minerva ile bazı fikir alışverişinde bulunmaya çalıştık ve güncel olaylar, programlama ve tariflerden ev otomasyonu için kod parçalarına kadar mevcut bağlamla ilgisi olmayan diğer daha geniş sorular hakkında bizi tam olarak takip edemiyorsa, çok iyi çalışıyor. Navigli, “Karşılaştırma koşullarının büyük şirketlerin modelleri olduğunu unutmamalıyız: Trilyonlarca parametre, örneğin ChatGPT durumunda,” dedi. İtalyan Teknolojisi – birçok endüstriyel uygulama için hala geçerli bir sayı olan 7'ye sahibiz. Güncel olaylara dair birçok konuda, 2023'e kadar eğitim almış olmasına rağmen, belki de güncel olmayan cevaplar verebiliyor. açıkça yönlendirilinceye kadar (örneğin Konsey Başkanlığı durumunda, “başkanın” kim olduğunu sormak yeterlidir ve model, Mario Draghi'den Giorgia Meloni, ed.'ye cevap verir). Her şeyden önce ilgilendiğimiz şey güvenlikti. Hassas bir görüşme tespit ettiğinde yanıt vermeyi reddeder ve sohbeti kapatır. Bu anlamda İtalya için kesinlikle bir yenilik.”.
“Birçok şirket, örneğin Almawave ve Fastweb gibi İtalyanca modellerin piyasaya sürüleceğini duyurdu. akademik araştırma dünyası en ileri alanlarda yaşıyor ve hızla ilerleyebilir – yönetici açıklıyor – web bağlantısı da gelecek ve bu da en son araştırmaları ve aynı zamanda araştırmaları güçlendirecek çok modlulukörneğin görüntüleri istem olarak alma ve bunları çıktı veya çapraz referans olarak üretme yeteneği. Gelecek yıldan itibaren AI Fair genişletilmiş ortaklık projesinde diğer üniversitelerden meslektaşlarımızla birlikte bunun üzerinde çalışacağız.”
Yakın geleceğe yönelik planlara gelince: “Model doğal olarak açık ancak kullanıcı konuşmalarının modeli daha da geliştirmek için değerli olduğu bir yumuşak lansman aşamasındayız. Önümüzdeki birkaç hafta içinde indirilebilir hale gelecektir. Ve biz de şunu düşünüyoruz özel bir uygulama”.
Rektör Polimeni, “La Sapienza'nın teknolojik ve bilimsel araştırma alanında uzun bir mükemmellik geleneği var” diye ekledi, son yıllarda yapay zeka gibi stratejik sektörlerde ileri becerilerin geliştirilmesine ve disiplinler arası bir yaklaşımın teşvik edilmesine olan bağlılığımızı güçlendirdik. akademik titizliği inovasyon odaklı bir vizyonla birleştiren. Minerva projesiyle misyonumuzu doğruluyoruz: toplumun ve geleceğin hizmetinde inovasyon ve ilerlemenin itici gücü olmak”.
Yapay Zekada sayılan 500 İtalyan erkek ve kadın
Italian Tech editör ekibi tarafından düzenlendi
19 Mart 2024