“Dil, birbirimizi anlamamıza, daha iyi bir gelecek için işbirliği yapmamıza ve diğer türlerden daha hızlı gelişmemize olanak tanıyarak insanın evrimini yönlendirdi. 25 yıllık yapay zeka araştırma deneyimimizi Cineca tarafından yönetilen hesaplama kapasitesiyle birleştirerek milyonlarca insanın hayatında çok güçlü bir etki yaratacak yapay zeka yaratacağız.” Marco konuşuyor TrompetYapay zeka (AI) dil çözümleri alanında küresel bir girişim olan Translated'in CEO'su, bugün ile anlaşma yaptığını duyurdu. Sinemadünyanın en büyük bilgi işlem merkezlerinden biri.
Özellikle, bu bir En iyi profesyonel çevirmenler gibi çeviri yapabilen bir yapay zeka yaratmaya yönelik araştırma projesi. Çeviri teknolojilerinin evrimi ve dillerin küresel erişilebilirliği konusunda ileri bir adımı temsil eden proje, Translated tarafından geliştirilen en gelişmiş dil modelinin dünyada eşi benzeri olmayan bir çeviri veri seti üzerinde eğitilmesini, Leonardo'yu kullanarak, dünyanın yedinci en güçlü süper bilgisayarı (Avrupa'da üçüncü), Bologna Tecnopolo'da Cineca tarafından yönetiliyor.
Sonuç, İtalyanca-İngilizce ve İngilizce-İtalyanca dil kombinasyonunda “açık kaynak” ve “açık ağırlıklar”la piyasaya sürülecek olan dünyadaki en gelişmiş dil modeli olacak ve böylece yeni bir dilin yaratılmasına yönelik önemli bir adım daha atılmış olacak. evrensel çevirmen.
Cineca'nın ve Leonardo süper bilgisayarının rolü
Cineca, Translated'in dil modeli eğitimini on milyon saatlik GPU eğitimiyle destekleyecek. Bu muazzam bilgi işlem kapasitesi, model eğitiminde önemli bir hızlanma sağlayarak hızlı ilerlemeyi sağlayacaktır. Translated tarafından sağlanan veri seti, 15 yıllık titiz bir derlemenin sonucudur ve yanlış çeviriler, revizyonlar ve anlaşmazlık durumunda çevirmenlerin ve redaktörlerin gerekçeleri gibi kapsamlı içeriğe sahip tüm belgeleri içermesi nedeniyle kendisini yaygın olarak kullanılan veri setlerinden açıkça ayırmaktadır. Bugün Translated'in Cineca'nın yardımıyla dilleri derinlemesine anlama yeteneğine sahip bir yapay zeka modeli geliştirmesine olanak tanıyan tam da bu zengin ve gelişmiş veri zenginliğidir.
İçin Francesco UbertiniCineca Başkanı “Bu işbirliği, süper bilgi işlemin yeniliği nasıl teşvik edebileceğinin, büyük bir sosyal etkiye sahip olabileceğinin ve küresel olarak insanlara nasıl fayda sağlayabileceğinin bir örneğidir. Ulusal ve küresel topluluğun yararına, dile uygulanan yapay zeka araştırmalarında böylesine önemli bir adım atan bir projede yer almaktan heyecan duyuyoruz.”
Dilsel model
Leonardo süper bilgisayarı tarafından eğitilecek dil modeli, Translated tarafından yenilikçi bir teknik kullanılarak geliştirildi. Düşünce Zinciri 2024 yılında gerçek üretim bağlamlarında küçük bir şirket grubuyla zaten test edilmiş olup, konuşma verilerini, aynı içerik üzerinde profesyonel çevirmenlerin yaptıklarından daha düşük bir hata oranıyla (bin kelimede üçten az) daha düşük bir hata oranıyla tercüme etme yeteneğini göstermiştir ve En gelişmiş makine çeviri sistemlerinden dört kat daha düşük.
Sayesinde Leonardo'nun hesaplama gücüTranslated ve Cineca, hata marjını bin kelime başına bir hataya düşürmeyi ve en iyi profesyonel çevirmenlerin ilk yüzdelik dilimiyle karşılaştırılabilecek bir doğruluk elde etmeyi planlıyor.
İtalyanca-İngilizce ve İngilizce-İtalyanca kombinasyonlarının ilk sürümünden sonra Translated, yeni modeli mevcut yapay zekası tarafından desteklenen 200 dilin tamamına genişletmeyi ve teknoloji gelişiminin küresel etkisini daha da genişletmeyi planlıyor.
Araştırma projesi geçen hafta Roma'da düzenlenen bir etkinlikte sunuldu. Dillerin Gücü – Evrensel Çevirmen'e DoğruTranslated'in 2000'li yılların başından beri katıldığı Avrupa Birliği hibeleriyle desteklenen ve çeviriyi desteklemek için giderek daha ileri teknolojilerin geliştirilmesine ve kullanılabilir hale getirilmesine olanak tanıyan üniversiteler ve araştırma merkezleriyle kamu-özel sektör işbirliklerinin bir parçasıdır. topluma.
Özellikle, bu bir En iyi profesyonel çevirmenler gibi çeviri yapabilen bir yapay zeka yaratmaya yönelik araştırma projesi. Çeviri teknolojilerinin evrimi ve dillerin küresel erişilebilirliği konusunda ileri bir adımı temsil eden proje, Translated tarafından geliştirilen en gelişmiş dil modelinin dünyada eşi benzeri olmayan bir çeviri veri seti üzerinde eğitilmesini, Leonardo'yu kullanarak, dünyanın yedinci en güçlü süper bilgisayarı (Avrupa'da üçüncü), Bologna Tecnopolo'da Cineca tarafından yönetiliyor.
Sonuç, İtalyanca-İngilizce ve İngilizce-İtalyanca dil kombinasyonunda “açık kaynak” ve “açık ağırlıklar”la piyasaya sürülecek olan dünyadaki en gelişmiş dil modeli olacak ve böylece yeni bir dilin yaratılmasına yönelik önemli bir adım daha atılmış olacak. evrensel çevirmen.
Cineca'nın ve Leonardo süper bilgisayarının rolü
Cineca, Translated'in dil modeli eğitimini on milyon saatlik GPU eğitimiyle destekleyecek. Bu muazzam bilgi işlem kapasitesi, model eğitiminde önemli bir hızlanma sağlayarak hızlı ilerlemeyi sağlayacaktır. Translated tarafından sağlanan veri seti, 15 yıllık titiz bir derlemenin sonucudur ve yanlış çeviriler, revizyonlar ve anlaşmazlık durumunda çevirmenlerin ve redaktörlerin gerekçeleri gibi kapsamlı içeriğe sahip tüm belgeleri içermesi nedeniyle kendisini yaygın olarak kullanılan veri setlerinden açıkça ayırmaktadır. Bugün Translated'in Cineca'nın yardımıyla dilleri derinlemesine anlama yeteneğine sahip bir yapay zeka modeli geliştirmesine olanak tanıyan tam da bu zengin ve gelişmiş veri zenginliğidir.
İçin Francesco UbertiniCineca Başkanı “Bu işbirliği, süper bilgi işlemin yeniliği nasıl teşvik edebileceğinin, büyük bir sosyal etkiye sahip olabileceğinin ve küresel olarak insanlara nasıl fayda sağlayabileceğinin bir örneğidir. Ulusal ve küresel topluluğun yararına, dile uygulanan yapay zeka araştırmalarında böylesine önemli bir adım atan bir projede yer almaktan heyecan duyuyoruz.”
Dilsel model
Leonardo süper bilgisayarı tarafından eğitilecek dil modeli, Translated tarafından yenilikçi bir teknik kullanılarak geliştirildi. Düşünce Zinciri 2024 yılında gerçek üretim bağlamlarında küçük bir şirket grubuyla zaten test edilmiş olup, konuşma verilerini, aynı içerik üzerinde profesyonel çevirmenlerin yaptıklarından daha düşük bir hata oranıyla (bin kelimede üçten az) daha düşük bir hata oranıyla tercüme etme yeteneğini göstermiştir ve En gelişmiş makine çeviri sistemlerinden dört kat daha düşük.
Sayesinde Leonardo'nun hesaplama gücüTranslated ve Cineca, hata marjını bin kelime başına bir hataya düşürmeyi ve en iyi profesyonel çevirmenlerin ilk yüzdelik dilimiyle karşılaştırılabilecek bir doğruluk elde etmeyi planlıyor.
İtalyanca-İngilizce ve İngilizce-İtalyanca kombinasyonlarının ilk sürümünden sonra Translated, yeni modeli mevcut yapay zekası tarafından desteklenen 200 dilin tamamına genişletmeyi ve teknoloji gelişiminin küresel etkisini daha da genişletmeyi planlıyor.
Araştırma projesi geçen hafta Roma'da düzenlenen bir etkinlikte sunuldu. Dillerin Gücü – Evrensel Çevirmen'e DoğruTranslated'in 2000'li yılların başından beri katıldığı Avrupa Birliği hibeleriyle desteklenen ve çeviriyi desteklemek için giderek daha ileri teknolojilerin geliştirilmesine ve kullanılabilir hale getirilmesine olanak tanıyan üniversiteler ve araştırma merkezleriyle kamu-özel sektör işbirliklerinin bir parçasıdır. topluma.