Kaynak: Zero State LT, Yazar: Zhuo Xinyue, Editör: Hu Zhanjia
Büyük model konseptten uygulamaya ne kadar hızlı geçiyor?
Teknoloji çemberinde son dönemin en dikkat çekici etkinliği olan 2023 Dünya Yapay Zeka Konferansı (WAIC 2023), herkesi şoke eden bir cevap verdi: Yarım yıl! Hiçbir teknolojik parkur için yarım yıl çok uzun bir süre değil ve hatta bazı parkurlar henüz “bebeklik” aşamasında ama büyük ölçekli model parkuru bu kadar kısa bir sürede konseptten uygulamaya kadar olan süreci tamamlamış durumda.
Bu yılın ilk çeyreğinde sektör hala "olur mu olmaz mı" sorusunu tartışıyordu. İkinci çeyrekte, çeşitli büyük üreticilerin büyük modeller yapmak için bir araya gelme eğilimi, oyuncuların "nasıl yapılır" cevabını vermesi yönünde. .
Bu yanıt, özünde, WAIC konferansına katılan 30'dan fazla büyük ölçekli model üreticisi tarafından odaklandı - önce teknik sorunları çöz, ardından sahne uygulaması ve son olarak ticari ve ölçekli.
"Önceden, yapay zekanın uygulanmasındaki zorluklar otonom sürüş alanı gibi teknik düzeyde daha fazlaydı. Uzun yıllardır geliştirildi, ancak ticarileştirme hala oyuncuların şafağı görmesini engelliyor." WAIC konferansını ziyaret ettikten sonra: "Göreceli Ancak, büyük modeller için pazar rekabetinin daha yoğun olacağı belirtilmelidir."
Bu WAIC konferansında aralarında Baidu, Tencent, Ali, Huawei ve JD.com gibi devlerin yanı sıra SenseTime ve NetEase gibi dikey alanlardaki oyuncuların da bulunduğu 30'dan fazla şirket "kaslarını göstermeye" odaklandı.
Bu sırada, ülkemin ilk büyük ölçekli model standardizasyon görev gücünün liderinin Şanghay Yapay Zeka Laboratuvarı ve Baidu, Huawei, Ali ve diğer şirketler tarafından ortaklaşa düzenlendiği haberi çıktı. Kısa listeye giren bu ilk şirketler grubuna ayrıca " Milli Takım" unvanı. ** "Milli takım" liderliğindeki daha yüksek boyutlu, büyük ölçekli model bir PK savaşının resmen başladığına dair çeşitli işaretler var. **
"Grup model dansı"ndan "milli takım lideri"ne
Bu yılın başından bu yana, büyük modeller şüphesiz teknolojinin en sıcak noktası haline geldi ve kısa sürede çeşitli şirketlerin "ana teması" haline geldi. Görünüşe göre hiçbir büyük üretici, buna dahil olmayacağını açıkça söylemeye cesaret edemiyor. Eksik istatistiklere göre, bu yılın ilk yarısında büyük ölçekli modeller üreteceğini resmen açıklayan yüze yakın şirket vardı.
Ali, Baidu, Tencent, ByteDance ve JD.com gibi büyük İnternet şirketleri, iFlytek ve SenseTime tarafından temsil edilen AI şirketleri ve Kidswant gibi eğitim şirketleri tarafından temsil edilen çeşitli sektörler ve Huashun Companies gibi finans şirketleri birbiri ardına oyuna girdiler. .
Buna ek olarak, ülkede yapay zeka büyük ölçekli modeller işine başlama konusunda hızlı bir artış var.Birçok teknoloji devi, yönetici ve büyük üreticilerin eski yöneticileri, yeni bir iş kurmak için kendilerini büyük ölçekli modellere adadı. Örneğin, orijinal Meituan'ın kurucu ortağı Wang Huiwen, AI büyük modeline yüksek profille girdi (şu anda şirket tarafından kurulan "Light Years Beyond", Meituan tarafından satın alındı); Li Kaifu, Innovation Works CEO'su, Sohu'nun kurucusu Wang Xiaochuan ve eski JD.com AI iş öncüsü Zhou Bowen ve diğerleri, AI büyük modellerinin girişimci dalgasına katıldı. Bu sahne o zamanki "Bin Alay Savaşı" kadar muhteşem olmasa da yapay zeka + çözümlerinin son derece yüksek teknik eşiklerini gerektiren büyük ölçekli bir model parkuru için dış dünyayı şaşırtmaya yetiyor.
Son yıllarda, B'ye giden yol son derece sıcaktı ve işletmelerin dijital dönüşüm ve yükseltme talebi giderek daha güçlü hale geldi ve maliyetlerin düşürülmesi ve verimliliğin artırılması da işletmelerin temel talepleri. Sektördeki birçok kişi bile, büyük ölçekli modellerin teknoloji çemberinde kademeli büyüme için en umut verici alan haline geldiğine inanıyor. Ve bu, büyük modellerin hızlı popülaritesinin nedenlerinden biri haline geldi.
**6-8 Temmuz tarihlerinde Şangay'da düzenlenen WAIC konferansında, 30'dan fazla büyük ölçekli model şirketi, aynı zamanda endüstrinin gelişmesinde bir dönüm noktası haline gelen büyük ölçekli model düzeyinde düzeni ve başarıları sergilemek için yarıştı. . **
Çin'de All In yapay zekasını duyuran ilk üretici olan Baidu, konferansta "belediye binasının hazinelerinden" biri olan Wenxinyi tarzını sergileyerek sergi salonuna giren herkesin herkesin "P- resim". Huawei, donanım tarafındaki temel bilgi işlem gücünü göstermek için Atlas 900 PoD A2'yi sahneye taşıdı; Alibaba Cloud alt forumunda "Tongyi Ailesi", Ali The Third olan bir AI boyama modeli "Tongyi Wanxiang" ekledi. üç ay sonra duyurulan büyük model ürün.
Sektörün büyük modellere olan merakı “milli takım”ın kurulmasını hızlandırdı.
7 Temmuz'da WACI 2023 konferansında, Ulusal Standartlar Komitesi rehberliğinde ulusal yapay zeka standardizasyonu, ülkemin ilk büyük ölçekli model standardizasyon görev gücünün liderinin Şanghay Yapay Zeka Laboratuvarı ve Baidu tarafından ortaklaşa gerçekleştirileceğini duyurdu. Huawei, Ali ve diğer işletmeler. O zamandan beri, büyük modellerin "milli takımı" toplandı.
Aslında, bu yılın Mayıs ayı başlarında, ülke büyük modellerin standardizasyonu ile ilgili çalışmalara başladı.Yeni oluşturulan özel grup, büyük modellerin ve standardizasyon uygulamalarının kombinasyonunu teşvik etmek amacıyla büyük modellerin standardizasyonunu üstlenecek. ve yapay zeka endüstrisinin gelişiminin teşvik edilmesi, sağlıklı büyüme. O zamandan beri, altı aydır gürültülü olan büyük ölçekli model pisti, standardizasyona doğru ilerleyeceğini resmen açıkladı.
Devler "yarışıyor", pist yarışması yüksek boyutlu savaşa giriyor
2023 Dünya Yapay Zeka Konferansı'nda büyük model "birinci sınıf" olmayı hak ediyor.
Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi ve 30'dan fazla büyük ölçekli modelin tümü tanıtıldı. Konferans alanında devler birbiri ardına konseptten vazgeçtiler, bir adım daha yaklaştılar ve her şirketin başarılarını sergilediler.
7 Temmuz öğleden sonra, Huawei Geliştirici Konferansı 2023'te (Bulut), Huawei İcra Direktörü ve Huawei Cloud CEO'su Zhang Pingan, Huawei Cloud Pangu Model 3.0'ın resmi olarak piyasaya sürüldüğünü duyurdu. Ayrıca Huawei'nin "Pangu modelinin çok meşgul, işlerle meşgul ve şiir yazmaya vakti yok." Bu hamle, daha önce çıkan modelin basın toplantısında şiir ve düzyazı yazmayı da sevdiğini ima etmek olarak değerlendiriliyor. Çünkü Huawei, Pangu büyük modelini, ses büyük model düzeyine odaklanmak yerine finans, devlet işleri, madencilik, meteoroloji vb. gibi çeşitli sektörlere yardımcı olmak için kullanmayı umuyor.
Şimdiye kadar Pangu büyük modelinin meteoroloji, tıbbi araştırma ve geliştirme, elektrik gücü, dil ve diğer alanlarda uygulandığı ve yüz milyarlarca parametreye sahip çok sayıda büyük model sunduğu söyleniyor.
Alibaba Cloud'un CTO'su Zhou Jingren, "öncelikli hedefin Çin'in büyük ölçekli model ekolojisinin refahını teşvik etmek ve büyük ölçekli yeni kurulan şirketlere çok yönlü hizmetler sağlamak olacağını" belirtti. Açıkçası, bu, Alibaba Cloud tarafından önerilen MaaS (Hizmet Olarak Model) konseptini devam ettiriyor.
Baidu erken bir oyuncu ve Wenxin büyük ölçekli modeli her zaman endüstrinin dikkatini çekmiştir. Bu konferansta, Baidu Baş Teknoloji Sorumlusu Wang Haifeng, Baidu'nun artık Wenxin Model 3.5'e yükseltildiğini söyledi. Etki %50 artar, eğitim hızı 2 kat artar ve muhakeme hızı 30 kat artar.
"Milli takım" haberlerinin yanı sıra Tencent gibi büyük internet şirketleri de büyük modellerin konsept aşamasından uygulamaya geçiş sürecini hızlandırıyor.
Geçtiğimiz 20 gün içinde Tencent'in büyük modelle ilgili ağır haberleri sık sık yayıldı. 19 Haziran'da büyük modeller hakkındaki düşüncelerini ilk kez kamuoyuna açıkladı. 26 Haziran'da kendi geliştirdiği Xingmai yüksek performanslı bilgi işlem ağını ilk kez açıkladı. 7 Temmuz'da Tencent Cloud başkan yardımcısı Wu Yunsheng ve Tencent Cloud Intelligence başkanı, uygulama yeniliği açısından, Tencent Cloud'un büyük ölçekli endüstri modeli yeteneklerinin finansal risk kontrolü, etkileşimli çeviri ve akıllı uygulamaların verimliliğini artıran dijital akıllı müşteri hizmetleri gibi senaryolara uygulandığını tanıttı.
** Görüldüğü gibi hızlı üretici akını ile yerli büyük ölçekli modeller hızla konsept aşamasını geçmiş ve artık her firma nasıl hayata geçirilip ticarileştirileceğine odaklanmıştır. **
Halihazırda başlamış olan yükseliş savaşında eşik yükselmiş, zorluk kat kat artmıştır. Bu, herhangi bir üretici için küçük bir zorluk değildir.
Büyük modelin "yüksek zemininin" doğru duruşunu yakalamak için "hacmi" her yöne açın
Aslında büyük model çok sevilse de oyuna girmesinden fiilen inip piyasaya sürmesine kadar oldukça zor ve şimdiden birçok zorluk ortaya çıktı. Finansman, yetenekler, altyapı, senaryolar ve ticarileştirme, her oyuncunun üstesinden gelmesi gereken bir "engel yarışı" haline geldi.
Büyük modellerin geliştirilmesinin ilk aşamasında, sektördeki bazı kişiler "büyük modellerin büyük üreticilerin oyunu olduğunu" söyleyerek "büyük modellerin çok pahalı olduğunu" ve yalnızca büyük üreticilerin bunu karşılayabileceğini ima etti. Titanium Media'nın eksik istatistiklerine göre 2022'de Ar-Ge harcamalarına 161,5 milyar yuan yatırım yapacak olan Huawei, en çok Ar-Ge yatırımı yapan şirket olurken, onu 61,4 milyar yuan ile Tencent ve 55,5 milyar yuan ile Alibaba takip ediyor. Baidu, son on yılda AI alanında 100 milyar yuan'dan fazla yatırım yaptı. Büyük İnternet üreticilerinin Ar-Ge'ye yaptığı yıllık yatırım, onların güçlü bir Ar-Ge ekibine sahip olmalarını ve büyük ölçekli model parkurunda hak ettikleri bir "ilk kademe" haline gelmelerini sağladı.
Ama karşılığında hiçbir şey beklemeden körü körüne koyamazlar. Mevcut dinamiklere bakılırsa, hepsi sektörün uygulanmasını hızlandırıyor. Araştırma ve geliştirmeye güçlü fonlar yatırılır, mümkün olan en kısa sürede ticarileştirilir ve ardından yapay zeka modellerinin geliştirilmesine ve eğitimine yatırılır - bu, büyük ölçekli model oyuncularını destekleyen bir döngüdür.
Tıpkı Tencent'in başkan yardımcısı ve Tencent'in hükümet ve kurumsal iş birimi başkanı Li Qiang'ın dediği gibi: "Büyük modeller çağında, veri, ağ ve bilgi işlem gücü, altyapının 'demir üçgenini' oluşturur." Aynı zamanda, "Dikey endüstriler için modeller, büyük ölçekli modellerin değerinin taşma noktası olacaktır." Bunun anlamı, sermaye ve teknolojinin, büyük ölçekli modele girmek için yalnızca gerekli koşullar ve ivme olduğudur. endüstri ve asıl vurgu hala iniş seviyesinde.
Yetenek, büyük ölçekli maket çıkarma yarışmasının son derece önemli bir parçasıdır.
Bu yılın ilk çeyreğinde çeşitli şirketler bir "yetenek savaşı" başlattı. O sırada Wang Huiwen, en iyi Ar-Ge yeteneklerini davet etmek için hisselerin %75'ini almaya istekli olduğunu ifade etti ve Li Kaifu dünya çapında birinci sınıf yetenekleri işe almak için çağrıda bulundu. Baidu, AI büyük ölçekli model algoritma mühendislerini işe almaya istekli. aylık 25-40k maaş Büyük ölçekli model eğitim ve algoritma mühendisleri işe almak için aylık 40-70k maaş. Aynı zamanda bir işe alım sitesinde büyük ölçekli model ürünlerin ve operasyon pozisyonlarının maaşları aylık 35-60 bin maaş seviyesine ulaşmıştır.
İkinci olarak, algoritmalar, bilgi işlem gücü ve veriler gibi "altyapı", büyük modelin hâlâ en önemli önceliğidir. Yurt içi ve yurt dışında 10 büyük yapay zeka modelinin ilgili kurumlar tarafından değerlendirilmesine göre genel olarak yerli büyük modeller kelime anlama ve bilgi soruları açısından yabancı modelleri yani yerli yapay zeka büyük modelleri geride bırakıyor. [gf] 2f42[/gf]Karakterlerin temel bilişi ve öğrenme yeteneği [gf] 2f12[/gf] daha güçlü. Ancak aynı zamanda, veri düzeyinde büyük modellerin geliştirilmesinin yüksek kaliteli eğitim veri setleri gerektirdiğini de belirtmek gerekir.
Hesaplama gücü açısından Ali, Baidu, Tencent, Huawei gibi bazı önde gelen teknoloji firmaları ülkemde veri merkezlerinin yapımını tamamlamış, SenseTime ve Megvii gibi dikey alanlardaki oyuncular ciddi yatırımlar yapmış olsalar da hala çok fazla kapasite İyileştirme için çok az yer var.
Son olarak, iniş senaryoları ve ticarileştirme var.
Farklı alt bölümleme senaryolarında ve farklı endüstrilerde yüksek ticarileştirme maliyeti de endüstrinin karşılaştığı yaygın bir sorundur. Büyük bir modelin eğitim maliyetinin 2 milyon ABD Doları ile 12 milyon ABD Doları arasında olduğu tahmin edilmektedir.Genel olarak, büyük yapay zeka modellerinin ticari olarak gerçekleştirilmesi zaman alacaktır.
Daha pragmatik üreticiler bazı güçlü yönlerine odaklanmayı tercih ediyor. Örneğin, Tencent finans ve eğitim alanlarında açılışta başı çekti ve tek noktadan MaaS hizmeti işletmelerin üzerindeki yükü azalttı; Baidu Wenxin'in büyük modelinin yükseltilmesinden sonra maliyet geçmişe göre %10'a düşürüldü. Baidu Smart Cloud şimdiye kadar 300'den fazla ekolojik ortakla 400'den fazla senaryoda iyi test sonuçları elde etti. Huawei, kendi devlet ve işletme alanlarında yoğun bir şekilde çalışmaya başladı...
Gelecekle ilgili bu büyük model savaşının tüm hızıyla devam ettiği görülüyor.
Sonuna yaz
"Grup modeli savaşı" altında, herhangi bir oyuncu fırsatı değerlendirmelidir ve birçok kişi bunu zamanın bir bonusu olarak görür. Bu anlaşılabilir bir durumdur, giderek daha rekabetçi hale gelen bu yolda, birçok zorluk olmasına rağmen, yerli büyük ölçekli modeller hala daha eksiksiz ve pragmatik bir teknik yöne ve ticarileşmeye doğru ilerliyor. ** Canlı ve pratik olan bu tür bir endüstri rekabeti durumu, ülkemin büyük ölçekli model teknolojisinin gelişme hızını artıracak ve Çin'in yapay zeka endüstrisinin genel teknolojik yükseltmesini destekleyecektir. **
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
30 şirket WAIC için yarışıyor: büyük modeller yüksek boyutlu savaşa giriyor
Kaynak: Zero State LT, Yazar: Zhuo Xinyue, Editör: Hu Zhanjia
Teknoloji çemberinde son dönemin en dikkat çekici etkinliği olan 2023 Dünya Yapay Zeka Konferansı (WAIC 2023), herkesi şoke eden bir cevap verdi: Yarım yıl! Hiçbir teknolojik parkur için yarım yıl çok uzun bir süre değil ve hatta bazı parkurlar henüz “bebeklik” aşamasında ama büyük ölçekli model parkuru bu kadar kısa bir sürede konseptten uygulamaya kadar olan süreci tamamlamış durumda.
Bu yılın ilk çeyreğinde sektör hala "olur mu olmaz mı" sorusunu tartışıyordu. İkinci çeyrekte, çeşitli büyük üreticilerin büyük modeller yapmak için bir araya gelme eğilimi, oyuncuların "nasıl yapılır" cevabını vermesi yönünde. .
Bu yanıt, özünde, WAIC konferansına katılan 30'dan fazla büyük ölçekli model üreticisi tarafından odaklandı - önce teknik sorunları çöz, ardından sahne uygulaması ve son olarak ticari ve ölçekli.
"Önceden, yapay zekanın uygulanmasındaki zorluklar otonom sürüş alanı gibi teknik düzeyde daha fazlaydı. Uzun yıllardır geliştirildi, ancak ticarileştirme hala oyuncuların şafağı görmesini engelliyor." WAIC konferansını ziyaret ettikten sonra: "Göreceli Ancak, büyük modeller için pazar rekabetinin daha yoğun olacağı belirtilmelidir."
Bu WAIC konferansında aralarında Baidu, Tencent, Ali, Huawei ve JD.com gibi devlerin yanı sıra SenseTime ve NetEase gibi dikey alanlardaki oyuncuların da bulunduğu 30'dan fazla şirket "kaslarını göstermeye" odaklandı.
Bu sırada, ülkemin ilk büyük ölçekli model standardizasyon görev gücünün liderinin Şanghay Yapay Zeka Laboratuvarı ve Baidu, Huawei, Ali ve diğer şirketler tarafından ortaklaşa düzenlendiği haberi çıktı. Kısa listeye giren bu ilk şirketler grubuna ayrıca " Milli Takım" unvanı. ** "Milli takım" liderliğindeki daha yüksek boyutlu, büyük ölçekli model bir PK savaşının resmen başladığına dair çeşitli işaretler var. **
"Grup model dansı"ndan "milli takım lideri"ne
Bu yılın başından bu yana, büyük modeller şüphesiz teknolojinin en sıcak noktası haline geldi ve kısa sürede çeşitli şirketlerin "ana teması" haline geldi. Görünüşe göre hiçbir büyük üretici, buna dahil olmayacağını açıkça söylemeye cesaret edemiyor. Eksik istatistiklere göre, bu yılın ilk yarısında büyük ölçekli modeller üreteceğini resmen açıklayan yüze yakın şirket vardı.
Ali, Baidu, Tencent, ByteDance ve JD.com gibi büyük İnternet şirketleri, iFlytek ve SenseTime tarafından temsil edilen AI şirketleri ve Kidswant gibi eğitim şirketleri tarafından temsil edilen çeşitli sektörler ve Huashun Companies gibi finans şirketleri birbiri ardına oyuna girdiler. .
Buna ek olarak, ülkede yapay zeka büyük ölçekli modeller işine başlama konusunda hızlı bir artış var.Birçok teknoloji devi, yönetici ve büyük üreticilerin eski yöneticileri, yeni bir iş kurmak için kendilerini büyük ölçekli modellere adadı. Örneğin, orijinal Meituan'ın kurucu ortağı Wang Huiwen, AI büyük modeline yüksek profille girdi (şu anda şirket tarafından kurulan "Light Years Beyond", Meituan tarafından satın alındı); Li Kaifu, Innovation Works CEO'su, Sohu'nun kurucusu Wang Xiaochuan ve eski JD.com AI iş öncüsü Zhou Bowen ve diğerleri, AI büyük modellerinin girişimci dalgasına katıldı. Bu sahne o zamanki "Bin Alay Savaşı" kadar muhteşem olmasa da yapay zeka + çözümlerinin son derece yüksek teknik eşiklerini gerektiren büyük ölçekli bir model parkuru için dış dünyayı şaşırtmaya yetiyor.
Son yıllarda, B'ye giden yol son derece sıcaktı ve işletmelerin dijital dönüşüm ve yükseltme talebi giderek daha güçlü hale geldi ve maliyetlerin düşürülmesi ve verimliliğin artırılması da işletmelerin temel talepleri. Sektördeki birçok kişi bile, büyük ölçekli modellerin teknoloji çemberinde kademeli büyüme için en umut verici alan haline geldiğine inanıyor. Ve bu, büyük modellerin hızlı popülaritesinin nedenlerinden biri haline geldi.
**6-8 Temmuz tarihlerinde Şangay'da düzenlenen WAIC konferansında, 30'dan fazla büyük ölçekli model şirketi, aynı zamanda endüstrinin gelişmesinde bir dönüm noktası haline gelen büyük ölçekli model düzeyinde düzeni ve başarıları sergilemek için yarıştı. . **
Çin'de All In yapay zekasını duyuran ilk üretici olan Baidu, konferansta "belediye binasının hazinelerinden" biri olan Wenxinyi tarzını sergileyerek sergi salonuna giren herkesin herkesin "P- resim". Huawei, donanım tarafındaki temel bilgi işlem gücünü göstermek için Atlas 900 PoD A2'yi sahneye taşıdı; Alibaba Cloud alt forumunda "Tongyi Ailesi", Ali The Third olan bir AI boyama modeli "Tongyi Wanxiang" ekledi. üç ay sonra duyurulan büyük model ürün.
Sektörün büyük modellere olan merakı “milli takım”ın kurulmasını hızlandırdı.
7 Temmuz'da WACI 2023 konferansında, Ulusal Standartlar Komitesi rehberliğinde ulusal yapay zeka standardizasyonu, ülkemin ilk büyük ölçekli model standardizasyon görev gücünün liderinin Şanghay Yapay Zeka Laboratuvarı ve Baidu tarafından ortaklaşa gerçekleştirileceğini duyurdu. Huawei, Ali ve diğer işletmeler. O zamandan beri, büyük modellerin "milli takımı" toplandı.
Aslında, bu yılın Mayıs ayı başlarında, ülke büyük modellerin standardizasyonu ile ilgili çalışmalara başladı.Yeni oluşturulan özel grup, büyük modellerin ve standardizasyon uygulamalarının kombinasyonunu teşvik etmek amacıyla büyük modellerin standardizasyonunu üstlenecek. ve yapay zeka endüstrisinin gelişiminin teşvik edilmesi, sağlıklı büyüme. O zamandan beri, altı aydır gürültülü olan büyük ölçekli model pisti, standardizasyona doğru ilerleyeceğini resmen açıkladı.
Devler "yarışıyor", pist yarışması yüksek boyutlu savaşa giriyor
2023 Dünya Yapay Zeka Konferansı'nda büyük model "birinci sınıf" olmayı hak ediyor.
Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi ve 30'dan fazla büyük ölçekli modelin tümü tanıtıldı. Konferans alanında devler birbiri ardına konseptten vazgeçtiler, bir adım daha yaklaştılar ve her şirketin başarılarını sergilediler.
7 Temmuz öğleden sonra, Huawei Geliştirici Konferansı 2023'te (Bulut), Huawei İcra Direktörü ve Huawei Cloud CEO'su Zhang Pingan, Huawei Cloud Pangu Model 3.0'ın resmi olarak piyasaya sürüldüğünü duyurdu. Ayrıca Huawei'nin "Pangu modelinin çok meşgul, işlerle meşgul ve şiir yazmaya vakti yok." Bu hamle, daha önce çıkan modelin basın toplantısında şiir ve düzyazı yazmayı da sevdiğini ima etmek olarak değerlendiriliyor. Çünkü Huawei, Pangu büyük modelini, ses büyük model düzeyine odaklanmak yerine finans, devlet işleri, madencilik, meteoroloji vb. gibi çeşitli sektörlere yardımcı olmak için kullanmayı umuyor.
Şimdiye kadar Pangu büyük modelinin meteoroloji, tıbbi araştırma ve geliştirme, elektrik gücü, dil ve diğer alanlarda uygulandığı ve yüz milyarlarca parametreye sahip çok sayıda büyük model sunduğu söyleniyor.
Alibaba Cloud'un CTO'su Zhou Jingren, "öncelikli hedefin Çin'in büyük ölçekli model ekolojisinin refahını teşvik etmek ve büyük ölçekli yeni kurulan şirketlere çok yönlü hizmetler sağlamak olacağını" belirtti. Açıkçası, bu, Alibaba Cloud tarafından önerilen MaaS (Hizmet Olarak Model) konseptini devam ettiriyor.
Baidu erken bir oyuncu ve Wenxin büyük ölçekli modeli her zaman endüstrinin dikkatini çekmiştir. Bu konferansta, Baidu Baş Teknoloji Sorumlusu Wang Haifeng, Baidu'nun artık Wenxin Model 3.5'e yükseltildiğini söyledi. Etki %50 artar, eğitim hızı 2 kat artar ve muhakeme hızı 30 kat artar.
"Milli takım" haberlerinin yanı sıra Tencent gibi büyük internet şirketleri de büyük modellerin konsept aşamasından uygulamaya geçiş sürecini hızlandırıyor.
Geçtiğimiz 20 gün içinde Tencent'in büyük modelle ilgili ağır haberleri sık sık yayıldı. 19 Haziran'da büyük modeller hakkındaki düşüncelerini ilk kez kamuoyuna açıkladı. 26 Haziran'da kendi geliştirdiği Xingmai yüksek performanslı bilgi işlem ağını ilk kez açıkladı. 7 Temmuz'da Tencent Cloud başkan yardımcısı Wu Yunsheng ve Tencent Cloud Intelligence başkanı, uygulama yeniliği açısından, Tencent Cloud'un büyük ölçekli endüstri modeli yeteneklerinin finansal risk kontrolü, etkileşimli çeviri ve akıllı uygulamaların verimliliğini artıran dijital akıllı müşteri hizmetleri gibi senaryolara uygulandığını tanıttı.
** Görüldüğü gibi hızlı üretici akını ile yerli büyük ölçekli modeller hızla konsept aşamasını geçmiş ve artık her firma nasıl hayata geçirilip ticarileştirileceğine odaklanmıştır. **
Halihazırda başlamış olan yükseliş savaşında eşik yükselmiş, zorluk kat kat artmıştır. Bu, herhangi bir üretici için küçük bir zorluk değildir.
Büyük modelin "yüksek zemininin" doğru duruşunu yakalamak için "hacmi" her yöne açın
Aslında büyük model çok sevilse de oyuna girmesinden fiilen inip piyasaya sürmesine kadar oldukça zor ve şimdiden birçok zorluk ortaya çıktı. Finansman, yetenekler, altyapı, senaryolar ve ticarileştirme, her oyuncunun üstesinden gelmesi gereken bir "engel yarışı" haline geldi.
Büyük modellerin geliştirilmesinin ilk aşamasında, sektördeki bazı kişiler "büyük modellerin büyük üreticilerin oyunu olduğunu" söyleyerek "büyük modellerin çok pahalı olduğunu" ve yalnızca büyük üreticilerin bunu karşılayabileceğini ima etti. Titanium Media'nın eksik istatistiklerine göre 2022'de Ar-Ge harcamalarına 161,5 milyar yuan yatırım yapacak olan Huawei, en çok Ar-Ge yatırımı yapan şirket olurken, onu 61,4 milyar yuan ile Tencent ve 55,5 milyar yuan ile Alibaba takip ediyor. Baidu, son on yılda AI alanında 100 milyar yuan'dan fazla yatırım yaptı. Büyük İnternet üreticilerinin Ar-Ge'ye yaptığı yıllık yatırım, onların güçlü bir Ar-Ge ekibine sahip olmalarını ve büyük ölçekli model parkurunda hak ettikleri bir "ilk kademe" haline gelmelerini sağladı.
Ama karşılığında hiçbir şey beklemeden körü körüne koyamazlar. Mevcut dinamiklere bakılırsa, hepsi sektörün uygulanmasını hızlandırıyor. Araştırma ve geliştirmeye güçlü fonlar yatırılır, mümkün olan en kısa sürede ticarileştirilir ve ardından yapay zeka modellerinin geliştirilmesine ve eğitimine yatırılır - bu, büyük ölçekli model oyuncularını destekleyen bir döngüdür.
Tıpkı Tencent'in başkan yardımcısı ve Tencent'in hükümet ve kurumsal iş birimi başkanı Li Qiang'ın dediği gibi: "Büyük modeller çağında, veri, ağ ve bilgi işlem gücü, altyapının 'demir üçgenini' oluşturur." Aynı zamanda, "Dikey endüstriler için modeller, büyük ölçekli modellerin değerinin taşma noktası olacaktır." Bunun anlamı, sermaye ve teknolojinin, büyük ölçekli modele girmek için yalnızca gerekli koşullar ve ivme olduğudur. endüstri ve asıl vurgu hala iniş seviyesinde.
Yetenek, büyük ölçekli maket çıkarma yarışmasının son derece önemli bir parçasıdır.
Bu yılın ilk çeyreğinde çeşitli şirketler bir "yetenek savaşı" başlattı. O sırada Wang Huiwen, en iyi Ar-Ge yeteneklerini davet etmek için hisselerin %75'ini almaya istekli olduğunu ifade etti ve Li Kaifu dünya çapında birinci sınıf yetenekleri işe almak için çağrıda bulundu. Baidu, AI büyük ölçekli model algoritma mühendislerini işe almaya istekli. aylık 25-40k maaş Büyük ölçekli model eğitim ve algoritma mühendisleri işe almak için aylık 40-70k maaş. Aynı zamanda bir işe alım sitesinde büyük ölçekli model ürünlerin ve operasyon pozisyonlarının maaşları aylık 35-60 bin maaş seviyesine ulaşmıştır.
İkinci olarak, algoritmalar, bilgi işlem gücü ve veriler gibi "altyapı", büyük modelin hâlâ en önemli önceliğidir. Yurt içi ve yurt dışında 10 büyük yapay zeka modelinin ilgili kurumlar tarafından değerlendirilmesine göre genel olarak yerli büyük modeller kelime anlama ve bilgi soruları açısından yabancı modelleri yani yerli yapay zeka büyük modelleri geride bırakıyor. [gf] 2f42[/gf]Karakterlerin temel bilişi ve öğrenme yeteneği [gf] 2f12[/gf] daha güçlü. Ancak aynı zamanda, veri düzeyinde büyük modellerin geliştirilmesinin yüksek kaliteli eğitim veri setleri gerektirdiğini de belirtmek gerekir.
Hesaplama gücü açısından Ali, Baidu, Tencent, Huawei gibi bazı önde gelen teknoloji firmaları ülkemde veri merkezlerinin yapımını tamamlamış, SenseTime ve Megvii gibi dikey alanlardaki oyuncular ciddi yatırımlar yapmış olsalar da hala çok fazla kapasite İyileştirme için çok az yer var.
Son olarak, iniş senaryoları ve ticarileştirme var.
Farklı alt bölümleme senaryolarında ve farklı endüstrilerde yüksek ticarileştirme maliyeti de endüstrinin karşılaştığı yaygın bir sorundur. Büyük bir modelin eğitim maliyetinin 2 milyon ABD Doları ile 12 milyon ABD Doları arasında olduğu tahmin edilmektedir.Genel olarak, büyük yapay zeka modellerinin ticari olarak gerçekleştirilmesi zaman alacaktır.
Daha pragmatik üreticiler bazı güçlü yönlerine odaklanmayı tercih ediyor. Örneğin, Tencent finans ve eğitim alanlarında açılışta başı çekti ve tek noktadan MaaS hizmeti işletmelerin üzerindeki yükü azalttı; Baidu Wenxin'in büyük modelinin yükseltilmesinden sonra maliyet geçmişe göre %10'a düşürüldü. Baidu Smart Cloud şimdiye kadar 300'den fazla ekolojik ortakla 400'den fazla senaryoda iyi test sonuçları elde etti. Huawei, kendi devlet ve işletme alanlarında yoğun bir şekilde çalışmaya başladı...
Gelecekle ilgili bu büyük model savaşının tüm hızıyla devam ettiği görülüyor.
Sonuna yaz
"Grup modeli savaşı" altında, herhangi bir oyuncu fırsatı değerlendirmelidir ve birçok kişi bunu zamanın bir bonusu olarak görür. Bu anlaşılabilir bir durumdur, giderek daha rekabetçi hale gelen bu yolda, birçok zorluk olmasına rağmen, yerli büyük ölçekli modeller hala daha eksiksiz ve pragmatik bir teknik yöne ve ticarileşmeye doğru ilerliyor. ** Canlı ve pratik olan bu tür bir endüstri rekabeti durumu, ülkemin büyük ölçekli model teknolojisinin gelişme hızını artıracak ve Çin'in yapay zeka endüstrisinin genel teknolojik yükseltmesini destekleyecektir. **