30 empresas disputam WAIC: grandes modelos entram na guerra de alta dimensão

Fonte: Zero State LT, Autor: Zhuo Xinyue, Editor: Hu Zhanjia

Quão rápido é o modelo grande desde o conceito até a implementação?

A Conferência Mundial de Inteligência Artificial de 2023 (WAIC 2023), o evento mais atraente no círculo de tecnologia recentemente, deu uma resposta que chocou a todos: meio ano! Meio ano não é muito tempo para qualquer trilha tecnológica, e mesmo algumas trilhas estão apenas no estágio "infância", mas a trilha do modelo em grande escala completou o processo desde o conceito até a implementação em um período de tempo tão curto.

No primeiro trimestre deste ano, a indústria ainda discutia a questão "será ou não". .

Esta resposta, em essência, tem sido focada por mais de 30 fabricantes de modelos de grande escala que participam da conferência WAIC - primeiro resolvem problemas técnicos, seguidos pela implementação da cena e, finalmente, comercial e escala.

"Anteriormente, as dificuldades na implementação da inteligência artificial eram mais no nível técnico, como no campo da direção autônoma. Ela foi desenvolvida por muitos anos, mas a comercialização ainda impede que os jogadores vejam o amanhecer." depois de visitar a conferência WAIC: "Relativo No entanto, deve-se notar que a competição de mercado por modelos grandes será mais intensa."

Nesta conferência WAIC, mais de 30 empresas focaram em "exibir seus músculos", incluindo gigantes como Baidu, Tencent, Ali, Huawei e JD.com, além de players em campos verticais como SenseTime e NetEase.

Nessa época, surgiram notícias de que o líder da primeira força-tarefa de padronização de modelos em grande escala do meu país era mantido em conjunto pelo Laboratório de Inteligência Artificial de Xangai e Baidu, Huawei, Ali e outras empresas. Esse primeiro lote de empresas pré-selecionadas também recebeu o " Título da Seleção Nacional". ** Existem vários sinais de que uma batalha PK de modelo em grande escala de dimensão superior liderada pela "equipe nacional" começou oficialmente. **

De "dança modelo de grupo" a "liderança de equipe nacional"

Desde o início deste ano, os modelos grandes se tornaram, sem dúvida, o ponto mais quente da tecnologia e logo se tornaram o "tema principal" de várias empresas. Parece que nenhum grande fabricante se atreve a dizer publicamente que não se envolverá nisso. De acordo com estatísticas incompletas, no primeiro semestre deste ano, havia quase uma centena de empresas que anunciaram oficialmente a construção de modelos em grande escala.

As principais empresas de Internet, como Ali, Baidu, Tencent, ByteDance e JD.com, empresas de IA representadas por iFlytek e SenseTime e vários setores representados por empresas educacionais, como Kidswant e empresas financeiras, como Huashun Companies, entraram no jogo uma após a outra .

Além disso, há um rápido aumento no país para iniciar um negócio de modelos de grande escala de IA. Muitos gigantes da tecnologia, executivos e ex-executivos de grandes fabricantes se dedicaram a modelos de grande escala para iniciar um novo negócio. Por exemplo, Wang Huiwen, o co-fundador da Meituan original, entrou no grande modelo AI com alto perfil (atualmente, "Light Years Beyond" estabelecido pela empresa foi adquirido pela Meituan); Li Kaifu, CEO da Innovation Works, Wang Xiaochuan, fundador da Sohu, e o ex-pioneiro de negócios de IA da JD.com, Zhou Bowen, e outros se juntaram à onda empreendedora de grandes modelos de IA. Embora essa cena não seja tão espetacular quanto a "Guerra dos Mil Regimentos" da época, é suficiente para surpreender o mundo exterior por uma pista de modelo em grande escala que requer limites técnicos extremamente altos de inteligência artificial + soluções.

Nos últimos anos, a trilha to B tem estado extremamente quente, e a demanda por transformação digital e atualização das empresas tornou-se cada vez mais forte, e a redução de custos e o aumento da eficiência também são as principais demandas das empresas. Mesmo muitas pessoas na indústria acreditam que os modelos em grande escala se tornaram o campo mais promissor para o crescimento incremental no círculo tecnológico. E esse se tornou um dos motivos da rápida popularidade dos modelos grandes.

**Na conferência WAIC realizada em Xangai de 6 a 8 de julho, mais de 30 empresas de modelos em grande escala competiram para exibir o layout e as conquistas no nível do modelo em grande escala, que também se tornou um evento marcante no desenvolvimento da indústria . **

A Baidu, como a primeira fabricante na China a anunciar a inteligência artificial All In, demonstrou seu estilo Wenxinyi, um dos "tesouros da prefeitura", na conferência, permitindo que todos que entraram no salão de exposições percebessem que todos podem "P- foto". A Huawei colocou seu Atlas 900 PoD A2 em cena para mostrar seu poder de computação básico no lado do hardware; no sub-fórum Alibaba Cloud, a "Família Tongyi" adicionou um modelo de pintura AI "Tongyi Wanxiang", que é o terceiro Ali produto modelo grande anunciado em três meses.

O entusiasmo da indústria por grandes modelos acelerou o estabelecimento da "equipe nacional".

Em 7 de julho, na conferência WACI 2023, a padronização nacional de inteligência artificial sob a orientação do Comitê Nacional de Padrões anunciou que o líder da primeira força-tarefa de padronização de modelo em grande escala do meu país será realizado em conjunto pelo Laboratório de Inteligência Artificial de Xangai e Baidu, Huawei, Ali e outras empresas. Desde então, a "equipe nacional" de grandes modelos foi montada.

De fato, já em maio deste ano, o país iniciou os trabalhos relacionados à padronização de grandes modelos. O recém-formado grupo especial assumirá a padronização de grandes modelos, com o objetivo de promover a combinação de grandes modelos e práticas de padronização , e promovendo o desenvolvimento da indústria de inteligência artificial. crescimento saudável. Desde então, a pista de maquete em grande escala, que está barulhenta há meio ano, anunciou oficialmente que caminhará para a padronização.

Os gigantes "competem", a competição de pista entra na batalha de alta dimensão

Na Conferência Mundial de Inteligência Artificial de 2023, o modelo grande merece ser a "classe superior".

Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi e mais de 30 modelos em grande escala foram revelados. No local da conferência, os gigantes abandonaram o conceito um após o outro, deram um passo à frente e mostraram as conquistas de cada empresa.

Na tarde de 7 de julho, na Huawei Developer Conference 2023 (Cloud), Zhang Pingan, Diretor Executivo da Huawei e CEO da Huawei Cloud, anunciou que o Huawei Cloud Pangu Model 3.0 foi lançado oficialmente. Ele também disse que o "modelo Pangu da Huawei está muito ocupado, ocupado com as coisas e não tem tempo para escrever poemas". Porque a Huawei espera usar o modelo grande Pangu para ajudar vários setores, como finanças, assuntos governamentais, mineração, meteorologia, etc., em vez de se concentrar no nível do modelo grande de voz.

Diz-se que até agora, o grande modelo Pangu foi implementado em meteorologia, pesquisa e desenvolvimento médico, energia elétrica, linguagem e outros campos, e entregou vários modelos grandes com centenas de bilhões de parâmetros.

Zhou Jingren, CTO da Alibaba Cloud, mencionou que "o objetivo principal será promover a prosperidade da ecologia de modelos em grande escala da China e fornecer serviços completos para empresas iniciantes de grande escala". Obviamente, isso continua o conceito MaaS (Model as a Service) proposto pelo Alibaba Cloud.

O Baidu é um dos primeiros participantes e seu modelo em grande escala Wenxin sempre atraiu a atenção da indústria. Nesta conferência, o diretor de tecnologia da Baidu, Wang Haifeng, disse que a Baidu agora atualizou para o modelo Wenxin 3.5. O efeito é aumentado em 50%, a velocidade de treinamento é aumentada em 2 vezes e a velocidade de raciocínio é aumentada em 30 vezes.

Além das notícias da "seleção nacional", grandes empresas de Internet, como a Tencent, também estão acelerando o processo de grandes modelos, desde o conceito até a implementação.

Nos últimos 20 dias, as notícias pesadas da Tencent sobre o modelo grande se espalharam com frequência. Em 19 de junho, ele revelou publicamente seus pensamentos sobre modelos grandes pela primeira vez. Em 26 de junho, ele divulgou a rede de computação de alto desempenho Xingmai autodesenvolvida pela primeira vez. Em 7 de julho, Wu Yunsheng, vice-presidente da Tencent Cloud e chefe da Tencent Cloud Intelligence, apresentou que, em termos de inovação de aplicativos, os recursos de modelo de indústria em larga escala da Tencent Cloud são aplicados a cenários como controle de risco financeiro, tradução interativa e atendimento digital inteligente ao cliente, o que melhora a eficiência de aplicativos inteligentes.

** Pode-se ver que, com o rápido afluxo de fabricantes, os modelos domésticos de grande escala passaram rapidamente do estágio de conceito e agora cada empresa está se concentrando em como implementar e comercializar. **

Na guerra de ascensão que já começou, o limiar foi elevado e a dificuldade aumentou. Este não é um desafio pequeno para qualquer fabricante.

Abra o "volume" em todas as direções para apreender a postura correta do "terreno elevado" do modelo grande

Na verdade, embora o modelo grande seja muito popular, é bastante difícil de entrar no jogo para realmente pousar e empurrá-lo para o mercado, e muitas dificuldades já surgiram. Financiamento, talentos, infraestrutura, cenários e comercialização tornaram-se uma "corrida de obstáculos" que todo jogador deve superar.

No estágio inicial do desenvolvimento de modelos grandes, algumas pessoas da indústria disseram que "os modelos grandes são o jogo dos grandes fabricantes", dando a entender que "os modelos grandes são muito caros" e apenas os grandes fabricantes podem pagar. De acordo com estatísticas incompletas da Titanium Media, em 2022, a Huawei investirá 161,5 bilhões de yuans em despesas de P&D, tornando-se a empresa com o maior investimento em P&D; seguida pela Tencent com 61,4 bilhões de yuans e Alibaba com 55,5 bilhões de yuans. Nos últimos dez anos, a Baidu investiu mais de 100 bilhões de yuans no campo da IA. O investimento anual em P&D dos principais fabricantes de Internet permitiu que eles tivessem uma forte equipe de P&D e se tornassem um merecido "primeiro escalão" na trilha de modelagem em grande escala.

Mas eles não podem entrar cegamente sem esperar nada em troca. A julgar pela dinâmica atual, todos estão acelerando a implantação da indústria. Fortes fundos são investidos em pesquisa e desenvolvimento, comercializados o mais rápido possível e, em seguida, investidos no desenvolvimento e treinamento de modelos de IA - este é um ciclo que oferece suporte a players de modelos em larga escala.

Assim como Li Qiang, vice-presidente da Tencent e presidente do governo e negócios corporativos da Tencent, disse: "Na era dos grandes modelos, dados, rede e poder de computação constituem o 'triângulo de ferro' da infraestrutura subjacente". Ao mesmo tempo, ele também disse: "Modelos para indústrias verticais, será o ponto de inflexão do valor dos modelos de grande escala". indústria, e o verdadeiro destaque ainda está no nível do desembarque.

O talento é uma parte extremamente importante da competição de pouso de modelos em grande escala.

No primeiro trimestre deste ano, várias empresas iniciaram uma "guerra por talentos". Naquela época, Wang Huiwen expressou sua vontade de adquirir 75% das ações para convidar os principais talentos de P&D, e Li Kaifu pediu o recrutamento de talentos de classe mundial em todo o mundo. A Baidu está disposta a recrutar engenheiros de algoritmo de modelo de IA em larga escala com um salário mensal de 25 a 40 mil. Salário mensal de 40 a 70 mil para recrutar engenheiros de treinamento e algoritmo em larga escala. Ao mesmo tempo, em um site de recrutamento, o salário de produtos de modelo em grande escala e posições de operação atingiu um nível salarial mensal de 35-60k.

Em segundo lugar, "infraestrutura" como algoritmos, poder de computação e dados ainda são a principal prioridade do modelo grande. De acordo com a avaliação de 10 grandes modelos de IA no país e no exterior por instituições relevantes, no geral, os grandes modelos domésticos superam os modelos estrangeiros em termos de compreensão de palavras e questões de conhecimento, ou seja, grandes modelos domésticos de IA [gf] 2f42[/gf]Cognição básica e capacidade de aprendizagem dos personagens [gf] 2f12[/gf] é mais forte. Mas, ao mesmo tempo, também deve ser observado que, no nível dos dados, o desenvolvimento de grandes modelos requer conjuntos de dados de treinamento de alta qualidade.

Em termos de poder de computação, embora algumas empresas líderes em tecnologia como Ali, Baidu, Tencent e Huawei tenham concluído a construção de data centers em meu país e players em campos verticais como SenseTime e Megvii tenham investido pesadamente, ainda há um muita capacidade, pouco espaço para melhorias.

Finalmente, há cenários de pouso e comercialização.

O alto custo de comercialização em diferentes cenários de subdivisão e em diferentes indústrias também é um problema comum enfrentado pela indústria. Estima-se que o custo de treinamento de um grande modelo esteja entre US$ 2 milhões e US$ 12 milhões.No geral, levará tempo para a realização comercial de grandes modelos de IA.

Fabricantes mais pragmáticos optam por se concentrar em alguns de seus pontos fortes. Por exemplo, a Tencent assumiu a liderança no desembarque nas áreas de finanças e educação, e o serviço MaaS completo reduziu a carga para as empresas; após a atualização do modelo grande do Baidu Wenxin, o custo foi reduzido para 10% do passado. Até agora, o Baidu Smart Cloud alcançou bons resultados de teste em mais de 400 cenários com mais de 300 parceiros ecológicos. A Huawei começou a trabalhar duro em seus próprios campos governamentais e empresariais...

Pode-se ver que esta grande batalha de modelos sobre o futuro está em pleno andamento.

Escreva no final

Sob a "guerra do modelo de grupo", qualquer jogador deve aproveitar a oportunidade, e muitas pessoas a consideram um bônus dos tempos. Isso é compreensível, pois nessa trilha cada vez mais competitiva, mesmo com muitas dificuldades, os modelos nacionais de grande porte ainda caminham para um direcionamento técnico e comercialização mais completo e pragmático. ** Este tipo de situação de competição da indústria que é animado e prático é obrigado a acelerar o ritmo de desenvolvimento da tecnologia de modelo em grande escala do meu país e promover a atualização tecnológica geral da indústria de IA da China. **

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)