Fuente: Zero State LT, Autor: Zhuo Xinyue, Editor: Hu Zhanjia
¿Qué tan rápido es el modelo grande desde el concepto hasta la implementación?
La Conferencia Mundial de Inteligencia Artificial 2023 (WAIC 2023), el evento más llamativo en el círculo tecnológico recientemente, dio una respuesta que sorprendió a todos: ¡medio año! Medio año no es demasiado tiempo para ninguna pista tecnológica, e incluso algunas pistas están solo en la etapa de "infancia", pero la pista del modelo a gran escala ha completado el proceso desde el concepto hasta la implementación en un período de tiempo tan corto.
En el primer trimestre de este año, la industria todavía estaba discutiendo la cuestión de "si o no". En el segundo trimestre, la tendencia de varios fabricantes importantes que se unen para hacer modelos grandes es que los jugadores están respondiendo "cómo hacerlo". .
Esta respuesta, en esencia, ha sido enfocada por más de 30 fabricantes de modelos a gran escala que participan en la conferencia WAIC: primero resuelven problemas técnicos, luego implementan la escena y finalmente comerciales y de escala.
"Anteriormente, las dificultades en la implementación de la inteligencia artificial eran más a nivel técnico, como el campo de la conducción autónoma. Se ha desarrollado durante muchos años, pero la comercialización aún impide que los jugadores vean el amanecer", mencionó una fuente de la industria. después de visitar la conferencia WAIC: "Relativo Sin embargo, cabe señalar que la competencia en el mercado de modelos grandes será más intensa".
En esta conferencia WAIC, más de 30 empresas se enfocaron en "mostrar sus músculos", incluidos gigantes como Baidu, Tencent, Ali, Huawei y JD.com, así como jugadores en campos verticales como SenseTime y NetEase.
En este momento, se supo que el líder del primer grupo de trabajo de estandarización de modelos a gran escala de mi país estaba en manos conjuntas del Laboratorio de Inteligencia Artificial de Shanghai y Baidu, Huawei, Ali y otras empresas. Este primer lote de empresas preseleccionadas también recibió el " Título de la Selección Nacional. ** Hay varias señales de que ha comenzado oficialmente una batalla PK modelo a gran escala de dimensiones superiores dirigida por el "equipo nacional". **
De "modelo de baile en grupo" a "liderazgo del equipo nacional"
Desde principios de este año, los modelos grandes se han convertido, sin duda, en el punto más candente de la tecnología, y pronto se convirtieron en el "tema principal" de varias empresas. Parece que ningún fabricante importante se atreve a decir públicamente que no se involucrará en esto. Según estadísticas incompletas, en la primera mitad de este año, hubo casi un centenar de empresas que anunciaron oficialmente la construcción de modelos a gran escala.
Las principales empresas de Internet como Ali, Baidu, Tencent, ByteDance y JD.com, las empresas de inteligencia artificial representadas por iFlytek y SenseTime, y varias industrias representadas por empresas educativas como Kidswant y empresas financieras como Huashun Companies han entrado en el juego una tras otra. .
Además, hay un rápido aumento en el país para iniciar un negocio de modelos a gran escala de IA. Muchos gigantes tecnológicos, ejecutivos y ex ejecutivos de los principales fabricantes se han dedicado a los modelos a gran escala para iniciar un nuevo negocio. Por ejemplo, Wang Huiwen, el cofundador de Meituan original, ingresó al gran modelo de IA con un perfil alto (actualmente, Meituan adquirió "Light Years Beyond" establecido por la compañía); Li Kaifu, El director ejecutivo de Innovation Works, Wang Xiaochuan, fundador de Sohu, y el expionero empresarial de IA de JD.com, Zhou Bowen, y otros, se han unido a la ola empresarial de grandes modelos de IA. Aunque esta escena no es tan espectacular como la "Guerra de los Mil Regimientos" en ese entonces, es suficiente para sorprender al mundo exterior por una pista de modelo a gran escala que requiere umbrales técnicos extremadamente altos de inteligencia artificial + soluciones.
En los últimos años, el camino hacia B ha sido extremadamente popular, y la demanda de transformación digital y actualización de las empresas se ha vuelto cada vez más fuerte, y la reducción de costos y la mejora de la eficiencia también son las demandas principales de las empresas. Incluso muchas personas en la industria creen que los modelos a gran escala se han convertido en el campo más prometedor para el crecimiento incremental en el círculo tecnológico. Y esto se ha convertido en una de las razones de la rápida popularidad de los modelos grandes.
**En la conferencia WAIC celebrada en Shanghái del 6 al 8 de julio, más de 30 empresas de modelos a gran escala compitieron para mostrar el diseño y los logros a nivel de modelo a gran escala, que también se convirtió en un evento histórico en el desarrollo de la industria. . **
Baidu, como el primer fabricante en China en anunciar All In inteligencia artificial, demostró su estilo Wenxinyi, uno de los "tesoros del ayuntamiento", en la conferencia, permitiendo que todos los que ingresaron a la sala de exposiciones se dieran cuenta de que todos pueden "P- imagen". Huawei movió su Atlas 900 PoD A2 a la escena para mostrar su potencia informática básica en el lado del hardware; en el subforo de Alibaba Cloud, la "Familia Tongyi" agregó un modelo de pintura de IA "Tongyi Wanxiang", que es Ali El tercero producto de modelo grande anunciado dentro de tres meses.
El entusiasmo de la industria por los modelos grandes ha acelerado el establecimiento del "equipo nacional".
El 7 de julio, en la conferencia WACI 2023, la estandarización nacional de inteligencia artificial bajo la dirección del Comité Nacional de Estándares anunció que el líder del primer grupo de trabajo de estandarización de modelos a gran escala de mi país estará a cargo conjuntamente del Laboratorio de Inteligencia Artificial de Shanghai y Baidu, Huawei, Ali y otras empresas. Desde entonces, se ha reunido el "equipo nacional" de modelos grandes.
De hecho, ya en mayo de este año, el país inició los trabajos relacionados con la estandarización de modelos grandes. El grupo especial recién formado se encargará de la estandarización de modelos grandes, con el propósito de promover la combinación de modelos grandes y prácticas de estandarización. , y promover el desarrollo de la industria de la inteligencia artificial. crecimiento saludable. Desde entonces, la pista de modelos a gran escala, que ha sido ruidosa durante medio año, ha anunciado oficialmente que avanzará hacia la estandarización.
Los gigantes "compiten", la competencia de pista entra en la batalla de alta dimensión
En la Conferencia Mundial de Inteligencia Artificial de 2023, el modelo grande merece ser la "primera clase".
Se presentaron Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi y más de 30 modelos a gran escala. En el sitio de la conferencia, los gigantes abandonaron el concepto uno tras otro, dieron un paso más y mostraron los logros de cada empresa.
En la tarde del 7 de julio, en la Huawei Developer Conference 2023 (Cloud), Zhang Pingan, Director Ejecutivo de Huawei y CEO de Huawei Cloud, anunció que se lanzó oficialmente Huawei Cloud Pangu Model 3.0. También dijo que el "modelo Pangu de Huawei está muy ocupado, ocupado con cosas y no tiene tiempo para escribir poemas". También se considera que este movimiento implica que al modelo publicado anteriormente le gusta escribir poemas y prosa en la conferencia de prensa. Porque Huawei espera usar el modelo grande de Pangu para ayudar a varias industrias, como finanzas, asuntos gubernamentales, minería, meteorología, etc., en lugar de centrarse en el nivel de modelo grande de voz.
Se dice que hasta ahora, el modelo grande de Pangu se ha implementado en meteorología, investigación y desarrollo médico, energía eléctrica, lenguaje y otros campos, y ha entregado múltiples modelos grandes con cientos de miles de millones de parámetros.
Zhou Jingren, CTO de Alibaba Cloud, mencionó que "el objetivo principal será promover la prosperidad de la ecología modelo a gran escala de China y brindar servicios integrales a las empresas emergentes a gran escala". Obviamente, esto continúa con el concepto MaaS (Model as a Service) propuesto por Alibaba Cloud.
Baidu es uno de los primeros jugadores, y su modelo Wenxin a gran escala siempre ha atraído la atención de la industria. En esta conferencia, el director de tecnología de Baidu, Wang Haifeng, dijo que Baidu ahora se ha actualizado a Wenxin Model 3.5. El efecto aumenta en un 50%, la velocidad de entrenamiento aumenta 2 veces y la velocidad de razonamiento aumenta 30 veces.
Además de las noticias del "equipo nacional", las principales empresas de Internet como Tencent también están acelerando el proceso de grandes modelos desde el concepto hasta la implementación.
En los últimos 20 días, las fuertes noticias de Tencent sobre el modelo grande se han difundido con frecuencia. El 19 de junio, reveló públicamente sus pensamientos sobre modelos grandes por primera vez. El 26 de junio, reveló por primera vez la red informática de alto rendimiento Xingmai de desarrollo propio. El 7 de julio, Wu Yunsheng, vicepresidente de Tencent Cloud y jefe de Tencent Cloud Intelligence, presentó que, en términos de innovación de aplicaciones, las capacidades del modelo industrial a gran escala de Tencent Cloud se aplican a escenarios como el control de riesgos financieros, la traducción interactiva y el servicio al cliente digital inteligente, lo que mejora la eficiencia de las aplicaciones inteligentes.
** Se puede ver que con la rápida afluencia de fabricantes, los modelos domésticos a gran escala han superado rápidamente la etapa de concepto, y ahora cada empresa se está enfocando en cómo implementar y comercializar. **
En la guerra de ascensión que ya ha comenzado, el umbral se ha elevado y la dificultad ha aumentado. Este no es un desafío pequeño para cualquier fabricante.
Abra el "volumen" en todas las direcciones para aprovechar la postura correcta del "terreno elevado" del modelo grande
De hecho, aunque el modelo grande es muy popular, es bastante difícil desde que ingresa al juego hasta que aterriza y lo empuja al mercado, y ya han surgido muchas dificultades. La financiación, los talentos, la infraestructura, los escenarios y la comercialización se han convertido en una "carrera de obstáculos" que todo jugador debe superar.
En la etapa inicial del desarrollo de modelos grandes, algunas personas en la industria dijeron que "los modelos grandes son el juego de los grandes fabricantes", lo que implica que "los modelos grandes son muy caros" y solo los grandes fabricantes pueden pagarlos. Según estadísticas incompletas de Titanium Media, en 2022, Huawei invertirá 161.500 millones de yuanes en gastos de I+D, convirtiéndose en la empresa con mayor inversión en I+D, seguida de Tencent con 61.400 millones de yuanes y Alibaba con 55.500 millones de yuanes. En los últimos diez años, Baidu ha invertido más de 100 000 millones de yuanes en el campo de la IA. La inversión anual en I+D por parte de los principales fabricantes de Internet les ha permitido contar con un sólido equipo de I+D y convertirse en un merecido "primer escalón" en la pista de modelos a gran escala.
Pero no pueden apostar ciegamente sin esperar nada a cambio. A juzgar por la dinámica actual, todos están acelerando la implementación de la industria. Se invierten fondos sólidos en investigación y desarrollo, se comercializan lo antes posible y luego se invierten en el desarrollo y capacitación de modelos de IA; este es un ciclo que apoya a los jugadores de modelos a gran escala.
Tal como dijo Li Qiang, vicepresidente de Tencent y presidente de negocios gubernamentales y empresariales de Tencent: "En la era de los modelos grandes, los datos, la red y el poder de cómputo constituyen el 'triángulo de hierro' de la infraestructura subyacente". Al mismo tiempo, también dijo: "Modelos para industrias verticales, será el punto de inflexión del valor de los modelos a gran escala". La implicación es que el capital y la tecnología son solo las condiciones y el impulso necesarios para ingresar al modelo a gran escala. industria, y lo más destacado todavía está en el nivel de aterrizaje.
El talento es una parte extremadamente importante de la competencia de aterrizaje de modelos a gran escala.
En el primer trimestre de este año, varias empresas iniciaron una "guerra por el talento". En ese momento, Wang Huiwen expresó su voluntad de adquirir el 75% de las acciones para invitar a los mejores talentos de I + D, y Li Kaifu pidió reclutar talentos de clase mundial en todo el mundo. Baidu está dispuesto a contratar ingenieros de algoritmos de modelos a gran escala de IA con un salario mensual de 25 a 40 000. 40 a 70 000 de salario mensual para contratar ingenieros de formación de modelos y algoritmos a gran escala. Al mismo tiempo, en un sitio web de reclutamiento, el salario de los puestos de operación y productos modelo a gran escala ha alcanzado un nivel de salario mensual de 35-60k.
En segundo lugar, la "infraestructura", como los algoritmos, el poder de cómputo y los datos, siguen siendo la máxima prioridad del modelo grande. De acuerdo con la evaluación de 10 grandes modelos de IA en el país y en el extranjero por parte de instituciones relevantes, en general, los grandes modelos nacionales superan a los modelos extranjeros en términos de comprensión de palabras y preguntas de conocimiento, es decir, los grandes modelos nacionales de IA. [gf] 2f42[/gf]Cognición básica y capacidad de aprendizaje de los personajes [gf] 2f12[/gf] es más fuerte. Pero al mismo tiempo, también se debe tener en cuenta que, a nivel de datos, el desarrollo de modelos grandes requiere conjuntos de datos de entrenamiento de alta calidad.
En términos de poder de cómputo, aunque algunas empresas tecnológicas líderes como Ali, Baidu, Tencent y Huawei han completado la construcción de centros de datos en mi país, y los jugadores en campos verticales como SenseTime y Megvii han invertido mucho, todavía hay una mucha capacidad Poco margen de mejora.
Finalmente, están los escenarios de aterrizaje y comercialización.
El alto costo de comercialización en diferentes escenarios de subdivisión y en diferentes industrias también es un problema común que enfrenta la industria. Se estima que el costo de entrenar un modelo grande es de entre 2 y 12 millones de dólares EE.UU. En general, la realización comercial de modelos grandes de IA llevará tiempo.
Los fabricantes más pragmáticos optan por centrarse en algunos de sus puntos fuertes. Por ejemplo, Tencent tomó la delantera en el aterrizaje en los campos de las finanzas y la educación, y el servicio MaaS de ventanilla única redujo la carga de las empresas; después de la actualización del modelo grande de Baidu Wenxin, el costo se redujo al 10% del pasado. Hasta ahora, Baidu Smart Cloud ha logrado buenos resultados de prueba en más de 400 escenarios con más de 300 socios ecológicos. Huawei ha comenzado a trabajar duro en sus propios campos gubernamentales y empresariales...
Se puede ver que esta gran batalla de modelos sobre el futuro está en pleno apogeo.
Escribir al final
Bajo la "guerra de modelos grupales", cualquier jugador debe aprovechar la oportunidad, y muchas personas lo consideran una ventaja de los tiempos. Esto es comprensible En esta pista cada vez más competitiva, aunque hay muchas dificultades, los modelos domésticos a gran escala todavía se están moviendo hacia una dirección técnica y de comercialización más completa y pragmática. ** Este tipo de situación de competencia industrial que es animada y práctica está destinada a acelerar el ritmo de desarrollo de la tecnología modelo a gran escala de mi país y promover la actualización tecnológica general de la industria de IA de China. **
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
30 empresas compiten por WAIC: los modelos grandes entran en la guerra de las altas dimensiones
Fuente: Zero State LT, Autor: Zhuo Xinyue, Editor: Hu Zhanjia
La Conferencia Mundial de Inteligencia Artificial 2023 (WAIC 2023), el evento más llamativo en el círculo tecnológico recientemente, dio una respuesta que sorprendió a todos: ¡medio año! Medio año no es demasiado tiempo para ninguna pista tecnológica, e incluso algunas pistas están solo en la etapa de "infancia", pero la pista del modelo a gran escala ha completado el proceso desde el concepto hasta la implementación en un período de tiempo tan corto.
En el primer trimestre de este año, la industria todavía estaba discutiendo la cuestión de "si o no". En el segundo trimestre, la tendencia de varios fabricantes importantes que se unen para hacer modelos grandes es que los jugadores están respondiendo "cómo hacerlo". .
Esta respuesta, en esencia, ha sido enfocada por más de 30 fabricantes de modelos a gran escala que participan en la conferencia WAIC: primero resuelven problemas técnicos, luego implementan la escena y finalmente comerciales y de escala.
"Anteriormente, las dificultades en la implementación de la inteligencia artificial eran más a nivel técnico, como el campo de la conducción autónoma. Se ha desarrollado durante muchos años, pero la comercialización aún impide que los jugadores vean el amanecer", mencionó una fuente de la industria. después de visitar la conferencia WAIC: "Relativo Sin embargo, cabe señalar que la competencia en el mercado de modelos grandes será más intensa".
En esta conferencia WAIC, más de 30 empresas se enfocaron en "mostrar sus músculos", incluidos gigantes como Baidu, Tencent, Ali, Huawei y JD.com, así como jugadores en campos verticales como SenseTime y NetEase.
En este momento, se supo que el líder del primer grupo de trabajo de estandarización de modelos a gran escala de mi país estaba en manos conjuntas del Laboratorio de Inteligencia Artificial de Shanghai y Baidu, Huawei, Ali y otras empresas. Este primer lote de empresas preseleccionadas también recibió el " Título de la Selección Nacional. ** Hay varias señales de que ha comenzado oficialmente una batalla PK modelo a gran escala de dimensiones superiores dirigida por el "equipo nacional". **
De "modelo de baile en grupo" a "liderazgo del equipo nacional"
Desde principios de este año, los modelos grandes se han convertido, sin duda, en el punto más candente de la tecnología, y pronto se convirtieron en el "tema principal" de varias empresas. Parece que ningún fabricante importante se atreve a decir públicamente que no se involucrará en esto. Según estadísticas incompletas, en la primera mitad de este año, hubo casi un centenar de empresas que anunciaron oficialmente la construcción de modelos a gran escala.
Las principales empresas de Internet como Ali, Baidu, Tencent, ByteDance y JD.com, las empresas de inteligencia artificial representadas por iFlytek y SenseTime, y varias industrias representadas por empresas educativas como Kidswant y empresas financieras como Huashun Companies han entrado en el juego una tras otra. .
Además, hay un rápido aumento en el país para iniciar un negocio de modelos a gran escala de IA. Muchos gigantes tecnológicos, ejecutivos y ex ejecutivos de los principales fabricantes se han dedicado a los modelos a gran escala para iniciar un nuevo negocio. Por ejemplo, Wang Huiwen, el cofundador de Meituan original, ingresó al gran modelo de IA con un perfil alto (actualmente, Meituan adquirió "Light Years Beyond" establecido por la compañía); Li Kaifu, El director ejecutivo de Innovation Works, Wang Xiaochuan, fundador de Sohu, y el expionero empresarial de IA de JD.com, Zhou Bowen, y otros, se han unido a la ola empresarial de grandes modelos de IA. Aunque esta escena no es tan espectacular como la "Guerra de los Mil Regimientos" en ese entonces, es suficiente para sorprender al mundo exterior por una pista de modelo a gran escala que requiere umbrales técnicos extremadamente altos de inteligencia artificial + soluciones.
En los últimos años, el camino hacia B ha sido extremadamente popular, y la demanda de transformación digital y actualización de las empresas se ha vuelto cada vez más fuerte, y la reducción de costos y la mejora de la eficiencia también son las demandas principales de las empresas. Incluso muchas personas en la industria creen que los modelos a gran escala se han convertido en el campo más prometedor para el crecimiento incremental en el círculo tecnológico. Y esto se ha convertido en una de las razones de la rápida popularidad de los modelos grandes.
**En la conferencia WAIC celebrada en Shanghái del 6 al 8 de julio, más de 30 empresas de modelos a gran escala compitieron para mostrar el diseño y los logros a nivel de modelo a gran escala, que también se convirtió en un evento histórico en el desarrollo de la industria. . **
Baidu, como el primer fabricante en China en anunciar All In inteligencia artificial, demostró su estilo Wenxinyi, uno de los "tesoros del ayuntamiento", en la conferencia, permitiendo que todos los que ingresaron a la sala de exposiciones se dieran cuenta de que todos pueden "P- imagen". Huawei movió su Atlas 900 PoD A2 a la escena para mostrar su potencia informática básica en el lado del hardware; en el subforo de Alibaba Cloud, la "Familia Tongyi" agregó un modelo de pintura de IA "Tongyi Wanxiang", que es Ali El tercero producto de modelo grande anunciado dentro de tres meses.
El entusiasmo de la industria por los modelos grandes ha acelerado el establecimiento del "equipo nacional".
El 7 de julio, en la conferencia WACI 2023, la estandarización nacional de inteligencia artificial bajo la dirección del Comité Nacional de Estándares anunció que el líder del primer grupo de trabajo de estandarización de modelos a gran escala de mi país estará a cargo conjuntamente del Laboratorio de Inteligencia Artificial de Shanghai y Baidu, Huawei, Ali y otras empresas. Desde entonces, se ha reunido el "equipo nacional" de modelos grandes.
De hecho, ya en mayo de este año, el país inició los trabajos relacionados con la estandarización de modelos grandes. El grupo especial recién formado se encargará de la estandarización de modelos grandes, con el propósito de promover la combinación de modelos grandes y prácticas de estandarización. , y promover el desarrollo de la industria de la inteligencia artificial. crecimiento saludable. Desde entonces, la pista de modelos a gran escala, que ha sido ruidosa durante medio año, ha anunciado oficialmente que avanzará hacia la estandarización.
Los gigantes "compiten", la competencia de pista entra en la batalla de alta dimensión
En la Conferencia Mundial de Inteligencia Artificial de 2023, el modelo grande merece ser la "primera clase".
Se presentaron Baidu Wenxin, Ali Tongyi, Huawei Pangu, Xunfei Xinghuo, Shangtang Ririxin, Netease Fuxi y más de 30 modelos a gran escala. En el sitio de la conferencia, los gigantes abandonaron el concepto uno tras otro, dieron un paso más y mostraron los logros de cada empresa.
En la tarde del 7 de julio, en la Huawei Developer Conference 2023 (Cloud), Zhang Pingan, Director Ejecutivo de Huawei y CEO de Huawei Cloud, anunció que se lanzó oficialmente Huawei Cloud Pangu Model 3.0. También dijo que el "modelo Pangu de Huawei está muy ocupado, ocupado con cosas y no tiene tiempo para escribir poemas". También se considera que este movimiento implica que al modelo publicado anteriormente le gusta escribir poemas y prosa en la conferencia de prensa. Porque Huawei espera usar el modelo grande de Pangu para ayudar a varias industrias, como finanzas, asuntos gubernamentales, minería, meteorología, etc., en lugar de centrarse en el nivel de modelo grande de voz.
Se dice que hasta ahora, el modelo grande de Pangu se ha implementado en meteorología, investigación y desarrollo médico, energía eléctrica, lenguaje y otros campos, y ha entregado múltiples modelos grandes con cientos de miles de millones de parámetros.
Zhou Jingren, CTO de Alibaba Cloud, mencionó que "el objetivo principal será promover la prosperidad de la ecología modelo a gran escala de China y brindar servicios integrales a las empresas emergentes a gran escala". Obviamente, esto continúa con el concepto MaaS (Model as a Service) propuesto por Alibaba Cloud.
Baidu es uno de los primeros jugadores, y su modelo Wenxin a gran escala siempre ha atraído la atención de la industria. En esta conferencia, el director de tecnología de Baidu, Wang Haifeng, dijo que Baidu ahora se ha actualizado a Wenxin Model 3.5. El efecto aumenta en un 50%, la velocidad de entrenamiento aumenta 2 veces y la velocidad de razonamiento aumenta 30 veces.
Además de las noticias del "equipo nacional", las principales empresas de Internet como Tencent también están acelerando el proceso de grandes modelos desde el concepto hasta la implementación.
En los últimos 20 días, las fuertes noticias de Tencent sobre el modelo grande se han difundido con frecuencia. El 19 de junio, reveló públicamente sus pensamientos sobre modelos grandes por primera vez. El 26 de junio, reveló por primera vez la red informática de alto rendimiento Xingmai de desarrollo propio. El 7 de julio, Wu Yunsheng, vicepresidente de Tencent Cloud y jefe de Tencent Cloud Intelligence, presentó que, en términos de innovación de aplicaciones, las capacidades del modelo industrial a gran escala de Tencent Cloud se aplican a escenarios como el control de riesgos financieros, la traducción interactiva y el servicio al cliente digital inteligente, lo que mejora la eficiencia de las aplicaciones inteligentes.
** Se puede ver que con la rápida afluencia de fabricantes, los modelos domésticos a gran escala han superado rápidamente la etapa de concepto, y ahora cada empresa se está enfocando en cómo implementar y comercializar. **
En la guerra de ascensión que ya ha comenzado, el umbral se ha elevado y la dificultad ha aumentado. Este no es un desafío pequeño para cualquier fabricante.
Abra el "volumen" en todas las direcciones para aprovechar la postura correcta del "terreno elevado" del modelo grande
De hecho, aunque el modelo grande es muy popular, es bastante difícil desde que ingresa al juego hasta que aterriza y lo empuja al mercado, y ya han surgido muchas dificultades. La financiación, los talentos, la infraestructura, los escenarios y la comercialización se han convertido en una "carrera de obstáculos" que todo jugador debe superar.
En la etapa inicial del desarrollo de modelos grandes, algunas personas en la industria dijeron que "los modelos grandes son el juego de los grandes fabricantes", lo que implica que "los modelos grandes son muy caros" y solo los grandes fabricantes pueden pagarlos. Según estadísticas incompletas de Titanium Media, en 2022, Huawei invertirá 161.500 millones de yuanes en gastos de I+D, convirtiéndose en la empresa con mayor inversión en I+D, seguida de Tencent con 61.400 millones de yuanes y Alibaba con 55.500 millones de yuanes. En los últimos diez años, Baidu ha invertido más de 100 000 millones de yuanes en el campo de la IA. La inversión anual en I+D por parte de los principales fabricantes de Internet les ha permitido contar con un sólido equipo de I+D y convertirse en un merecido "primer escalón" en la pista de modelos a gran escala.
Pero no pueden apostar ciegamente sin esperar nada a cambio. A juzgar por la dinámica actual, todos están acelerando la implementación de la industria. Se invierten fondos sólidos en investigación y desarrollo, se comercializan lo antes posible y luego se invierten en el desarrollo y capacitación de modelos de IA; este es un ciclo que apoya a los jugadores de modelos a gran escala.
Tal como dijo Li Qiang, vicepresidente de Tencent y presidente de negocios gubernamentales y empresariales de Tencent: "En la era de los modelos grandes, los datos, la red y el poder de cómputo constituyen el 'triángulo de hierro' de la infraestructura subyacente". Al mismo tiempo, también dijo: "Modelos para industrias verticales, será el punto de inflexión del valor de los modelos a gran escala". La implicación es que el capital y la tecnología son solo las condiciones y el impulso necesarios para ingresar al modelo a gran escala. industria, y lo más destacado todavía está en el nivel de aterrizaje.
El talento es una parte extremadamente importante de la competencia de aterrizaje de modelos a gran escala.
En el primer trimestre de este año, varias empresas iniciaron una "guerra por el talento". En ese momento, Wang Huiwen expresó su voluntad de adquirir el 75% de las acciones para invitar a los mejores talentos de I + D, y Li Kaifu pidió reclutar talentos de clase mundial en todo el mundo. Baidu está dispuesto a contratar ingenieros de algoritmos de modelos a gran escala de IA con un salario mensual de 25 a 40 000. 40 a 70 000 de salario mensual para contratar ingenieros de formación de modelos y algoritmos a gran escala. Al mismo tiempo, en un sitio web de reclutamiento, el salario de los puestos de operación y productos modelo a gran escala ha alcanzado un nivel de salario mensual de 35-60k.
En segundo lugar, la "infraestructura", como los algoritmos, el poder de cómputo y los datos, siguen siendo la máxima prioridad del modelo grande. De acuerdo con la evaluación de 10 grandes modelos de IA en el país y en el extranjero por parte de instituciones relevantes, en general, los grandes modelos nacionales superan a los modelos extranjeros en términos de comprensión de palabras y preguntas de conocimiento, es decir, los grandes modelos nacionales de IA. [gf] 2f42[/gf]Cognición básica y capacidad de aprendizaje de los personajes [gf] 2f12[/gf] es más fuerte. Pero al mismo tiempo, también se debe tener en cuenta que, a nivel de datos, el desarrollo de modelos grandes requiere conjuntos de datos de entrenamiento de alta calidad.
En términos de poder de cómputo, aunque algunas empresas tecnológicas líderes como Ali, Baidu, Tencent y Huawei han completado la construcción de centros de datos en mi país, y los jugadores en campos verticales como SenseTime y Megvii han invertido mucho, todavía hay una mucha capacidad Poco margen de mejora.
Finalmente, están los escenarios de aterrizaje y comercialización.
El alto costo de comercialización en diferentes escenarios de subdivisión y en diferentes industrias también es un problema común que enfrenta la industria. Se estima que el costo de entrenar un modelo grande es de entre 2 y 12 millones de dólares EE.UU. En general, la realización comercial de modelos grandes de IA llevará tiempo.
Los fabricantes más pragmáticos optan por centrarse en algunos de sus puntos fuertes. Por ejemplo, Tencent tomó la delantera en el aterrizaje en los campos de las finanzas y la educación, y el servicio MaaS de ventanilla única redujo la carga de las empresas; después de la actualización del modelo grande de Baidu Wenxin, el costo se redujo al 10% del pasado. Hasta ahora, Baidu Smart Cloud ha logrado buenos resultados de prueba en más de 400 escenarios con más de 300 socios ecológicos. Huawei ha comenzado a trabajar duro en sus propios campos gubernamentales y empresariales...
Se puede ver que esta gran batalla de modelos sobre el futuro está en pleno apogeo.
Escribir al final
Bajo la "guerra de modelos grupales", cualquier jugador debe aprovechar la oportunidad, y muchas personas lo consideran una ventaja de los tiempos. Esto es comprensible En esta pista cada vez más competitiva, aunque hay muchas dificultades, los modelos domésticos a gran escala todavía se están moviendo hacia una dirección técnica y de comercialización más completa y pragmática. ** Este tipo de situación de competencia industrial que es animada y práctica está destinada a acelerar el ritmo de desarrollo de la tecnología modelo a gran escala de mi país y promover la actualización tecnológica general de la industria de IA de China. **