¿Qué debe saber sobre el Yi-34B?

Cerca de una mujer bonita sosteniendo un teléfono inteligente en la mano hablando con un asistente digital o un amigo … [+] utiliza a distancia mensajes de voz sencillos, concepto de tecnología moderna de IA, reconocimiento de voz, traductor en línea

getty

Si no está familiarizado con ese conjunto de letras y números, no está solo: la mayoría de las personas no reconocen de inmediato este apodo para uno de los nuevos modelos más poderosos que ha llegado al mundo de la IA. No, no es un virus nuevo. Es IA.

Como ocurre con gran parte de lo que estamos viendo estos días, el contexto lo es todo.

Si se profundiza en el nombre y se profundiza en el origen del modelo, se empieza a ver más sobre lo que está sucediendo a nivel internacional, a medida que los líderes trabajan para lograr innovaciones en la industria que tendrán un gran impacto en nuestro mundo.

¿Qué hay debajo del capó?

La serie de modelos Yi está fabricada con LLM de 6 y 34 bits, ambos de código abierto. Hay una longitud de secuencia de 4K, en un modelo de entrenamiento grande de 34 mil millones de parámetros que supera los 70 mil millones de otros diseños Meta de Llama 2. También está disponible un modelo más pequeño de 6 mil millones de parámetros.

Detrás del proyecto

La empresa en sí, 01.AI, es nueva y fue fundada este año por alguien llamado Kai-Fu Lee.

Lee es un empresario taiwanés que se educó en Estados Unidos y tiene experiencia en Apple, Microsoft y Google.

Después de involucrarse en los negocios, regresó al otro lado del mundo, renunció a su ciudadanía estadounidense y creó un gran fondo de capital de riesgo al mismo tiempo que innovaba en nuevos productos.

Notas citables

Entonces, ¿quién es esta persona que tiene tanta experiencia con la frontera de la IA?

Veamos algo de lo que Lee ha dicho públicamente sobre la industria.

Como se ha informado ampliamente, sugiere que la IA nunca alcanzará los rasgos humanos que nos dan nuestra creatividad especial.

“La IA puede hacer cosas extraordinarias”, supuestamente dijo Lee a la audiencia, “pero carece del alma y el propósito que definen el ingenio humano”.

Además: “Lo que la IA no puede reemplazar son las conexiones humanas que nos dan propósito y significado a la vida”.

También se ha pronunciado sobre el posicionamiento y el punto de vista chino hacia la IA, diciendo:

“China ha despertado al poder de la IA y se está moviendo a una velocidad sin precedentes para tomar la delantera”.

Aquí es donde se ve el interés estadounidense reaccionando al avance, principalmente tratando de ponerse al día, y preocupado de que el progreso chino eclipse lo que está sucediendo en el hemisferio occidental.

Luego hay algunas orientaciones que da sobre las prioridades de una sociedad:

“Debemos asegurarnos de que la IA sirva a la humanidad”, afirma Lee, “y no se convierta en una herramienta de management u opresión”.

Modelos abiertos y cerrados

También está el hecho de que los modelos Yi son de código abierto. Como hemos escrito en el pasado, existe una compensación en la que los intereses estadounidenses tienden a pensar que los modelos de código abierto podrían usarse de manera poco ética y pueden abrir puertas a sistemas más avanzados.

Las ventajas de los modelos abiertos incluyen la accesibilidad, la colaboración y el avance common de la investigación comunitaria.

Eso parece ser parte de lo que hay detrás de la perspectiva de Lee sobre el suministro de estos modelos al público.

La period de la implementación

Aquí hay otra predicción que Lee hizo en una entrevista con BB.

Habla de que la period de la implementación es posterior a una period de descubrimiento, que presumiblemente sería ahora mismo.

Sugiere que la IA tardará 10 o 20 años en “penetrar en cada rincón y en cada aplicación”.

Así es como caracteriza el próximo gran avance:

“El próximo gran avance posible podría provenir de la combinación de las ciencias del cerebro y la IA, capturando algo sobre nuestro pensamiento lógico e ilógico, o de la computación cuántica o el {hardware}, o la semántica o la comprensión del lenguaje. Cada uno de los tres tiene entre un 5 y un 20 por ciento de posibilidades de marcar una gran diferencia. En los próximos cinco años, probablemente Web, las finanzas y el comercio electrónico sean las industrias más afectadas, donde hay transacciones inmediatas de dinero. Después de eso veremos un impacto en áreas como el comercio minorista, la atención sanitaria, la fabricación, la educación, el transporte y la automoción y la logística, incluido el almacenamiento/transporte/entrega. Con el tiempo, la IA lo penetrará todo”.

Todo esto es fundamentalmente centrado y orientador, a medida que analizamos dónde estamos con la IA y hacia dónde es possible que nos dirijamos en el futuro. Sabemos que existe este esfuerzo internacional y cierta competencia en términos de geopolítica. Sabemos quiénes son los actores de la empresa y qué están haciendo. Lo que es difícil de ver es lo que se avecina a la vuelta de la esquina.

¿Qué hay debajo del capó?

Detrás del proyecto

Notas citables

Modelos abiertos y cerrados

La period de la implementación

Leave a Comment Cancel reply