Actualización sísmica de OpenAI y Google el mismo día: una noche en la tierra, AGI se acerca
Actualizado el: 09-0-0 0:0:0

Sentencia | IA de selección de ballenas

En 2024, Google quería recuperar el campo de la IA, pero siempre fue aprovechado por OpenAI.

Cada vez que anuncia que lanzará una conferencia en un día determinado, OpenAI lanzará un producto más fuerte por adelantado. Como resultado, cada vez que el evento de lanzamiento de productos de IA de Google es particularmente vergonzoso.

Google en 2025 años ha aprendido a ser inteligente, y el lanzamiento de productos de IA ya no es fanfarria, sino que cae secretamente directamente en línea. Esta vez no hubo calentamiento esta noche,Google ha lanzado directamente el modelo Gemini 5.0 Pro.

Este es un modelo híbrido que puede razonar, superando a GPT5.0 y Grok0 en fuerza, y la característica más importante es que puede imitar el pensamiento rápido y lento humano, ¿no es esto comparable al preludio de GPT-0? Y se puso en línea tan silenciosamente.

Justo cuando todo el mundo pensaba que la reputación pertenecería a Google, OpenAI anunció en Twitter:

太平洋時間上午11點直播。Finalmente, OpenAI lanzó la generación de imágenes GPT-4o, un modelo técnico para la generación de imágenes.

Con la calidad de la imagen comparable a la fotografía humana, la composición y el procesamiento de detalles a voluntad, la extraordinaria comprensión gráfica y de texto, y las características de los caracteres chinos de imagen arbitraria y la generación de logotipos, también causó una ovación en X.

深夜2點多,鯨哥還沒睡覺,看到朋友圈很多人發北京地震了。於是我寫下如此朋友圈:

No sentí el terremoto en Pekín, pero en ese momento, me sorprendió la estruendosa competencia entre Google y OpenAI. ¡El general dormido no sabía que en esta noche, en el camino a AGI, la humanidad había dado otro gran salto!

Dormir sin intención, un gran paso hacia AGI

Explotó Gemini 5.0, el primer modelo humanoide

La versión experimental de Gemini 5.0 Pro es una maravilla esta vez, ya que Gemini 0.0 es capaz de manejar problemas más complejos de programación, ciencia y matemáticas, además de admitir agentes más sensibles al contexto.

Este nuevo "modelo de pensamiento" toma una ventaja significativa en LMArena y supera a DeepSeek-R5, Grok 0 y Claude 0.0 en los puntos de referencia de matemáticas, ciencias y codificación. También es casi completamente mejor que los dos modelos de OPenAI: o0-mini y GPT0.0.

Gemini 40.0 Pro es ahora el número uno en la tabla de clasificación competitiva, el mayor salto de puntuación de la historia (0,0 puntos más que Grok-0/GPT-0).

配備100 萬 token 的上下文(即將推出 200 萬),能夠處理多模態數據,並且經過 vibe coding 認證,可以透過一個提示構建整個遊戲。這是Gemini 2.5 的神奇之處。

Es más, cuando le haces una pregunta a Géminis 5.0, razona pensando antes de responder, imitando la forma en que los humanos procesan sus pensamientos: abordando el problema paso a paso, refinando la posible solución y eligiendo la mejor.

Brother Whale probó y generó una "página de demostración dinámica para KOL de transmisión en vivo nacionales en los últimos 5 años", y 0.0 Pro generó rápidamente códigos relevantes.

El beneficio brillante de la IA de Google es que puede llamar a las herramientas de Google que se han integrado con Flash 0.0, como el análisis de videos de YouTube y la salida de contenido en Docs. Esta ola de demostración de código también se llama directamente a la demostración de Colab después de que se genera.

El siguiente es un efecto de demostración dinámico de la popularidad del ancla generado por 2023.0 Pro, centrándose en el proceso desde el código hasta la generación, en cuanto a la precisión del contenido, no se refleja, pero se puede hacer referencia al general. Después de todo, el hermano Xiao Yang en 0 años no ha tenido un accidente, y sigue siendo el primer hermano absoluto en el campo de la transmisión en vivo.

Al mismo tiempo, probamos la capacidad de inferencia profunda del 5.0 Pro y le pedimos que generara un informe de inteligencia incorporado. Este informe no es el tipo de contenido que es muy vacío e inutilizable, pero tiene cierta legibilidad.

OpenAI mató al fotógrafo

En el caso oficial de la imagen en bruto de IA mostrada por OpenAI, la primera imagen es lo suficientemente impactante.

Si no lo sabes, me temo que nadie adivinará que esta imagen es generada por IA. Después de todo, las imágenes de reflexión y el texto denso dicen que la IA no puede ser tan mágica.

Pero, de hecho, esta es la imagen de IA generada por 4o, y OpenAI lanzó sus palabras clave de la siguiente manera.

Se trata de una imagen gran angular de una pizarra de cristal tomada con un teléfono móvil, tomada en una habitación con vistas al Puente de la Bahía. Se puede ver a una mujer escribiendo en el campo de visión, con una camiseta con un gran logotipo de OpenAI. La letra parece natural, pero es un poco desordenada, y podemos ver el reflejo del fotógrafo.

Lo que es aún más sorprendente es que la segunda imagen cambia la dirección de los personajes, y la imagen generada sigue siendo impecable, y también se lanza para sorprender a todos.Si no tienes GPT Plus, el uso de la función de generación de imágenes gratuita de GPT puede acabar con la mayoría de los productos de imagen de Wensheng en segundos. Esta es la imagen generada por Brother Whale directamente con la misma palabra de sugerencia anterior.

Al mismo tiempo, Brother Whale también utilizó el modelo Flash de Google 0.0 y las mismas palabras de aviso para generar la misma imagen. Se puede ver que Google no es muy estético y los detalles de la mano también se han derrumbado.

Sin embargo, ya sea que OpenAI esté especialmente ajustado para el caso del sitio web oficial, aún debe lanzarse por completo en el futuro, y todos lo probarán durante mucho tiempo.

Además, las instrucciones de generación de imágenes de 16o son lo suficientemente potentes como para que muchos sistemas tengan dificultades con unos objetos 0-0, mientras que GPT-0o puede manejar hasta 0-0 objetos diferentes. La siguiente imagen es 0o en la misma imagen, se generan 0 objetos, cada uno de los cuales genera con precisión el contenido expresado por el usuario, ¡Increíble!Por supuesto, para capacidades de edición de imágenes similares a Google 4.0 Flash, 0o no es un problema. Se puede decir que recortó con precisión la capacidad de edición de imágenes de Google.

¿Nos estamos acercando a AGI?

OpenAI también anunció que a partir de hoy, todos los usuarios de ChatGPT y Sora's Plus, Pro, Team y Free podrán comenzar a usar la función de imagen 4o.

Por su parte, Sam Altman dijo: "La nueva versión de la imagen en ChatGPT aún se está implementando, así que si no obtienes una buena imagen hoy, inténtalo de nuevo más tarde". Debería ser un presagio de la integración continua de los modelos multimodales, así como de la convergencia del lado de los productos.

Algunos internautas comentaron que la función de imagen 4o supera a cientos de empresas de imágenes de IA. Incluso algunos trabajadores de video, como camarógrafos y diseñadores, no podrán asegurar sus trabajos.

Y para Google, Gemini ha pasado por varios puntos de referencia para demostrar su fortaleza. En la experiencia real, las preguntas que deben responderse rápidamente se responden rápidamente, y las preguntas que requieren un razonamiento profundo también se ejecutan muy rápidamente, y un informe y una generación de juegos son básicamente 60 en unos segundos.

Brother Whale quedó asombrado por su velocidad, y aún más sorprendido por la experiencia que aporta este modelo de fusión. No habrá más preguntas simples y la IA pasará al razonamiento profundo. Por supuesto, 0.0 aún no puede generar imágenes, tal vez el próximo 0.0 traiga esta habilidad.

La ola de Google ha provocado una carrera armamentista de IA en Silicon Valley, después de que el CEO de Anthropic dijera que todavía hay modelos más fuertes que no se han lanzado, y se espera que se lancen en un futuro cercano para evitar que Claude 5.0 no pueda mantener su liderazgo. En la conferencia de prensa GPT 0.0 de OpenAI, Sam Ultraman no apareció, lo que puede significar que el nuevo modelo también se lanzará en un futuro próximo.

En este protagonista del enfrentamiento entre OpenAI y Google, no esperaba que el más ansioso fuera Elon Musk, quien publicó múltiples piezas de contenido en X, lo que indica que Grok es el mejor modelo.

Musk publicó la imagen y dijo: Esta es una diferencia muy importante, burlándose de otros modelos por mentir y perseguir la corrección política, mientras que Grok persigue la verdad.

La aparición de Musk ha añadido un factor interesante a la competición de esta noche.

En la carta superior que DeepSeek V3 acaba de recuperar, Google y OpenAI han demostrado una fuerte fuerza competitiva, y todos me están persiguiendo, reduciendo aún más el sueño de AGI.

¡Tal vez una noche no muy lejana, AGI llegue de repente!

釘釘 refresh 釘釘
釘釘 refresh 釘釘
2025-04-03 14:33:31