新闻

OpenAI推出GPT-4o图像生成功能;高通向多家反垄断机构投诉Arm“损害竞争”;宇树科技2020年就已盈利。

Gemini 2.5 Pro支持文本、图像、音频、视频及代码的多模态输入,上下文窗口达100万token(约75万单词),可解析完整《指环王》系列文本。

第七代TPU加速器“Ironwood”,单芯片峰值算力可达4,614 TFLOPs。

当地时间2月5日,谷歌公司发布Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本,谷歌称Gemini 2.0 Pro目前具有该公司发布模型中最强的编码性能和处理复杂提示的能力,具有200万个tokens。谷歌还在其Gemini App中推出推理模型Gemini 2.0 Flash Thinking实验版本。

谷歌版ChatGPT瞄准多模态,直击GPT-4痛点;滴滴与广汽埃安成立合资公司;“交个朋友”曲线上市;阿里系淘天集团首次亮相,定调“三新”变革。

美国谷歌旗下的“深层思维”公司宣布,推出新一代人工智能视频生成模型Veo 2,在视频分辨率与图像质量以及模拟真实世界物理规律方面大幅提升。该公司称, Veo 2可以创建4K分辨率、时长两分钟的视频,大幅领先美国开放人工智能研究中心(OpenAI)日前公布的最新视频生成模型Sora Turbo。据介绍, Veo 2能根据文本提示或参考图像生成视频,可以更真实地模拟运动、流体力学和光的特性,实现不同的镜头和电影效果,以及“细致入微”的人类表情。“深层思维”公司产品副总裁柯林斯表示,在接下来的几个月里,公司将继续根据用户的反馈对产品进行迭代。他承认目前Veo 2仍有不足,该模型生成视频的“连贯性和一致性尚需改进”,在生成复杂细节、快速复杂动作以及突破现实局限方面也有进步空间。