钛媒体App 3月11日消息,谷歌周二发布其首个原生多模态嵌入模型Gemini Embedding 2,将文本、图像、视频、音频及文档统一映射至单一嵌入空间,彻底实现跨模态检索与分类,支持超过100种语言。相比仅处理文本的前代,新模型支持最多8192个文本输入token,图像单次最多6张,视频最长120秒,音频无需转录,PDF限6页。模型已通过Gemini API和Vertex AI开放预览,适用于RAG、语义搜索、情感分析等场景。(广角观察)
上一篇:2026南京优秀高功率密度电源源头定制分析,助你挑好商,军用电源/光伏电源/铁路电源,高功率密度电源生产直销哪家好
下一篇:剑指工业与物理AI:AMD锐龙AI嵌入式P100系列高端型号重磅登场