首页 快讯内容详情

商汤科技迈向多模态大模型的新纪元

2025-05-09 5 区块链百科

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。 商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。商汤不仅成功弥补了文本模型的差距,更在多模态领域厚积薄发,标志着其在国内大模型市场中越来越重要的地位。668671d00e089ec74a79aba31fbe5c32_202305091556165277_9.jpg图源备注:图片由AI生成,图片授权服务商Midjourney 值得注意的是,商汤在构建其多模态模型的过程中,采用了独特的思维链构建方法。通过将文本、图像、语音和视频数据融合,商汤的日日新 V6能在同一上下文中进行有效的推理,达到1+1>2的效果。这一创新不仅提升了模型的理解与生成能力,也使得多模态之间的协同作用更加显著。 当前,尽管市场上出现了众多多模态模型,能够同时处理多种数据模态的产品依然屈指可数。商汤的日日新 V6凭借其在多模态数据融合方面的成功,逐渐显示出其在未来人工智能竞争中的强大潜力。https://www.aibase.com/zh/news/17922