首页 其他内容详情

大模型已经卷到头了,AI 赛道还有哪些新机会?

2024-06-12 1392 区块链百科
大模型已经卷到头了,AI 赛道还有哪些新机会?

站点名称:大模型已经卷到头了,AI 赛道还有哪些新机会?

所属分类:其他

官方网址:

SEO查询: 爱站网 站长工具

进入网站

站点介绍

文章来源:THINKTANK新智囊

 

 

 image.png

 

片来源:由无界AI生成

 

 

5月28日,OpenAI 表示,它已开始训练一种新的 AI模型,模型将接替驱动 ChatGPT 的 GPT-4。直至今日,OpenAI 仍被公认为掌握了大模型核心秘密的公司,其先地位尚未动摇,其他公司还处于追赶状

 

经过 2023 年“百模大的洗礼,国内的大模型竞赛入了下半。今年5月,智AI的入门级产品GLM-3 Turbo模型、字的豆包大模型、百度的文新大模型等一众厂商,掀起了一大模型降价潮,其中,阿里云的措最大,9 款主力模型纷纷宣布降价。各家正在快速占市,从而加速商化落地。

 

从“卷技”到‘卷价格”,大模型的还远束,但它已注定成了少数人的游。在《云上的中国3: 剧变中的AI代》中,吴带领作者团队经过实研与深入采访,捕捉记录近2年AI行展和技术创新,客观还原行业现状和各行各中的应⽤场景,探索生成式AI真正的商

 

 

 

 

 

烧钱之后

 

ChatGPT 并没有覆世界,但它底改了每个人人工智能这项的看法,同也吹响了全球科技企开展大模型“军备竞赛的号角,示着一个新的人工智能代的到来。

 

去一年,在中国人工智能域中,“百模大绝对是一个不开的话题。2023 年3 月 16 日,百度官宣新一代大言模型文心一言启请测试。2023 年 4 月,通大模型在阿里云峰会上揭。2023 年 9 月 7 日,在一年一度的全球数字生大会上,腾讯的混元大模型正式外亮相。

 

接着,华为、京、字、美、科大讯飞等科技互网大厂也纷纷入局。此外, 移通、信三大运商,清、复旦、哈工大等高校和科研院所,有达数据、百川智能、第四范式、出门问问等人工智能新公司,都在 2023 年布了各自的大模型。

 

任何怀大理想且具有研能力的科技企,都想将大模型研的主动权握在自己手里。事上,大模型,从一开始就注定是一“高门槛的游”。如果没有雄厚的金支持,甚至拿到入券的格都没有。据国盛告估算,GPT-3 训练一次的成本约为 140 万美元。在 GPT-4 的布会上,OpenAI 的 CEO 奥特曼透露,单单 GPT-4 训练总成本就超了 1 亿美元。

 

训练后,大模型的运行成本也不菲。以 ChatGPT 在 2023 年 1 月的独立访客平均数1300 万算,其对应芯片需求 3 万多个 A100,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。

 

疑的声音也随之出:大模型本身并不会直接生价,无怎么“卷”大模型的研,最终还是要回到商的本上来,公司不能一味烧钱,必向盈利的目标迈进

 

2023 年 4 月,钉钉、天猫精灵等品已接入了通问进测试,成国内第一批“尝鲜大模型的品或用。充分体出互网大厂优势,它本身的业务场景足丰富和多,哪怕没有外部客,大模型品在自己的业务上也有足多的验证化。

 

很快,阿里巴巴找到了 AIGC 域的第一款爆款用——妙相机。2023 年 7 月 17 日,妙相机正式在微信小程序上线。用只要付 9.9 元,上 20 照片,就能制作出一套 “数字分身”,使用“数字分身”又可以制作出多套不同格的写真,是一个前所未有的 AI 像生成品,上线后迅速在社交媒体刷屏。

 

本在“Generative AI’s Act Two”(《生成式 AI 的第二幕》) 一文中指出,目前生成式 AI 用的最大问题,是需要明自身的价,因目前基于基大模型开用用留存率明。当前部消费级 App第一个月的用留存率能达到 60%~65%,甚至能达到 85%。生成式 AI 用的用留存率,中位数只有 14%。意味着,用户还没有在生成式 AI 品中找到足,不能每天都使用。如果开者想要建立起持久的业务,就需要解决用留存问题

 

相机的负责旭也提到,我思考的是否能 AIGC 足需求或解决痛点。而并不是,因有了 AIGC 的能力,才去探索技在哪个景更适合落地。之, 这应该是一个从用需求出,反向倒推的程。

 

在“百模大”的下半,在人工智能横多年的互网大厂开始构建大模型生:在 C 端,大厂面向作者和开者提供服;在 B 端,以提供解决方案主, 尤其偏重金融、文旅、媒、医、政等行,同其余大模型研提供算力、数据管理等基础设施服

 

 

 

 

数据的难题

 

如果算力烧钱可以解决的问题,高量数据的是大模型展中一个不开的难题。从训练到部署用迭代,AIGC 众多垂直景的落地,通用智能、具身智能等前沿域的探索,都与高量、专业化的景数据密不可分。

 

其中,数据注扮演着不可或缺的上游角色,经验丰富的专业团队或受过专门的人对结构化及非构化的原始数据集致的标识、分、注标记操作,些原始数据涵盖像、文本、音视频,乃至复的自动驾驶数据等多种形的数据源。

 

追溯行业发展初期,数据注完全依人工手完成,以此构筑和丰富机器学模型所需的训练数据集。尽管种方法耗时费力且成本高,但人工注的确在确保准确性方面表出无可替代的优势

 

在人工注的数据中,最著名的当属李飞飞与普林斯大学的李教授 2007 年合作建的 ImageNet。人的眼球平均每 200 毫秒就移一次,如果将眼睛视为一个照相机,那么一个三的儿童就已亿张图片了。李飞飞认为,正是因如此大量的学,人才具备视觉识别的能力,要让计算机具备视觉识别能力,就需要大量的训练材料。

 

由于注需要大量人工劳动,ImageNet通算技术进行众包,全球 160 多个国家近 5 万名网民网上的注。到 2009 年,ImageNet 上已包含了 2.2 万个类别的 1500 万张经过清洗、分注的片。并且个数据完全开源,免提供全球所有研究者。可以飞飞创建的 ImageNet 大大加速了人工智能识别展,也全世界看到了深度学的无限潜力。

 

由于数据注并非多客公司的主营业务,它们倾向于将其外包,也因此催生了一众专业数据注初公司,例如Scale AI、Dataloop、SuperAnnotate等。这类公司开始尝试人机同的新模式,利用模型筛选和初步注数据,随后交由复核校,相传统人力注方式,种 AI 注手段有效提升了注速度。

 

当然,数据注只是第一步。如果数据注是模型提供训练样本,那么数据向量化就是将数据一步大模型可以理解的言。简单,向量是大模型传输数据的基本元。无是一句言,是一张图片,想大模型理解些信息,它首先要化成一个向量。有了向量数据,大模型就可以其中的数据一步的交互和推理,从而帮助大模型理解有概念和数据,并减少幻

 

随着 2022 年底大模型的爆,向量数据也迎来了自己的“iPhone 刻”。

 

2023 一年,有一家中国 AI 基础设创业公司及其品被 OpenAI和英达两家 AI 巨推荐合作伙伴,就是 Zilliz,其向量数据库产 Milvus 和 Zilliz Cloud,这让 Zilliz AI 域无人不知的人工智能基础设创业公司。

 

目前大模型用落地的主要点有两个。第一个是数据的实时性,例如 ChatGPT 的训练数据并非实时更新。而大言模型的工作原理——预训练模式决定了模型重新训练一次需要巨量的算成本和时间成本。

 

普遍的解决方案有两种,一是通大模型微的方式迭代演大模型学到更多的知;二是通向量搜索的方法,把最新知存在向量数据中,需要在向量数据中做基于语义的向量索。

 

但两者的成本天差地。使用向量数据的成本是微的千分之一量也是什么大模型厂商都无一例外地推荐开者使用向量索的方式做知识库管理,以便和模型有一个更好的交互,降低落地使用成本。

 

第二是私有数据的保护问题。假将企的私有数据,如利知用于公有大模型的训练,那就等于向所有人开放了利知于企种方式是不现实的,而通向量数据的方式,将企的私有知识转提示不会用于训练和微

 

 3e135d6e28322cd1e412ac86683badbc_FrpZAweepqMmoYGp-3KdFpTvdkPB.jpg

 

 

探索新

 

经过一年多的模型大,关于生成式 AI 的讨论正在从“比参数、跑得分、拼排名”向“的模型更开放、推理成本更低、算力更便宜。

 

界的共是,随着基大模型道的争格局埃落定,更多的新和价值创造正在向层汇聚。麦肯的研究告称,生成式 AI 有望全球经济贡 7 亿美元的价,目前大模型的新主要有两种方式。第一种是利用大模型改造有的各种件和用,也就是“用 AI 把所有用重做一遍”;而另一种方式是 AI 原生新,即利用大模型能力, 造出全新的服景。

 

不同于多数仍在着力于任务执行和信息传输功能的 AI 技,聆心智能携手清大学 CoAI 研究团队,将研究重心定在“如何使 AI 能与人建立深次的情感接”课题上。聆心智能孵化自清大学,致力于打造新一代“安全、可控、人” 的超人大模型并建立相关用生

 

2020 年中国一项针对 18~29 群体的研究揭示,超六成的青年人繁受到孤独感的困。孤独不可能致情绪压问题还对个体生理健康和心理健康著的面影响。

 

在扎的学研究基上,CoAI 课题组与聆心智能合推出了首款心理愈机器人 Emohaa 的初始版本,款机器人在短短时间内即服了超 2.4 万名用,累交互次数高达 49.7 万次。

 

得关注的是,课题组与北京范大学心理学部合作开展的一项实验证明,在接受期三周的Emohaa 初版持心理干后,参与实验的被试对象在焦症状、抑郁向、消极情及睡眠量等方面均呈出明改善。

 

基于学研究成果和实际应用成效,聆心智能与 CoAI 课题组再次手,推出了全新升版的共情陪伴大模型 Emohaa。新版 Emohaa 包含多个不同参数级别的子模型,搭了能合成切柔和音的音合成技,存了海量知识库,能简洁、高效灵活地回需求。

 

如此,Emohaa 在深度理解用情感、感同身受地体会用户经历、主导对话走向以及与用一起探内心世界等方面的能力得到了著提升,一步化了与用的情感纽带。聆心智能团队的目是将 Emohaa 塑造成一个得人深深信的大模型,它具备稳定持久、富有耐心的特点,待人保持中立而善良的度,随备给予无条件的支持。在不久的未来,也每个情感受困的人都能有可以聆听自己心声的 AI 伙伴。

 

本文接:https://www.aixinzhijie.com/article/6846014

转载请注明文章出


浏览统计(最近30天)