百度集团副总裁吴甜:文心大模型3.5能力已经超出ChatGPT3.5

7月19日消息,“新版本文心一言的能力已经超出ChatGPT 3.5,这也是在我们国内开展相关技术工作重要的里程碑。”百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜向网易科技等媒体表示。

她介绍,IDC 最新发布的《AI 大模型技术能力评估报告,2023》显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。

据悉,IDC 评估报告围绕产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,国内主流大模型包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。报告结果显示,百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

吴甜介绍,百度自2019年开始深耕预训练模型研发,先后发布知识增强文心系列模型。前不久,百度正式发布文心大模型3.5版本,进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新,新版本在各项能力上均有明显提升。

具体而言,她表示文心大模型取得“第一”得益于百度“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。尤其是百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。飞桨与文心的协同优化,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

在大模型生态方面,她介绍,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度有超过750万开发者基础,20万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。

她直言,目前大模型产业化仍面临着巨大的挑战,总结起来有三方面:首先是大模型的体积确实很大,带来的训练难度高、成本高;第二是对算力规模要求非常大,性能要求非常高;第三在于数据规模也很大,收集、挖掘、建设、筛选、清洗这些数据,本身也是非常大的大工程。“大模型平台是价格昂贵的大算力系统,其实完全不需要存在大量的大模型,对于应用者来说也不需要每个应用都进行大模型的开发。”

至于“百模大战”的终局是怎样的?吴甜谈到,“过去短短几个月时间,大量新的大模型出现,但这是个阶段现象,未来各个企业和机构会逐渐找到自己的定位,下一步会走向自己细分的方向,终局只会集中在少量的几个大模型,但依托几个少量大模型,会有非常广泛的应用生态出现。”

百度集团副总裁吴甜:文心大模型3.5能力已经超出ChatGPT3.5 发布者:luotuoemo,转转请注明出处:https://www.chatairc.com/8683/

(1)
luotuoemo's avatarluotuoemo
上一篇 2023年7月20日 上午11:56
下一篇 2023年7月20日 上午11:57

相关推荐

  • chat forchange cn

    Chat for Change is a platform that aims to engage people in conversations about important social, environmental, and political issues in order to promote awareness, understanding, …

    2024年1月10日
    84900
  • chat gpt的翻译功能怎么使用

    GPT模型的翻译功能可以通过以下步骤使用: 准备输入:将要翻译的文本作为输入提供给GPT模型。 添加指令:在输入文本前添加指令来告诉模型要进行翻译。 示例指令:您可以使用以下指令之一来告诉模型需要进行翻译: “Translate this to [目标语言]:”(将这段文字翻译成[目标语言]:) “Translate in…

    2023年10月25日
    80300
  • chatgpt 利用人工智能改变传统零售业态,以无人便利店为例

    传统零售业态正在逐步转型,人工智能技术为此提供了一系列创新解决方案。无人便利店是其中之一的典型例子,它利用人工智能技术改变了传统的零售模式,提供更加便捷和智能化的购物体验。 首先,无人便利店利用人工智能实现了自动化的货物管理和库存控制。通过物联网技术和传感器,无人便利店实时监测商品的库存情况,当商品数量低于设定值时,系统会自动发出订单并补充货物。这种智能化的…

    2023年7月8日
    72200
  • chatgpt访问码

    chatgpt是什么? chatgpt是OpenAI开发的一个大型预训练语言模型,通俗一点说就是一个聊天机器人。它是GPT-3模型的变体,ChatGPT经过了训练,可以根据接收到的输入生成类似人类的文本响应,具有更自然、更多样化的特点。用户可以向它提出无数问题,而且通常会得到有用的答案。chatgpt的算法介绍ChatGPT背后的算法基于丛侍Transfor…

    2023年9月3日
    63200
  • 前两个月国产类ChatGPT大模型如雨后春笋,为何最近都没声音了?

    国产类ChatGPT大模型的发展确实在前两个月取得了很大的进展,但最近似乎没有新的声音。这可能有几个原因: 项目进展:开发新的模型需要时间和努力。可能在这段时间内,研究人员和开发者正在进行更多的实验和改进,以提高模型的性能和稳定性。 研究方向变化:研究人员可能已经转向了其他研究方向或者正在探索不同的技术方法。这可能导致他们在一段时间内集中精力于其他项目,暂时…

    2023年7月15日
    76600

发表回复

登录后才能评论

联系我们

4000-747-360

在线咨询: QQ交谈

邮件:582059487@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
国内Chat Ai版本直接使用:https://chat.chatairc.com/