阿里云发布“地表最强”大模型,通义千问实力比拼GPT-4-科记汇

5月9日,在北京阿里云AI智领者峰会上,阿里云正式发布通义千问2.5大模型。在性能上,阿里云方面表示,该模型在中文场景已经赶超GPT-4 Turbo。相比上一代2.1版本,通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上分别提升9%、16%、19%、10%。

开源+免费,全方位赶超GPT

通义千问2.5的能力并不是空穴来风。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。与此同时,通义的最新款开源模型Qwen1.5-110B有1100亿参数,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列在业界的不俗实力。

据了解,通义的多模态模型和专有能力模型在业界具备顶尖的影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。

要知道在2023年4月,通义千问才刚刚发布,半年之后通义千问2.0发布就已经能够和GPT-3.5相媲美。如今通义千问2.5大模型更是咬紧全球大模型发展的领头羊,成为世界一流大模型之一。

通义大模型问世一年多来,发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

通义意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。为了能让用户得到更加智能化、趣味化的体验,今年以来,通义APP先后推出了“全民舞王”“全民唱演”“通义照相馆”及AI智能体等现象级应用,在“全民舞王”频道,用户上传一张照片就能跳“科目三”等舞蹈;在“全民唱演”频道,用户用一段音频就能驱动肖像照中的人物唱歌说话。这些热门应用背后都是通义实验室自研的前沿AI模型。

值得注意的是,开源是阿里云大模型的特点及优势。长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。

在现场,周靖人提到,经过近2年的持续进化,通义模型系列已成为最受中国企业欢迎的大模型。

一方面,不管是海外的 ChatGPT Plus(GPT-4)、Gemini Advanced、Claude Pro,还是国内的文心一言会员(文心一言 4.0)WPS AI等服务都有很高的收费。

另一方面,面向C端用户,通义千问主打一个全功能免费。据悉,“通义千问APP”正式更名为“通义APP”,目标实现所有功能“All in one”。名称更加简洁化的同时也将为更多对AI感到好奇的受众提供服务,成为每个人都能使用的“全能小助手”。

阿里云大模型的全生态合作版图

目前,通义大模型通过阿里云服务的企业客户数已超过9万,通过钉钉服务企业超220万,其中月活超170万。此外在Hugging Face、魔搭等开源社区,通义开源模型下载量累计超700万。

峰会现场,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地。

以前段时间非常火爆的小米SU7为例,这款车型就搭载了全新升级的“小爱同学”语音助手。乘客只需通过自然语言指令,即可在车载中控屏上轻松绘制出如“小猫爬上窗台”等生动画面,为亲子互动和乘车旅程增添无限乐趣。通义大模型在确保图片质量的同时,能够将出图时间缩短至5秒,效率提升一倍。

在小米手机端,“小爱同学”还可以完成一键拍照生成菜谱、户型图分析、提供P图建议等复杂的图片理解任务。用户还可以向“小爱同学”发出语音指令,请它创作一幅山水画、梗图或创意设计文案。

小米集团小爱总经理王刚表示:“小爱同学发布七年来,每天被唤醒超过2亿次,已精通连续对话、一句话多指令、高噪唤醒等功能。具备了多模态AI生成能力的小爱同学,也会让手机、汽车等智能终端的多维度感知数据发挥出更多价值。”

受小米集团强劲的品牌影响力和市场竞争力的影响,此次小米旗下“小爱同学”与通义千问合作,无疑能够极大促进该大模型的推广与发展。根据公开资料显示,小米SU7首月累计订单达8.81万辆,交付7058辆,创下业内新品牌首款车型上市首月交付量新纪录,全年交付目标10万辆。此外据IDC报告,2023年小米手机出货量1.459亿部,在全球排名第三。

新东方也是阿里云大模型的合作伙伴之一。4月18日,阿里云AI智领者峰会上宣布,新东方已接入通义千问大模型,并且有了实际的应用。新东方在会上表示,通义大模型已正式“上岗”,在学生体验、教师教学质量、教研内容研发等场景,学员满意度整体提升了3%。

据新东方相关负责人表示:“以往,我们投入大量的人力物力才能将学员满意度提升1%—2%,现在基于大模型几乎可以零成本做到这件事情。”

去年10月,俞敏洪在与李彦宏对话时就曾发表自己对AI的看法。他犀利地指出:“人工智能在教育领域,对孩子们没有什么太多的好处,但是对老师们好处非常大。”

有了AI的帮助,可以让老师的备课、批改作业、知识检索变得更加容易,从而把更多精力放在教学研发和对学生的指导上。于是,俞敏洪果断选择“拥抱AI”,让AI来为老师减负。

实际上,AI对新东方的赋能远不止体现在教育行业,当下东方甄选涉及的电商、物流与供应链、农业三个领域,都可以借助AI降本提效。零售电商方面,东方甄选的自营平台可以利用AI算法分析消费者的购物历史、浏览行为、搜索关键词、社交媒体互动等多维度数据,构建个性化的购物推荐系统。物流与供应链方面,东方甄选能够通过AI预测销售趋势、监控库存水平、考虑供应商交货周期等因素,精准计算补货数量和时间,避免过度库存导致的资金占用,或缺货导致的销售损失,实现供应链的整体优化。农业方面,AI可以通过图像识别技术分析作物生长状况、病虫害发生情况以及土壤湿度等信息。

据悉,中国科学院国家天文台人工智能组基于通义千问开源模型,还开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义大模型支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

如今,阿里云大模型的朋友圈越来越大,微博、众安保险、完美世界游戏等企业都宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。更早之前,同程旅行、长安汽车、西部机场集团、满帮、T3出行、企迈、亲宝宝等企业也都与通义大模型达成合作。

在AI发展的竞赛场上,各家企业的“厮杀”甚是激烈。银河证券表示,未来通用AI大模型领域可能会更加集中在头部厂商,更多厂商需要向行业专业化转型,垂直类AI大模型、端侧AI大模型将是未来主战场,市场空间广阔。

阿里云发布“地表最强”大模型,通义千问实力比拼GPT-4-科记汇

张子鹏(newsmedia007)

---------------------

不保证以上内容的准确性和真实性。市场有风险,投资交易需谨慎。所涉标的不做任何推荐,据此投资交易,风险自担。

科记汇,资深财经媒体人创办,财经报道先锋,年阅读观看量数亿。关注研究重大财经动态、企业家精神、商业文明发展历程,报道大型企业、上市公司、创业公司关键发展节点。内容同步近三十家网络平台。欢迎提供报道线索和采访机会。