当前位置 爱咖号首页 阶跃星辰与吉利宣布开源两款多模态大模型,加速汽车领域AI普及

阶跃星辰与吉利宣布开源两款多模态大模型,加速汽车领域AI普及

布朗倪Suki 4557浏览 2025-02-21 IP属地: 未知

2月18日,阶跃星辰和吉利汽车集团联合宣布:将双方合作研发的两款阶跃 Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。



阶跃星辰是吉利汽车集团的科技生态战略合作伙伴,拥有国际顶尖的算法团队。2023年开始,吉利便与阶跃星辰展开了深度合作。其中,吉利牵头了场景设计、模型测评、工程开发等业务,阶跃星辰主导了模型预训练等业务,双方优势互补,显著增强了两款阶跃Step系列多模态大模型的性能表现。


阶跃Step-Video-T2V大模型参数量达到300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,是当前全球范围内参数量最大、性能最好的开源视频生成大模型。阶跃Step-Audio大模型能够根据不同的场景需求,生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话,是行业内首个产品级的开源语音交互模型。



在全球最强开源的阶跃Step系列视频生成大模型、语音交互大模型,以及汽车行业全场景大模型的综合赋能下,吉利将在行车安全、紧急避险、智慧泊车等全场景为用户带来自动驾驶程度更高、更安全的高阶智驾体验,同时打造更加智能的汽车情感座舱,重新定义人车交互体验,推动AI科技在智能汽车领域的普及应用。


吉利星睿AI大模型中的AI Drive大模型,具备强大场景生成与规划能力,能够根据雨雪等不同天气光照条件、道路结构、拥堵路况、立体车库和不常见的交通目标,构建出真实驾驶中难得一遇的极端驾驶场景。基于真实的驾驶视频数据去优化阶跃Step-Video-T2V,可以将它变成一个自动驾驶数据合成器。星睿AI大模型正在探索将这些丰富的合成场景转换成“以假乱真”的训练数据,相当于自动驾驶系统打造了一个丰富的"虚拟驾考考场",从而显著提升车辆在智驾行驶时面对各种路况的应变能力,保障行车安全。


在阶跃Step-Audio大模型超强交互功能赋能下,吉利星睿AI大模型可以大幅提升语音指令响应速度,以及交互过程的情感理解与表达能力。当用户说“导航,快迟到了”的时候,系统不仅会自动规划更快路线,还会主动询问是否需要播放轻音乐缓解情绪。同时,系统不仅可识别粤语、四川话等丰富的方言,还支持个性化声音定制,用户既可以选择系统提供的人声音色,也能录制孩子的笑声制作专属提示音,甚至让车载AI模仿山涧流水声营造车内冥想空间,陪伴用户的每一次出行。


除此之外,吉利也是首家与DeepSeek完成深度融合的车企。通过携手DeepSeek-R1模型,吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。届时,吉利智能汽车AI不仅能对用户的模糊意图实现精准理解,进而准确调用约2000个车载接口,还能基于车内外场景主动分析用户潜在需求,并为用户主动提供车辆控制、主动对话、售后等服务,智能交互体验将大幅提升,加速AI在智能汽车领域普及。


目前,基于“智能汽车全域AI”技术体系打造的AI银河精灵、Flyme Auto 智能座舱、无界空间、AI云动力、AI绘本、AI哨兵等一系列AI应用,已在银河E8、银河E5、银河星舰7EM-i等车型上搭载。今年3月初,吉利还将对外发布重磅AI智能化战略,加速推动AI数字底盘、高阶智能驾驶等最新AI技术的逐步上车,为用户带来颠覆性的智能化体验。

文章标签:
行业分析
 
相关推荐
布朗倪Suki 5.9万粉丝    972作品 关注 布朗倪带你一本正经胡说八道聊车侃大山,只有想不到没有说不了~
推荐作者
小马闲话 关注
闲话汽车,行摄四方
大付撕车 关注
大付撕车是汽车视频类栏目。栏目主张正确的选车观,为重度选车纠
SCC超跑俱乐部 关注
SCC超跑俱乐部
未来车事 关注
孤独与世界与诗
车市八爷 关注
宁波最知名的汽车新闻主流媒体之一,爱卡分享一手新闻、新车、评测
海阔试车 关注
汽车圈里摸爬滚打,一起聊聊汽车的那点事
那啥车 关注
每一台车都有自己的灵魂;那啥车?对!我的车。
靓车大咖会 关注
了解最新汽车资讯,汽车养护知识
全部爱咖号