腾讯混元将有多款模型开源
时间:2025-07-28 09:43:31 作者:河马AI
7月27日,世界人工智能大会这一汇聚全球顶尖科技力量与智慧的盛会上,腾讯云副总裁兼腾讯云智能负责人吴运声发表了重要观点。他指出,当前国内在人工智能领域呈现出一片蓬勃发展的繁荣景象,大量开源大模型技术成果如雨后春笋般不断涌现。这些成果不仅是科研人员智慧的结晶,更是推动行业生态建设的强大动力。开源的大模型技术成果打破了技术壁垒,使得更多的企业和开发者能够参与到人工智能的研究与应用中来,促进了技术的快速传播与创新,为构建更加完善、丰富的行业生态奠定了坚实基础。
就在同一天,腾讯正式对外发布了令人瞩目的混元3D世界模型1.0版本,并宣布将其开源。这一具有里程碑意义的模型,拥有强大的功能和广泛的应用前景。它能够支持构建可交互探索的三维虚拟环境,为用户提供身临其境的沉浸式体验。无论是在虚拟现实游戏、数字孪生城市、远程教育还是工业设计等领域,混元3D世界模型1.0版本都展现出了巨大的潜力。例如,在虚拟现实游戏中,玩家可以通过该模型创建出逼真且充满互动性的虚拟世界,极大地提升了游戏的趣味性和沉浸感;在数字孪生城市方面,它能够帮助城市规划者和管理者更加直观地了解城市的运行状况,为城市的优化和发展提供有力支持。
而腾讯的规划远不止于此。后续,腾讯计划逐步开源混元系列模型中的多款产品,以满足不同场景下的应用需求。其中,面向终端设备及边缘计算场景的端侧混合推理大语言模型备受关注。这类模型针对不同的应用场景和设备性能,涵盖了0.5B、1.8B、4B、7B等不同参数规模的小型化版本。这些小型化版本的模型具有体积小、功耗低、推理速度快等优点,非常适合在资源受限的终端设备和边缘计算环境中运行。比如在智能手机、智能穿戴设备等终端设备上,端侧混合推理大语言模型可以实现本地化的智能语音交互、文本处理等功能,不仅提高了设备的智能化水平,还有效保护了用户的隐私数据。
此外,腾讯还规划开放多模态理解模型与游戏视觉专用模型的技术源代码。多模态理解模型能够同时处理多种类型的数据,如图像、语音、文本等,实现更加全面、深入的信息理解和分析。这一模型的开源将为人工智能在多媒体信息处理、智能客服、智能家居等领域的应用提供强大的技术支持。而游戏视觉专用模型则是针对游戏行业的特殊需求而设计的,它能够为游戏开发者提供更加高效、精准的视觉处理能力,帮助开发出更加逼真、精彩的游戏画面和视觉效果,进一步提升游戏的品质和用户体验。