腾讯混元将有多款模型开源-河马AI

腾讯混元将有多款模型开源

时间：2025-07-28 09:43:31 作者：河马AI

7月27日，世界人工智能大会这一汇聚全球顶尖科技力量与智慧的盛会上，腾讯云副总裁兼腾讯云智能负责人吴运声发表了重要观点。他指出，当前国内在人工智能领域呈现出一片蓬勃发展的繁荣景象，大量开源大模型技术成果如雨后春笋般不断涌现。这些成果不仅是科研人员智慧的结晶，更是推动行业生态建设的强大动力。开源的大模型技术成果打破了技术壁垒，使得更多的企业和开发者能够参与到人工智能的研究与应用中来，促进了技术的快速传播与创新，为构建更加完善、丰富的行业生态奠定了坚实基础。
就在同一天，腾讯正式对外发布了令人瞩目的混元3D世界模型1.0版本，并宣布将其开源。这一具有里程碑意义的模型，拥有强大的功能和广泛的应用前景。它能够支持构建可交互探索的三维虚拟环境，为用户提供身临其境的沉浸式体验。无论是在虚拟现实游戏、数字孪生城市、远程教育还是工业设计等领域，混元3D世界模型1.0版本都展现出了巨大的潜力。例如，在虚拟现实游戏中，玩家可以通过该模型创建出逼真且充满互动性的虚拟世界，极大地提升了游戏的趣味性和沉浸感；在数字孪生城市方面，它能够帮助城市规划者和管理者更加直观地了解城市的运行状况，为城市的优化和发展提供有力支持。
而腾讯的规划远不止于此。后续，腾讯计划逐步开源混元系列模型中的多款产品，以满足不同场景下的应用需求。其中，面向终端设备及边缘计算场景的端侧混合推理大语言模型备受关注。这类模型针对不同的应用场景和设备性能，涵盖了0.5B、1.8B、4B、7B等不同参数规模的小型化版本。这些小型化版本的模型具有体积小、功耗低、推理速度快等优点，非常适合在资源受限的终端设备和边缘计算环境中运行。比如在智能手机、智能穿戴设备等终端设备上，端侧混合推理大语言模型可以实现本地化的智能语音交互、文本处理等功能，不仅提高了设备的智能化水平，还有效保护了用户的隐私数据。
此外，腾讯还规划开放多模态理解模型与游戏视觉专用模型的技术源代码。多模态理解模型能够同时处理多种类型的数据，如图像、语音、文本等，实现更加全面、深入的信息理解和分析。这一模型的开源将为人工智能在多媒体信息处理、智能客服、智能家居等领域的应用提供强大的技术支持。而游戏视觉专用模型则是针对游戏行业的特殊需求而设计的，它能够为游戏开发者提供更加高效、精准的视觉处理能力，帮助开发出更加逼真、精彩的游戏画面和视觉效果，进一步提升游戏的品质和用户体验。