BOB半岛入口

DeepSeek重磅发布:Janus-Pro文生图模型不输OpenAI!

时间: 2025-02-21 13:18:04 |   作者: BOB半岛入口

  在全球军事、经济和科技快速的提升的今天,人工智能(AI)尤其是文生图技术的频繁创新,吸引了慢慢的变多的目光。2024年1月28日,伴随着农历新年的临近,中国人工智能初创公司DeepSeek在GitHub和HuggingFace社区隆重发布了其最新的多模态大模型——Janus-Pro,标志着其在文生图领域的重大突破。

  DeepSeek是一家致力于推进行业人工智能技术进步的初创企业,近年来在开源AI领域获得了较高关注。其最新推出的Janus-Pro模型,其实就是2024年11月发布的JanusFlow大模型的升级,分为7B(70亿参数)和1.5B(15亿参数)两个版本,并且均为开源。这一创新不仅让开发者在AI应用方面有了更多选择,还大幅度降低了入门门槛。

  DeepSeek团队介绍,Janus-Pro在多模态理解和文本到图像的生成方面实现了显著的进步。通过对7200万张高质量合成图像的使用,该模型在预训练阶段真实数据和合成数据的比例高达1:1,逐步提升了图像生成的质量与稳定性。在针对多模态理解进行的训练中,增加了大约9000万个样本,使Janus-Pro不但可以将文本转化为图片,也能对图像中的文字和知识做准确识别。

  DeepSeek发布的测试多个方面数据显示,Janus-Pro的70亿参数模型在多个基准测试中表现优异,甚至在某些情况下超越了OpenAI的多模态大模型DALL-E 3。这一突破不仅显示出DeepSeek技术团队的实力,更向全球AI市场传递了中国企业在AI领域的崭新力量。更令人振奋的是,Janus-Pro的模型开发并不依赖于庞大的计算资源,开发者能够在消费级电脑上实现本地运行,这是其他许多大型AI模型所不能够比拟的优势。

  在Janus-Pro发布的前夕,由DeepSeek设计的App迅速崛起,成为苹果应用商店下载量最大的免费App。与此同时,受此影响,投资的人对美国一些科技公司的反应也异常激烈,英伟达、博通等公司的股价均出现明显下跌,华尔街一致认为这是受到了DeepSeek技术突围的刺激。

  在接受采访时,达闼机器人创始人黄晓庆表示,团队已经基于DeepSeek的V3和R1大模型,将对话功能引入到他们的机器人研发中。他们正计划在DeepSeek的多模态大模型基础上进行二次训练,以提升机器人性能。黄晓庆指出,DeepSeek的开源、开放模型为第三方的二次训练奠定了基础,使得其在多模态及机器人控制领域的应用前景更加广阔。

  总之,DeepSeek的Janus-Pro不仅在技术上实现了超越,它的出现为整个AI行业注入了新的活力与竞争局面。面向未来,企业、开发者以及消费者均将从这一技术创新中得到实惠,同时也将推动整体人工智能技术与产业的发展。返回搜狐,查看更加多