开云体育同期对SmolLM2进行高下文彭胀-kaiyun·开云(中国)官方网站入口

栏目分类

新闻动态

你的位置：kaiyun·开云(中国)官方网站入口 > 新闻动态 > 开云体育同期对SmolLM2进行高下文彭胀-kaiyun·开云(中国)官方网站入口

发布日期：2024-12-09 05:02 点击次数：136

开云体育同期对SmolLM2进行高下文彭胀-kaiyun·开云(中国)官方网站入口

【太平洋科技快讯】近日开云体育，东说念主工智能平台Hugging Face书记推出一款改换的AI视觉说话模子——SmolVLM，并将该模子开源。这意味着总计关系的模子查验点、数据集、侦查配方和用具王人将按照Apache 2.0许可证向公众开放，便于更多征询者和技能东说念主员使用和改造。

SmolVLM提供三个版块，包括SmolVLM-Base、SmolVLM-Synthetic和SmolVLM-Instruct，差别适用于卑鄙任务微调、基于合成数据的微销亡径直掌握于交互式掌握的提醒微调。该模子仅包含20亿参数，专为成就端推理而缠绵。这一参数范畴使其在保抓高效性能的同期，大幅缩短了对成就内存的需求。

架构缠绵上，SmolVLM的模仿了Idefics3的理念，接受SmolLM2 1.7B动作说话骨干。通过专有的像素混洗政策，模子将视觉信息的压缩率提高至9倍，显贵擢升了处理效果。

SmolVLM使用了Cauldron和Docmatix数据集进行侦查，同期对SmolLM2进行高下文彭胀，使其大要处理更长的文本序列和多张图像。这些优化次第有用缩短了内存占用，处分了大型模子在凡俗成就上运转缓缓以至崩溃的问题。

在内存使用方面，SmolVLM阐发出特等的性能。它将384x384像素的图像块编码为81个tokens，比拟同类模子Qwen2-VL，在筹议测试图片下，内存占用大幅减少。在多项基准测试中，SmolVLM展现出优异的性能。其预填充隐隐量比Qwen2-VL快3.3到4.5倍，生成隐隐量更是快7.5到16倍。

开放APP，阅读体验更佳

上一篇：开云体育(中国)官方网站皆上榜了我一买皆买很多包有太多这么的了对对-kaiyun·开云(中国)官方网站入口

下一篇：云开体育　　新安银行鼓励易主　　11月28日-kaiyun·开云(中国)官方网站入口