苹果FastVLM模型开放试用,Mac用户畅享“闪电级”视频字幕

09-03 06:39

IT之家9月2日消息,科技媒体9to5Mac于昨日(9月1日)发布博文,报道称苹果公司在Hugging Face平台上,推出了FastVLM视觉语言模型的浏览器试用版。


IT之家注:FastVLM以其‘闪电般’的视频字幕生成速度闻名,只要用户拥有搭载Apple Silicon芯片的Mac设备,就能轻松体验这一前沿技术。


FastVLM模型的关键优势在于其出色的速度和效率。该模型借助苹果自研的开源机器学习框架MLX进行优化,是专门为Apple Silicon芯片设计的。和同类模型相比,FastVLM模型体积仅约为三分之一,但在视频字幕生成速度上却能提升85倍。


苹果此次发布的FastVLM - 0.5B轻量版,可在浏览器内直接加载运行。据该媒体实测,在16GB M2 Pro MacBook Pro上,首次加载模型需数分钟,不过启动后,便能精准描述画面中的人物、环境、表情及各种物体。


值得注意的是,该模型支持本地运行,所有数据均在设备端处理,无需上传至云端,保障了用户的数据隐私。


FastVLM的本地运行能力及其低延迟特性,使其在可穿戴设备和辅助技术领域具有巨大潜力。例如,在虚拟摄像头应用中,该工具能即时详细描述多场景内容,FastVLM未来有望成为这些设备的核心技术,为用户提供更智能、更便捷的交互体验。


参考


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com