智东西7月25日消息,今日,前Meta员工沈俊潇(Shawn Shen)在海外社交媒体X上宣布,其携手Enmin Zhou共同创立的Memories.ai,正式推出其首款大型视觉记忆模型(Large Visual Memory Model)。
沈俊潇还宣布,Memories.ai已完成由Susa Ventures领投,Crane Venture Partners、三星Next、Fusion Fund等机构跟投的800万美元(约合人民币5730万元)种子轮融资。
用户现在即可享受首月免费体验,无需任何附加条件。
沈俊潇官宣推文(来源:X)
该技术旨在赋予多模态大语言模型(multi-modal LLMs)视觉记忆回溯能力。该模型实现了视觉记忆检索功能,能够解析用户意图,检索相关视觉记忆片段,整合关联的视觉记忆信息,并基于这些记忆和用户查询进行推理。
其创新点在于智能决策机制,能自主判断何时、如何及调取哪些视觉记忆。完成记忆信息整合后,模型能生成记忆引用,并以正确输出格式回答用户问题,这使得多模态大模型具备无限长视觉记忆上下文处理能力。
Memories.ai的两位联合创始人均是华人,沈俊潇在博客中透露自己14岁就远赴英国读高中。
1999年出生的沈俊潇,初中在苏州上学,14岁就获得奖学金远赴英国读高中。领英主页显示,其本硕博均在剑桥大学就读,2019年取得工程专业的文学学士学位(剑桥大学等部分高校保留传统BA授予制度),2020年取得都柏林圣三一学院的工程学硕士学位,2023年获得工程学哲学博士学位。
本科期间,沈俊潇曾回到上海摩根士丹利短期实习。博士期间,2022年他在Meta现实实验室担任研究科学家。2024年离职创业,联合创立了Memories.ai。
左:沈俊潇,右:Enmin Zhou(图源:Memories.ai)
Memories.ai联合创始人兼CTO Enmin Zhou于2020年从美国加州大学洛杉矶分校毕业,获得数学与计算科学学士学位。后在美国布朗大学就读数据科学专业,于2022年毕业。本科期间他也曾回到上海,在上海深察信息科技短暂实习。硕士毕业后在Meta担任机器学习工程师。2024年离职创业,与沈俊潇共同创立了Memories.ai。
在博客中,沈俊潇提到他们正是因为意识到解决视觉记忆问题刻不容缓,才离开Meta共同创立Memories.ai。
从性能上看,在视频零样本分类基准测试中,Memories.ai的分数较历史第一的模型PE-G有一定上涨。其中在HMD8数据库中分数上涨了7.6分;在K400数据库中分数上涨了6.6分。
在视频检索基准测试中,Memories.ai在所有数据集中的分数都超越了历史第一Perception Encoder,各项测试均夺得桂冠。其中在AVN数据集的文字转视频测试中,其分数较Perception Encoder提升了11分。
在视频问答基准测试中,Memories.ai在MVBench、NextQA以及Temp Compass数据集中全面超越OpenAI GPT 4o;在ActivityNetQA和Perception Text数据集中超越谷歌Gemini 2.5 Pro和OpenAI GPT4.1,取得新的性能记录。
本文由主机测评网于2026-04-17发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260438278.html